100 likes | 248 Views
Påmindelser Pivottabeller og pivotgrafer Omkodning af data (sortering, søg-erstat) Bevar de originale data og lav kontroller Hvem er målgruppen (brugerne)? Test of Independence ( chi -i-anden) Teori Regning af opgave. Program. Sandsynlighed for krone ved kast med 12 mønter.
E N D
Påmindelser Pivottabeller og pivotgrafer Omkodning af data (sortering, søg-erstat) Bevar de originale data og lav kontroller Hvem er målgruppen (brugerne)? Test of Independence (chi-i-anden) Teori Regning af opgave Program
Test of Independence Afhænger ”graden af fan” af ”medieforbruget”? Mao. påvirker ”medieforbruget” ”graden af fan”? • Tabelopstilling • Responsvariablen (den afhængige) sættes i kolonnerne. • Den forklarende variabel (den uafhængige) sættes i rækkerne. • Beregn betingede procentfordelinger. • Vis antallet som procenterne er beregnet på. 3
Test of Independence Afhænger fangraden af medieforbruget? Definition To variable er uafhængige, hvis de betingede fordelinger er ens (statistisk set) i populationen. To variable er afhængige, hvis de betingede fordelinger afviger betydeligt fra hinanden (statistisk set) i populationen. Tabellen viser resultater fra en stikprøve og de afviger mere eller mindre fra populationens. 4
Test of Independence • Forudsætninger • Simpel tilfældig udvælgelse. • Mindst fem forventede observationer i cellerne. • Hypoteser • H0: De to variable er uafhængige • Ha: De to variable er afhængige • Beregning af teststørrelse • Vi kender det observerede antal observationer i hver celle • Vi beregner det forventede antal observationer i hver celle for det tilfælde, at de to variable er uafhængige. 5
Det forventede antal observationer • Sandsynligheder • P(Mange medier) = 131/180, P(Få medier) = 49/180 • P(Lille fan) = 89/180, P(Middel) = 73/180, P(Stor fan) = 18/180 • Forventede antal observationer • P(Mange) x P(Lille) x 180 = (131/180) x (89/180) x 180 =(131 x 89) / 180 = 64,77 • Hvis de to variable er uafhængige, forventer vi at finde 64,77 ≈ 65 observationer i celle 1 (hvor vi faktisk observerer 60). • Generel skivemåde: 6
3. Beregning af Chi-i-anden teststørrelsen Chi-i-anden beregnes for hver celle. Chi-i-anden teststørrelsen er summen heraf. Den sammenfatter, hvor langt de faktiske antal ligger fra de forventede antal (nul-hypotesens ”forventning”). Test of Independence • χ2 for den første celle: • (60 – 64,8) = -4,8 • (-4,8)2 = 23,04 • 23,04 / 64,8 = 0,35 • Sum (0,35 +...+ 0,74) = 2,87
4. Omregning af teststørrelsen til en P-værdi kræver at vi kender antallet af frihedsgrader, df, (degrees of freedom), i tabellen. Antallet beregnes efter formlen: df = (rækker-1) x (kolonner-1)=(2-1) x (3-1) = 2. P findes ved opslag i Excel. På dansk hedder funktionen CHI2.FORD.RT. Denne returnerer sandsynligheden i den højre hale (RT=right tail). Dvs. P(X2>obs.værdi), ssh. for den observerede værdi af teststørrelse eller større. Test of Independence 8
Konklusion: Med P værdi på 24% opretholdes H0. Det vil sige, at fangraden ikke kan formodes at afhænge af medieforbruget. Forskellene i fordelingerne kan skyldes tilfældigheder som følge af stikprøven. Store værdier af χ2 giver små P-værdier. Små P-værdier er beviser mod nul-hypotesen H0. Med en χ2 på 2,87 og 2 frihedsgrader bliver P-værdien 24%. Vi afviser H0, når P er mindre end 5%. I dette tilfælde opretholder vi derfor H0. Test of Independence 9
Opgave i Test of Independence Afhænger fan-graden af medietypen? Eller med andre ord, påvirker medietype graden af fan? • Opgaver • Beregn de betingede fordelinger og beskriv i ord, hvad du ser. • Undersøg om der er en afhængighed. • Skriv en konklusion • Kilde: http://www.sjsu.edu/faculty/gerstman/StatPrimer/crosstabs-exercises.htm (opgave 10.11, løsning i bunden af siden) 10