90 likes | 226 Views
Test of Independence ( chi -i-anden) Videre med projekt 3 Teori Regning af opgave. Dagens program. Test of Independence. Afhænger brugervenligheden, BV, af antal billeder på en hjemmeside?. Tabelopstilling Responsvariablen (den afhængige) sættes i kolonnerne.
E N D
Test of Independence (chi-i-anden) Videre med projekt 3 Teori Regning af opgave Dagens program
Test of Independence Afhænger brugervenligheden, BV, af antal billeder på en hjemmeside? • Tabelopstilling • Responsvariablen (den afhængige) sættes i kolonnerne. • Den forklarende variabel (den uafhængige) sættes i rækkerne. • Beregn betingede procentfordelinger. • Vis antallet som procenterne er beregnet på. 2
Test of Independence Afhænger brugervenligheden, BV, af antal billeder på en hjemmeside? Definition To variable er uafhængige, hvis de betingede fordelinger er ens (statistisk set) i populationen. To variable er afhængige, hvis de betingede fordelinger afviger betydeligt fra hinanden (statistisk set) i populationen. Tabellen viser resultater fra en stikprøve og de afviger mere eller mindre fra populationens. 3
Test of Independence • Forudsætninger • Simpel tilfældig udvælgelse. • Mindst fem forventede observationer i cellerne • Hypoteser • H0: De to variable er uafhængige • Ha: De to variable er afhængige • Beregning af teststørrelse • Vi kender det observerede antal observationer i hver celle • Vi beregner det forventede antal observationer i hver celle for det tilfælde, at de to variable er uafhængige. 4
Det forventede antal observationer • Sandsynligheder • P(Mange billeder) = 131/180, P(Få billeder) = 49/180 • P(Lav BV) = 89/180, P(Middel) = 73/180, P(Høj BV) = 18/180 • Forventede antal observationer • P(Mange) x P(Lav BV) x 180 = (131/180) x (89/180) x 180 =(131 x 89) / 180 = 64,77 • Hvis de to variable er uafhængige, forventer vi at finde 64,77 ≈ 65 observationer i celle 1 (hvor vi faktisk observerer 60). • Generel skivemåde: 5
3. Beregning af Chi-i-anden teststørrelsen Chi-i-anden beregnes for hver celle. Chi-i-anden teststørrelsen er summen heraf. Den sammenfatter, hvor langt de faktiske antal ligger fra de forventede antal (nul-hypotesens ”forventning”). Test of Independence • χ2 for den første celle: • (60 – 64,8) = -4,8 • (-4,8)2 = 23,04 • 23,04 / 64,8 = 0,35 • Sum (0,35 +...+ 0,74) = 2,87
4. Omregning af teststørrelsen til en P-værdi kræver at vi kender antallet af frihedsgrader, df, (degrees of freedom), i tabellen. Antallet beregnes efter formlen: df = (r-1) x (k-1)=(2-1) x (3-1) = 2. P findes ved opslag i Excel. På dansk hedder funktionen CHI2.FORD.RT. Denne returnerer sandsynligheden i den højre hale (RT=right tail). Dvs. P(X2>obs.værdi), ssh. for den observerede værdi af teststørrelse eller større. Test of Independence 7
Konklusion: Med P værdi på 24% opretholdes H0. Det vil sige, at brugervenligheden ikke kan formodes at afhænge af billed-brugen. Forskellene i fordelingerne kan skyldes tilfældigheder som følge af stikprøven. Store værdier af χ2 giver små P-værdier. Små P-værdier er beviser mod nul-hypotesen H0. Med en χ2 på 2,87 og 2 frihedsgrader bliver P-værdien 24%. Vi afviser H0, når P er mindre end 5%. I dette tilfælde opretholder vi derfor H0. Hvad sker der med chi-i-anden teststørrelsen, hvis to kolonner byttes om? Hvad forskellen på Goodness of Fit test og Test of Independence? Test of Independence 8
Opgave i Test of Independence Har personer, der angrer, større risiko for at få hjertesygdomme end personer, der ikke angrer? En undersøgelse har belyst risikoen for en bestemt type hjertesygdom. • Opgaver • Beregn de betingede fordelinger og beskriv i ord, hvad du ser. • Test (slavisk, dvs. i de fem trin) om der er sammenhæng (asso-ciation) mellem responsvariablen og den forklarende variabel. • Skriv en konklusion • Kilde: http://www.sjsu.edu/faculty/gerstman/StatPrimer/crosstabs-exercises.htm (opgave 10.11, løsning i bunden af siden) 9