150 likes | 339 Views
Förelasning 7. Chitvå-test Regression forts. Analys av enkla frekvenstabeller. Ofta analyserar man frekvenstabeller med hjälp av diagram. Är skillnaden statistiskt signifikant? Exempel : Antal personer som föredrar att handla i olika matbutiker (stickprov n =120, siffror påhittade).
E N D
Förelasning 7 Chitvå-test Regression forts.
Analys av enkla frekvenstabeller • Ofta analyserar man frekvenstabeller med hjälp av diagram. • Är skillnaden statistiskt signifikant? Exempel: Antal personer som föredrar att handla i olika matbutiker (stickprov n=120, siffror påhittade) Statistiska metoder 2012
Analys av enkla frekvenstabeller • Hypotesprövning H0: Det finns ingen signifikant skillnad mellan antalen i olika kategorierna: Ha: Det finns skillnad Marknad Antal Förväntad Willys 37 30 Lidl 28 30 Netto 12 30 ICA 43 30 För varje observerad frekvens O, kan man definiera förväntade frekvensen E under nollhypotesen som totalvärde S dividerad med antalet kategorier K Statistiska metoder 2012
Analys av enkla frekvenstabeller • Givet en envägsindelad frekvenstabell och de förväntade frekvenser är större än 5, använd chitvå-statistiken med K-1 frihetsgrader vid hypotesprövningen: • Rita fördelningen • Kritiska området=alltid högra svansen • Om vi är i det kritiska området Förkastar H0 Statistiska metoder 2012
Analys av enkla frekvenstabeller • MINITAB: Använd StatTablesChi-Square Goodness-of-fit-test Test Contribution Category Observed Proportion Expected to Chi-Sq Willys 37 0,25 30 1,6333 Lidl 28 0,25 30 0,1333 Netto 12 0,25 30 10,8000 ICA 43 0,25 30 5,6333 N DF Chi-Sq P-Value 120 3 18,2 0,000 Statistiska metoder 2012
Analys av korstabeller Blodgrupp Sverige USA A 43 66 B 38 72 AB 11 23 O 8 19 • Hypotesprövning H0: Fördelning i radkategorierna beror på kolumnkategorier Ha: Fördelningen är samma för alla kolumnkategorier Exempel: Antal personer med en viss blodgrupp (USA och Sverige) Skillnad mellan två länder? Statistiska metoder 2012
Analys av korstabeller • Skatta marginala frekvenser och totalsumman • För varje observerad frekvens O, definiera en förväntad frekvens E som produkten av motsvarande marginala frekvenser dividerade med totalsumman. Statistiska metoder 2012
Analys av korstabeller • Givet en tvåvägsindelad frekvenstabell och de förväntade frekvenser är alla större än 5 förutom kanske 20% och ingen förväntad frekvens är mindre än 1, använd chitvå-statistiken med (R-1)(K-1) frihetsgrader vid hypotesprövningen: • Om vi är i det kritiska området Förkastar H0 Statistiska metoder 2012
Analys av korstabeller Sverige USA Total 1 43 66 109 38,93 70,07 0,426 0,237 2 38 72 110 39,29 70,71 0,042 0,023 3 11 23 34 12,14 21,86 0,108 0,060 4 8 19 27 9,64 17,36 0,280 0,155 Total 100 180 280 Chi-Sq = 1,331; DF = 3; P-Value = 0,722 • MINITAB:Stat Tables Chi-Square test Statistiska metoder 2012
Regression • Vi antar att följande modell gäller: • εi – slumpfel, normalfördelad med okända variansen σ2 • Det är alltså ett statistiskt samband, fel: • Felaktiga mätningar • En eller flera viktiga variabler saknas i modellen Statistiska metoder 2012
Regression Exempel: Ålder och vikt av barn under 3 år. Två olika stickprov olika bilder (innebär att εi är olika) • Anpassade regressionsekvationer är mycket lika! • Hur mycket ska koefficienterna variera från ett stickprov till ett annat? Konfidensintervall behövs! Statistiska metoder 2012
Regression-utskriften Regression Analysis: Vikt2 versus Ålder The regression equation is Vikt2 = 4,86 + 3,62 Ålder PredictorCoef SE Coef T P Constant 4,8586 0,1766 27,51 0,000 Ålder 3,6226 0,1047 34,58 0,000 S = 0,894781 R-Sq = 92,4% R-Sq(adj) = 92,3% Analysis of Variance Source DF SS MS F P Regression 1 957,61 957,61 1196,06 0,000 Residual Error 98 78,46 0,80 Total 99 1036,07 Statistiska metoder 2012
Regression Hypotesprövning • H0: b=0 • H1 b≠0 • Använd T-statistik med n-2 frihetsgrader vid hypotesprövning • Konfidensintervall: Statistiska metoder 2012
Prediktion • Kan vi prediktera utfall för de nya observationer? • Ex.1 Vilken är genomsnittlig vikt av flickor som är 1 år gamla? • Ex 2 I vilket intervall ligger genomsnittlig vikt av flickor som är ett år gamla? Konfidensinterval • Ex3 I vilket interval vikt för en valfri flicka som är 1 år gammal Prediktionsinterval Predicted Values for New Observations New Obs Fit SE Fit 99% CI 99% PI 1 8,4813 0,1013 (8,2151; 8,7475) (6,1157; 10,8468) Values of Predictors for New Observations New Obs Ålder 1 1,00 Statistiska metoder 2012
Läsa hemma • Kapitel 8 • Kompendiet Statistiska metoder 2012