Statistik Lektion 8

StatistikLektion 8 Test for ens varians

Fra tidligere • Hvis populationen er normalfordelt med varians s2, så gælderhvor n er stikprøve størrelsen og S2 er stikprøvevariansen. • c2-fordeling med n-1 frihedsgrader

Test af Variansen • Antagelse: Populationen er normalfordelt med varians s2. • Hypoteser: • Teststørrelse: • Under H0 følger c2en c2-fordeling med n-1 frihedsgrader • Kritiske værdier: • Nu: Teste for ens varians i to uafhængige stikprøver.

F-fordelingen • F-fordelingener fordelingen af brøken af to c2-fordelte stokastiske variable, der er uafhængige og hver er divideret med antallet af dens frihedsgrader. • Antag c21og c22 er uafhængige og c2-fordelte med hhv. k1 ogk2 frihedsgrader. • Definer • Da følger F en F-fordelingen med k1 og k2 frihedsgrader.

F-fordeligen på hovedet • Antag c21 og c22 er uafhængige og c2-fordelte med hhv. k1 og k2 frihedsgrader. • Definer • Så følger Fen F-fordeling med k1og k2 frihedsgrader. • Vi har • Dvs. F-1 følger en F-fordelingen med k2 og k1 frihedsgrader.

F-tabellen Critical Points of the F Distribution Cutting Off a Right-Tail Area of 0.05 k1 1 2 3 4 5 6 7 8 9 k2 1 161.4 199.5 215.7 224.6 230.2 234.0 236.8 238.9 240.5 2 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38 3 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81 4 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77 6 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 7 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 8 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 10 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 11 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90 12 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 13 4.67 3.81 3.41 3.18 3.03 2.92 2.83 2.77 2.71 14 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65 15 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59 F-fordelingen med 7 og 12 frihedsgrader 0 . 7 0 . 6 0.05 0 . 5 ) 0 . 4 F ( f 0 . 3 0.05 0 . 2 0 . 1 F 0 . 0 0 1 2 3 4 5 3.01 1/F12,7,0.05 = 0.278 F7,12,0.05 = 3.01 Når man skal finde det venstre kritiske punkt, kan man bruge følgende sammenhæng:

Kritiske punkter i F fordelingen • F(6, 9), = 0.10 • Tabelopslag i R> qf(0.95,df1=6,df2=9)[1] 3.373754> qf(0.05,df1=6,df2=9)[1] 0.243961 Det højresidet kritiske punkt: F6,9,0.05= 3.37 Det tilsvarende venstresidet punkt: F-fordeling med 6 og 9 frihedsgrader 0 . 7 0 . 6 0.90 0 . 5 ) 0 . 4 F 0.05 ( f 0 . 3 0.05 0 . 2 0 . 1 0 . 0 F 0 1 2 3 4 5 F6,9,0.95 = 1/F9,6,0.05 = 0.2439 F6,9,0.05 = 3.37

Stikprøve-variansen i to grupper • Antag vi har to normalfordelte populationer. • Vi har n1 observationer fra population 1. • Lad s21 betegne stikprøve-variansen for pop. 1. • Lad s21 betegne populations-variansen for pop.1 • Vi har fra tidligere: • Tilsvarende for stikprøven fra population 2. c2-fordelt med n1-1 frihedsgrader

Forholdet mellem to stikprøve-varianser • Hvis de to stikprøver er uafhængige har vi: • Dvs. • Det kan omskrives til og

Test for ens varians Teststørrelsen til test for ens populations varians i to normalfordelte populationer er givet ved: • I: Tosidet test: • 1 = 2 • H0: 1 = 2 • H1:2 • II:Ensidet test • 12 • H0: 1  2 • H1: 1  2

Eksempel Kritiske værdier: Hypoteser: Signifikansniveau: a = 0.10 Population 1 Population 2 Teststørrelse: H0kan ikke afvises på signifikans-niveau 10%, da teststørrelsen ikke er større end 3.28 eller mindre end 0.35.

Eksempel i R • Start med at definere alle variable > n1 = 13; s1 = 0.12; n2 = 9; s2 = 0.11 • Hefter kan vi udregne teststørrelsen > f = s1^2/s2^2 > f [1] 1.190083 • De kritiske værdier finder vi vha. > qf(c(0.05,0.95),n1-1,n2-1) [1] 0.3510539 3.2839390 • Da 1.19 ligger mellem de to kritiske værdier kan vi ikke afvise H0.

Test vha. P-værdi = • Antag:F ~ Fn1-1,n2-1 • Hvis F>1, så er P-værdien 2·P(F > F) • I R: > 2*pf(f, n1-1, n2-1, lower.tail=F) [1] 0.8277536 • Hvis F<1, så er P-værdien 2·P(F < F) > 2*pf(f, n1-1, n2-1, lower.tail=T) P-værdi = 2· F P-værdi = 2· F

Sammenligning af to varianser i R • Er der en forskel variansen for mænd og kvinders vægt? • Altid plot før test!> sundby = read.table("Sundby95.dat", header=T)> library(trellis) # udvidelse med ekstra plot-funktioner> histogram(~ vaegt | koen, data=sundby)

Lidt mellemregninger • Først definerer vi variable for hhv. mænd og kvinder vægt: > vaegt.maend = sundby$vaegt[sundby$koen=="Mand"] > vaegt.kvinder = sundby$vaegt[sundby$koen=="Kvinde"] • Derefter finder vi de to varianser vi skal bruge > var(vaegt.maend,na.rm=T); var(vaegt.kvinder,na.rm=T) [1] 157.1127 [1] 127.1143 • Dvs. variansen for hhv. mænd og kvinder er

Hypotesetest • Hypoteser • H0 : vsH1: • Teststørrelse • P-værdi> 2*pf(1.236, 1205, 1430, lower.tail=F)[1] 0.00012295981 • Da P-værdien << 5% kan vi (meget klart) afvise nulhypotesen om ens varians. = P-værdi = 2· 1.24

Hypotesetest i R • Hypoteser • H0 : vsH1: • Test af ens varians> var.test(vaegt.maend, vaegt.kvinder)F test to comparetwovariancesdata: vaegt.maend and vaegt.kvinderF = 1.236, numdf = 1205, denomdf = 1430, p-value = 0.000123 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval:1.109260 1.377912 sample estimates:ratio of variances 1.235995

Vigtigste fordelinger i kurset • Binomial B(n,p) • Normal N(m,s2) • c2 c2(n) • tt(n) • F F(k1,k2)

Statistik Lektion 8