1 / 18

Statistik Lektion 8

Statistik Lektion 8. Test for ens varians. Fra tidligere. Hvis populationen er normalfordelt med varians s 2 , så gælder hvor n er stikprøve størrelsen og S 2 er stikprøvevariansen. c 2 -fordeling med n -1 frihedsgrader. Test af Variansen.

phyre
Download Presentation

Statistik Lektion 8

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. StatistikLektion 8 Test for ens varians

  2. Fra tidligere • Hvis populationen er normalfordelt med varians s2, så gælderhvor n er stikprøve størrelsen og S2 er stikprøvevariansen. • c2-fordeling med n-1 frihedsgrader

  3. Test af Variansen • Antagelse: Populationen er normalfordelt med varians s2. • Hypoteser: • Teststørrelse: • Under H0 følger c2en c2-fordeling med n-1 frihedsgrader • Kritiske værdier: • Nu: Teste for ens varians i to uafhængige stikprøver.

  4. F-fordelingen • F-fordelingener fordelingen af brøken af to c2-fordelte stokastiske variable, der er uafhængige og hver er divideret med antallet af dens frihedsgrader. • Antag c21og c22 er uafhængige og c2-fordelte med hhv. k1 ogk2 frihedsgrader. • Definer • Da følger F en F-fordelingen med k1 og k2 frihedsgrader.

  5. F-fordeligen på hovedet • Antag c21 og c22 er uafhængige og c2-fordelte med hhv. k1 og k2 frihedsgrader. • Definer • Så følger Fen F-fordeling med k1og k2 frihedsgrader. • Vi har • Dvs. F-1 følger en F-fordelingen med k2 og k1 frihedsgrader.

  6. F-tabellen Critical Points of the F Distribution Cutting Off a Right-Tail Area of 0.05 k1 1 2 3 4 5 6 7 8 9 k2 1 161.4 199.5 215.7 224.6 230.2 234.0 236.8 238.9 240.5 2 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38 3 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81 4 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77 6 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 7 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 8 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 10 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 11 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90 12 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 13 4.67 3.81 3.41 3.18 3.03 2.92 2.83 2.77 2.71 14 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65 15 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59 F-fordelingen med 7 og 12 frihedsgrader 0 . 7 0 . 6 0.05 0 . 5 ) 0 . 4 F ( f 0 . 3 0.05 0 . 2 0 . 1 F 0 . 0 0 1 2 3 4 5 3.01 1/F12,7,0.05 = 0.278 F7,12,0.05 = 3.01 Når man skal finde det venstre kritiske punkt, kan man bruge følgende sammenhæng:

  7. Kritiske punkter i F fordelingen • F(6, 9), = 0.10 • Tabelopslag i R> qf(0.95,df1=6,df2=9)[1] 3.373754> qf(0.05,df1=6,df2=9)[1] 0.243961 Det højresidet kritiske punkt: F6,9,0.05= 3.37 Det tilsvarende venstresidet punkt: F-fordeling med 6 og 9 frihedsgrader 0 . 7 0 . 6 0.90 0 . 5 ) 0 . 4 F 0.05 ( f 0 . 3 0.05 0 . 2 0 . 1 0 . 0 F 0 1 2 3 4 5 F6,9,0.95 = 1/F9,6,0.05 = 0.2439 F6,9,0.05 = 3.37

  8. Stikprøve-variansen i to grupper • Antag vi har to normalfordelte populationer. • Vi har n1 observationer fra population 1. • Lad s21 betegne stikprøve-variansen for pop. 1. • Lad s21 betegne populations-variansen for pop.1 • Vi har fra tidligere: • Tilsvarende for stikprøven fra population 2. c2-fordelt med n1-1 frihedsgrader

  9. Forholdet mellem to stikprøve-varianser • Hvis de to stikprøver er uafhængige har vi: • Dvs. • Det kan omskrives til og

  10. Test for ens varians Teststørrelsen til test for ens populations varians i to normalfordelte populationer er givet ved: • I: Tosidet test: • 1 = 2 • H0: 1 = 2 • H1:2 • II:Ensidet test • 12 • H0: 1  2 • H1: 1  2

  11. Eksempel Kritiske værdier: Hypoteser: Signifikansniveau: a = 0.10 Population 1 Population 2 Teststørrelse: H0kan ikke afvises på signifikans-niveau 10%, da teststørrelsen ikke er større end 3.28 eller mindre end 0.35.

  12. Eksempel i R • Start med at definere alle variable > n1 = 13; s1 = 0.12; n2 = 9; s2 = 0.11 • Hefter kan vi udregne teststørrelsen > f = s1^2/s2^2 > f [1] 1.190083 • De kritiske værdier finder vi vha. > qf(c(0.05,0.95),n1-1,n2-1) [1] 0.3510539 3.2839390 • Da 1.19 ligger mellem de to kritiske værdier kan vi ikke afvise H0.

  13. Test vha. P-værdi = • Antag:F ~ Fn1-1,n2-1 • Hvis F>1, så er P-værdien 2·P(F > F) • I R: > 2*pf(f, n1-1, n2-1, lower.tail=F) [1] 0.8277536 • Hvis F<1, så er P-værdien 2·P(F < F) > 2*pf(f, n1-1, n2-1, lower.tail=T) P-værdi = 2· F P-værdi = 2· F

  14. Sammenligning af to varianser i R • Er der en forskel variansen for mænd og kvinders vægt? • Altid plot før test!> sundby = read.table("Sundby95.dat", header=T)> library(trellis) # udvidelse med ekstra plot-funktioner> histogram(~ vaegt | koen, data=sundby)

  15. Lidt mellemregninger • Først definerer vi variable for hhv. mænd og kvinder vægt: > vaegt.maend = sundby$vaegt[sundby$koen=="Mand"] > vaegt.kvinder = sundby$vaegt[sundby$koen=="Kvinde"] • Derefter finder vi de to varianser vi skal bruge > var(vaegt.maend,na.rm=T); var(vaegt.kvinder,na.rm=T) [1] 157.1127 [1] 127.1143 • Dvs. variansen for hhv. mænd og kvinder er

  16. Hypotesetest • Hypoteser • H0 : vsH1: • Teststørrelse • P-værdi> 2*pf(1.236, 1205, 1430, lower.tail=F)[1] 0.00012295981 • Da P-værdien << 5% kan vi (meget klart) afvise nulhypotesen om ens varians. = P-værdi = 2· 1.24

  17. Hypotesetest i R • Hypoteser • H0 : vsH1: • Test af ens varians> var.test(vaegt.maend, vaegt.kvinder)F test to comparetwovariancesdata: vaegt.maend and vaegt.kvinderF = 1.236, numdf = 1205, denomdf = 1430, p-value = 0.000123 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval:1.109260 1.377912 sample estimates:ratio of variances 1.235995

  18. Vigtigste fordelinger i kurset • Binomial B(n,p) • Normal N(m,s2) • c2 c2(n) • tt(n) • F F(k1,k2)

More Related