1 / 24

Hoofdstuk 7

Hoofdstuk 7. I nferentie voor verdelingen. 7 .1. Inferentie voor de verwachting van een populatie. Steekproefgemiddelde x om µ te schatten Steekproefstandaardafwijking s om  te schatten. A. De t-procedures voor een enkelvoudige steekproef. EAS met verwachting  en standaardafwijking 

abiba
Download Presentation

Hoofdstuk 7

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Hoofdstuk 7 Inferentie voor verdelingen

  2. 7.1. Inferentie voor de verwachting van een populatie • Steekproefgemiddelde x om µ te schatten • Steekproefstandaardafwijking s om  te schatten

  3. A. De t-procedures voor een enkelvoudige steekproef • EAS met verwachting  en standaardafwijking  • Het steekproefgemiddelde x heeft een normale verdeling met verwachting  en standaardafwijking  /  n • Indien  niet gekend is, schatten we de standaardafwijking door s /  n = de STANDAARDFOUT van het steekproefgemiddelde x of SEx

  4. Standaardnormale verdeling N(0,1) z = x - µ  /  n • De t-verdeling (met n-1 vrijheidsgraden) t = x - µ s /  n

  5. Voor elke n is er een andere t-verdeling • Een specifieke t-verdeling wordt gespecifieerd door het aantal vrijheidsgraden • Aantal vrijheidsgraden op basis van s (steeds xi - x, met som 0, dus n-1 vrijheidsgraden) • t(k) = t-verdeling met k vrijheidsgraden

  6. t-verdelingen lijken op de normaalverdeling • Symmetrisch rond 0 • Klokvormig • Iets grotere spreiding door s • Bij toenemend aantal vrijheidsgraden nadert t(k) tot N(0,1) • Toetsen op significantie : • Tabel E : p-waarden voor betrouwbaarheids-niveaus en vrijheidsgraden

  7. De t-procedure voor een EAS : • Betrouwbaarheidsinterval x  t* s .  n t* is de bovenste (1-C)/2 kritieke waarde

  8. t-toets voor een populatieverwachting • H0 : µ = µ0 • Ha: µ < µ0 eenzijdig : P (T t) • Ha: µ > µ0 eenzijdig : P (T t) • Ha: µ  µ0 tweezijdig : 2 P (T |t| ) • omzetten in t-waarde t = (x- µ0 ) s /  n en kijken in tabel E

  9. Voorbeeld : snelheid van het licht vroeger 27.75 met s=5.083 en 64 metingen MAAR nu 33.02 • H0 : µ = 33.02 • Ha: µ 33.02 • t = 27.75 - 33.02 = - 8.29 5.083 /  64 in tabel E : kleiner dan 0.005 en 2 keer = Sign op 1% niveau

  10. B. De t-procedures voor gekoppelde paren • Bij gegevensverwerving heeft vergelijken van gegevens vaker de voorkeur boven data van een enkelvoudige steekproef • Dus : 2 steekproeven • Of : vergelijking van paren binnen 1 steekproef • = gekoppelde paren vergelijken

  11. Meest gebruikte gekoppelde paren zijn PRE-POST onderzoeken • Bij gekoppelde paren kan de procedure van 1 steekproef worden gebruikt door eerst verschillen te berekenen • H0 : µ = 0 (geen verschil pre – post) • Ha: µ > 0 (een positieve evolutie) • En verder zelfde procedure als hiervoor

  12. Voorbeeld : 20 pp doen mee aan een training, fitheid meten voor en na • Fitheidsscores Post min Pre berekenen • Gemiddelde is bv. = 2.5 en s=2.893 • H0 : µ = 0 (geen verschil pre – post) • Ha: µ > 0 (een positieve evolutie) • t is 2.5 – 0 gedeeld door (2.893 /  20) = 3.86 • In tabel E : significant

  13. Is de t-procedure robuust ? redelijk • Robuust = als de kansberekeningen in de toets ongevoelig zijn voor afwijkingen van de gemaakte veronderstellingen • Bij n < 15, enkel t bij normale verdeling, en als er geen uitschieters zijn • Bij n > 15, geen t bij uitschieters of scheefheid (normale verdeling niet te strikt) • Bij n > 40, geen probleem

  14. 7.2. Vergelijking van twee verwachting • Zeer vaak toegepaste procedure in statistiek  2 proefgroepen waartussen gemiddelden worden vergeleken • Steeds : - reacties in 2 steekproeven vgl - elke groep is steekproef uit die populatie - reactie in beide groepen zijn onafhankelijk

  15. 2 grote groepen onderzoeken : • Experiment met experimentele en controlegroep • Vergelijking tussen twee EAS uit populatie • Grafisch : - rug aan rug stamdiagram - zij aan zij doosdiagram

  16. Voor de beschrijving van de populatie populatie 1, variabele 1 (x1), µ1 en 1 populatie 2, variabele 2 (x2), µ2 en 2 • Voor de beschrijving van de steekproef populatie 1, n1, x1 , s1 populatie 2, n2, x2 , s2

  17. A. Twee-steekproevengrootheid z (x1 - x2) – (µ1 - µ2) • z = 12+ 22 n1 n2 dit wordt echter zelden gebruikt omdat  zelden gekend is, direct overgaan van z-procedure naar t-procedure

  18. B. t-procedures voor onafhankelijke steekproeven (x1 - x2) • t = s12+ s22 n1 n2 • Betrouwbaarheidsinterval : (x1 - x2) ± t* s12+ s22 n1 n2

  19. We hebben hier 2 standaardafwijkingen vervangen door standaardfouten wat geen echt t-verdeling meer geeft, maar toch t gebruiken • Twee steekproeven n1 en n2 en berekening van de vrijheidsgraden is moeilijk =computer doet het OF =kijken Tabel E bij kleinste aantal vrijheidsgraden van de 2 steekproeven

  20. Voorbeeld : is er een verschil tussen mannen en vrouwen ? Ha: µ1µ2 • Mannen : n=133, x = 25.34, s = 5.05 • Vrouwen : n=162, x =24.94, s = 5.44 • t = 25.34 – 24.94 5.052 + 5.442 133 162 = 0.654 en in Tabel E bij 132 vrijheidsgraden t=0.654, df=132, p>0.50

  21. T-procedures voor 2 onafhankelijke steekproeven zijn robuurster dan 1 • Bij gelijke omvang en gelijke vorm, is t nauwkeurig zelfs bij 5 pp. • Zelfde richtlijnen kunnen gebruikt worden als bij 1 steekproef maar door n1 + n2 meer robuust tegen niet-normaliteit

  22. C. De samengestelde t-procedures voor 2 onafhankelijke steekproeven • Indien de 2 populaties DEZELFDE standaardafwijking hebben, dan moeten we er maar 1 substitueren en hebben we een exacte t-verdeling • Op basis van de standaardafwijkingen van de steekproeven (s1 en s2) wordt  van de populatie geschat = pooled estimator of variance (zie computeroutput) • Maakt formule iets eenvoudiger maar kan ook met formule van hiervoor

  23. 7.3. Inferentie voor populatiespreiding • F-toets wordt gebruikt om te kijken of twee spreidingen van normale populaties significant van elkaar verschillen • F-toets is zeer gevoelig voor niet-normaliteit • F-toets wordt vaak gebruikt VOOR t-toets om na te gaan of varianties als gelijk of verschillend moeten beschouwd worden

  24. Bij significante F-toets : separate variances gebruiken bij t • Bij niet significante F-toets : pooled variances gebruiken • Niet zelf F kunnen berekenen : computer = Levene’s test !! • F-toets is zeer weinig robuust, is zeer gevoelig p<0.05 of beter p<0.01 als significant beschouwen

More Related