240 likes | 507 Views
Hoofdstuk 7. I nferentie voor verdelingen. 7 .1. Inferentie voor de verwachting van een populatie. Steekproefgemiddelde x om µ te schatten Steekproefstandaardafwijking s om te schatten. A. De t-procedures voor een enkelvoudige steekproef. EAS met verwachting en standaardafwijking
E N D
Hoofdstuk 7 Inferentie voor verdelingen
7.1. Inferentie voor de verwachting van een populatie • Steekproefgemiddelde x om µ te schatten • Steekproefstandaardafwijking s om te schatten
A. De t-procedures voor een enkelvoudige steekproef • EAS met verwachting en standaardafwijking • Het steekproefgemiddelde x heeft een normale verdeling met verwachting en standaardafwijking / n • Indien niet gekend is, schatten we de standaardafwijking door s / n = de STANDAARDFOUT van het steekproefgemiddelde x of SEx
Standaardnormale verdeling N(0,1) z = x - µ / n • De t-verdeling (met n-1 vrijheidsgraden) t = x - µ s / n
Voor elke n is er een andere t-verdeling • Een specifieke t-verdeling wordt gespecifieerd door het aantal vrijheidsgraden • Aantal vrijheidsgraden op basis van s (steeds xi - x, met som 0, dus n-1 vrijheidsgraden) • t(k) = t-verdeling met k vrijheidsgraden
t-verdelingen lijken op de normaalverdeling • Symmetrisch rond 0 • Klokvormig • Iets grotere spreiding door s • Bij toenemend aantal vrijheidsgraden nadert t(k) tot N(0,1) • Toetsen op significantie : • Tabel E : p-waarden voor betrouwbaarheids-niveaus en vrijheidsgraden
De t-procedure voor een EAS : • Betrouwbaarheidsinterval x t* s . n t* is de bovenste (1-C)/2 kritieke waarde
t-toets voor een populatieverwachting • H0 : µ = µ0 • Ha: µ < µ0 eenzijdig : P (T t) • Ha: µ > µ0 eenzijdig : P (T t) • Ha: µ µ0 tweezijdig : 2 P (T |t| ) • omzetten in t-waarde t = (x- µ0 ) s / n en kijken in tabel E
Voorbeeld : snelheid van het licht vroeger 27.75 met s=5.083 en 64 metingen MAAR nu 33.02 • H0 : µ = 33.02 • Ha: µ 33.02 • t = 27.75 - 33.02 = - 8.29 5.083 / 64 in tabel E : kleiner dan 0.005 en 2 keer = Sign op 1% niveau
B. De t-procedures voor gekoppelde paren • Bij gegevensverwerving heeft vergelijken van gegevens vaker de voorkeur boven data van een enkelvoudige steekproef • Dus : 2 steekproeven • Of : vergelijking van paren binnen 1 steekproef • = gekoppelde paren vergelijken
Meest gebruikte gekoppelde paren zijn PRE-POST onderzoeken • Bij gekoppelde paren kan de procedure van 1 steekproef worden gebruikt door eerst verschillen te berekenen • H0 : µ = 0 (geen verschil pre – post) • Ha: µ > 0 (een positieve evolutie) • En verder zelfde procedure als hiervoor
Voorbeeld : 20 pp doen mee aan een training, fitheid meten voor en na • Fitheidsscores Post min Pre berekenen • Gemiddelde is bv. = 2.5 en s=2.893 • H0 : µ = 0 (geen verschil pre – post) • Ha: µ > 0 (een positieve evolutie) • t is 2.5 – 0 gedeeld door (2.893 / 20) = 3.86 • In tabel E : significant
Is de t-procedure robuust ? redelijk • Robuust = als de kansberekeningen in de toets ongevoelig zijn voor afwijkingen van de gemaakte veronderstellingen • Bij n < 15, enkel t bij normale verdeling, en als er geen uitschieters zijn • Bij n > 15, geen t bij uitschieters of scheefheid (normale verdeling niet te strikt) • Bij n > 40, geen probleem
7.2. Vergelijking van twee verwachting • Zeer vaak toegepaste procedure in statistiek 2 proefgroepen waartussen gemiddelden worden vergeleken • Steeds : - reacties in 2 steekproeven vgl - elke groep is steekproef uit die populatie - reactie in beide groepen zijn onafhankelijk
2 grote groepen onderzoeken : • Experiment met experimentele en controlegroep • Vergelijking tussen twee EAS uit populatie • Grafisch : - rug aan rug stamdiagram - zij aan zij doosdiagram
Voor de beschrijving van de populatie populatie 1, variabele 1 (x1), µ1 en 1 populatie 2, variabele 2 (x2), µ2 en 2 • Voor de beschrijving van de steekproef populatie 1, n1, x1 , s1 populatie 2, n2, x2 , s2
A. Twee-steekproevengrootheid z (x1 - x2) – (µ1 - µ2) • z = 12+ 22 n1 n2 dit wordt echter zelden gebruikt omdat zelden gekend is, direct overgaan van z-procedure naar t-procedure
B. t-procedures voor onafhankelijke steekproeven (x1 - x2) • t = s12+ s22 n1 n2 • Betrouwbaarheidsinterval : (x1 - x2) ± t* s12+ s22 n1 n2
We hebben hier 2 standaardafwijkingen vervangen door standaardfouten wat geen echt t-verdeling meer geeft, maar toch t gebruiken • Twee steekproeven n1 en n2 en berekening van de vrijheidsgraden is moeilijk =computer doet het OF =kijken Tabel E bij kleinste aantal vrijheidsgraden van de 2 steekproeven
Voorbeeld : is er een verschil tussen mannen en vrouwen ? Ha: µ1µ2 • Mannen : n=133, x = 25.34, s = 5.05 • Vrouwen : n=162, x =24.94, s = 5.44 • t = 25.34 – 24.94 5.052 + 5.442 133 162 = 0.654 en in Tabel E bij 132 vrijheidsgraden t=0.654, df=132, p>0.50
T-procedures voor 2 onafhankelijke steekproeven zijn robuurster dan 1 • Bij gelijke omvang en gelijke vorm, is t nauwkeurig zelfs bij 5 pp. • Zelfde richtlijnen kunnen gebruikt worden als bij 1 steekproef maar door n1 + n2 meer robuust tegen niet-normaliteit
C. De samengestelde t-procedures voor 2 onafhankelijke steekproeven • Indien de 2 populaties DEZELFDE standaardafwijking hebben, dan moeten we er maar 1 substitueren en hebben we een exacte t-verdeling • Op basis van de standaardafwijkingen van de steekproeven (s1 en s2) wordt van de populatie geschat = pooled estimator of variance (zie computeroutput) • Maakt formule iets eenvoudiger maar kan ook met formule van hiervoor
7.3. Inferentie voor populatiespreiding • F-toets wordt gebruikt om te kijken of twee spreidingen van normale populaties significant van elkaar verschillen • F-toets is zeer gevoelig voor niet-normaliteit • F-toets wordt vaak gebruikt VOOR t-toets om na te gaan of varianties als gelijk of verschillend moeten beschouwd worden
Bij significante F-toets : separate variances gebruiken bij t • Bij niet significante F-toets : pooled variances gebruiken • Niet zelf F kunnen berekenen : computer = Levene’s test !! • F-toets is zeer weinig robuust, is zeer gevoelig p<0.05 of beter p<0.01 als significant beschouwen