340 likes | 718 Views
We hebben de volgende situatie. Iemand doet een bewering, een ander twijfelt aan de juistheid daarvan. Een hypothesetoets is een procedure om te beslissen wie gelijk krijgt. Daarbij heb je • twee hypothesen: de nulhypothese H0 en de alternatieve hypothese H1,
E N D
We hebben de volgende situatie. Iemand doet een bewering, een ander twijfelt aan de juistheid daarvan. Een hypothesetoets is een procedure om te beslissen wie gelijk krijgt. Daarbij heb je • twee hypothesen: de nulhypothese H0 en de alternatieve hypothese H1, • een toetsingsgrootheid; dat is het aantal X dat geteld wordt (of een gewicht dat gemeten wordt, of ...), • een criterium dat zegt bij welke waarden van X de nulhypothese wordt verworpen. Deze waarden vormen het zogenaamde kritieke gebied. Het kritieke gebied wordt zo bepaald dat de kans dat X een waarde aanneemt in het kritieke gebied kleiner is dan een vooraf afgesproken α. Deze α heet significantieniveau (of onbetrouwbaarheidsdrempel). Hypothese toetsen
Voor α neemt men vaak 0,05, 0,01 of zelfs 0,005, afhankelijk van hoe zwaarwegend de beslissing is. Hoe lager de waarde van α dus hoe groter de betrouwbaarheid des te kleiner is de nauwkeurigheid Elke Nederlandse docent kan je met honderd procent zekerheid vertellen dat als je een examenwerk inlevert je een cijfer krijgt tussen nul en tien.
Hypothesen toetsen • Een fabrikant van tennisballen maakt ballen waarvan het gewicht X in gram • normaal verdeeld is met µ = 58 en σ = 2. • Er is een nieuwe productiemethode ontwikkeld die goedkoper is en die volgens • de afdeling research geen invloed heeft op het gewicht van de tennisballen. • Een afnemer van de tennisballen twijfelt aan deze bewering. • Je hebt hier te maken met twee hypothesen: • H0 : µ = 58 (de nieuwe productiemethode heeft geen invloed op het gewicht) en • H1 : µ ≠ 58 (de nieuwe methode beïnvloedt het gewicht). • Bij het toetsen van hypothesen doe je op grond van een steekproefresultaat • een uitspraak over het al dan niet verwerpen van H0.
Belangrijke begrippen • nulhypothese H0 : µ = 58 • alternatieve hypothese H1 : µ ≠ 58 • toetsingsgrootheid = het steekproefgemiddelde • beslissingsvoorschrift Verwerp H0 als ≤ gl of ≥ gr. • significantieniveau α De kans dat H0 ten onrechte verworpen wordt • is hoogstens α, ofwel • P( ≤ gl of ≥ gr) ≤ α bij 15.1
P(ten onrechte bijstellen) = P( ≤ 399 of ≥ 401) = 2 · P( ≤ 399) = 2 · normalcdf ≈ 0,077 Je weet in dat geval niet wat het werkelijke gemiddelde is. P(niet bijstellen) = P(399 < < 401 bij ) = normalcdf ≈ 0,500 opgave 2 a b c
P( ≤ gl ) = 0,005 gl = invNorm(0.005, 400, 0.4) gl ≈ 398,97. P( ≤ gr ) 1 – 0,005 = 0,995 gr = invNorm(0.995, 400, 0.4) gr ≈ 401,03. Bij = 400,8 is er geen aanleiding H0 te verwerpen. Het steekproefgemiddelde wijkt niet significant af. opgave 4 a b
Overschrijdingskans • Op grond van een steekproefresultaat besluit je H0 al dan niet te verwerpen. • Er zijn twee situaties te onderscheiden. • Het steekproefresultaat is bekend. • Bereken de overschrijdingskans van het steekproefgemiddelde. • Is deze kans kleiner dan 0,5α, dan verwerp je H0. • Is gegeven dat = 56,6, dan is de overschrijdingskans • P( ≤ 56,6), want 56,6 < µ. • Is gegeven dat = 58,7, dan is de overschrijdingskans • P( ≥ 58,7), want 58,7 > µ. • Het steekproefresultaat is niet bekend. • Stel het beslissingsvoorschrift op • en bereken gl en gr. 15.1
H0 : µ = 25, H1 : µ ≠ 25 en α = 0,05. De overschrijdingskans van 24 is P( ≤ 24) = normalcdf ≈ 0,009. P( ≤ 24) ≤ 0,5α dus H0 wordt verworpen. Conclusie: er is aanleiding om het gemiddelde µX = 25 in twijfel te trekken. H0 : µ = 25, H1 : µ ≠ 25 en α= 0,01. De overschrijdingskans van 26 is P( ≥ 26) = normalcdf(26, 1099, 25, 0.3) ≈ 0,0004. P( ≥ 26) ≤ 0,5α dus H0 wordt verworpen. Conclusie: er is aanleiding om het gemiddelde µX = 25 in twijfel te trekken. opgave 7 a b
Eenzijdige en tweezijdige toetsen • Linkszijdige toets: H0 : µ = µ0 tegen H1 : µ < µ0 • Verwerp H0 als ≤ g met g zo, dat P( ≤ g ) = α. • Rechtszijdige toets: H0 : µ = µ0 tegen H1 : µ > µ0 • Verwerp H0 als ≥ g met g zo, dat P( ≥ g ) = α. • Tweezijdige toets: H0 : µ = µ0 tegen H1 : µ ≠ µ0 • Verwerp H0 als ≤ gl of ≥ gr • met gl zo, dat P( ≤ gl ) = 0,5α en gr zo, dat P( ≥ gr ) = 0,5α 15.2
P( ≤ g ) = 1 – 0,10 = 0,90 g = invNorm g ≈ 88,51. Verwerp H0 als ≥ 88,6. P( ≤ g ) = 0,05 g = invNorm g ≈ 81,51. Verwerp H0 als ≤ 81,5. opgave 12 a b
P( ≤ gl) = 0,005 gl = invNorm gl≈ 82,27. P( ≤ gr ) = 1 – 0,005 = 0,995 gr = invNorm gr≈ 87,73. Verwerp H0 als ≤ 82,2 of ≥ 87,8. opgave 12 c
Overschrijdingskans van het steekproefgemiddelde • Bij H0 : µ = 25 en • H1 : µ < 25 is de overschrijdingskans van 23 gelijk aan P( ≤ 23) • H1 : µ > 25 is de overschrijdingskans van 28 gelijk aan P( ≥ 28) • H1 : µ ≠ 25 is de overschrijdingskans van 28 gelijk aan P( ≥ 28) en • is de overschrijdingskans van 23 gelijk aan P( ≤ 23). • Je verwerpt H0 als • de overschrijdingskans kleiner is dan of gelijk is aan α (bij eenzijdig toetsen) • de overschrijdingskans kleiner is dan of gelijk aan 0,5α (bij tweezijdig toetsen). 15.2
P(tablet helpt) = P(3,8 < X < 4,2) = normalcdf(3.8, 4.2, 4, 0.12) ≈ 0,904 X is het werkzame aandeel in gram per tablet. H0 : µ = 4, H1 : µ ≠ 4 en α = 0,05. De overschrijdingskans van 3,95 is P( ≤ 3,95) = normalcdf ≈ 0,002. P( ≤ 3,95) ≤ 0,5α dus H0 wordt verworpen. Conclusie: het steekproefgemiddelde wijkt significantaf van 4 mg. P(tablet helpt niet) = 1 – normalcdf(3.8, 4.2, 3.95, 0.12) ≈ 0,124 Dus 12,4% van de tabletten helpt dan niet. opgave 17 a b c
Toetsen van hypothesen • Volg bij het toetsen van hypothesen de volgende stappen. • Formuleer H0 en H1 en vermeld het significantieniveau α. • Bereken de overschrijdingskans als het steekproefresultaat bekend is. • Stel anders het beslissingsvoorschrift op. • Beantwoord de gestelde vraag. • Bedenk dat H0 de hypothese is die in twijfel wordt getrokken. • Kies H0 altijd enkelvoudig, dus H0 : µ = µ0. 15.2
Binomiale toets • Bij een binomiale toets heeft de nulhypothese de vorm H0 : p = p0. • Is de toets linkszijdig, dan is H1 : p < p0. • Is de toets rechtszijdig, dan is H1 : p > p0. • Is de toets tweezijdig, dan is H1 : p≠ p0. • Het al dan niet verwerpen van H0 hangt af • van het steekproefresultaat. • Onder H0 is X binomiaal verdeeld met • p = p0 ; n is de steekproefomvang. 15.3
Beslissingsvoorschrift bij significantieniveau α • Linkszijdig: Verwerp H0 als X≤ g. • Kies g zo, dat P(X ≤ g) ≤ α. • Rechtszijdig: Verwerp H0 als X≥ g. • Kies g zo, dat P(X ≥ g) ≤ α. • Tweezijdig: Verwerp H0 als X≤ gl of X≥ gr • Kies glen gr zo, dat • P(X ≤ gl) ≤ 0,5α en P(X ≥ gr) ≤ 0,5α 15.3
Het toetsen van de mediaan met de tekentoets • Bij het toetsen van de hypothese ‘de mediaan is m0’ tegen de hypothese • ‘de mediaan is niet m0’ bereken je van alle steekproefresultaten het teken • van waarneming – m0. • Er ontstaat zo een rij van plus- en mintekens. • Indien de mediaan werkelijk m0 is, is de kans op een plusteken gelijk aan 0,5. • Het aantal plustekens is dan binomiaal verdeeld met p = 0,5. • Dus H0 : p = 0,5 en H1 : p ≠ 0,5. • Gebruik vervolgens de overschrijdingskans van het steekproefresultaat om de • juiste conclusie te trekken. • Bij deze methode laat je de waarnemingen waarvoor waarneming – m0 = 0 • buiten beschouwing. 15.4
Is er een significant verschil tussen twee rijen waarnemingsgetallen • Om te onderzoeken of er een significant verschil bestaat tussen twee rijen • waarnemingsgetallen kun je de tekentoets gebruiken. • Bij elk paar stel je vast of het verschil positief of negatief is. • De rij plus- en mintekens die zo ontstaat gebruik je als steekproef uit een • binomiale verdeling, waarbij de toetsingsgrootheid het aantal plustekens is. • De nulhypothese is H0 : p = 0,5. • Immers als er geen verschil is tussen de rijen waarnemingsgetallen is de kans • op een plusteken gelijk aan de kans op een minteken. • De alternatieve hypothese is afhankelijk van de probleemstelling, • H1 : p < 0,5 of H1 : p > 0,5 of H1 : p≠ 0,5. • Het is gebruikelijk om de paren waarbij het verschil nul is, buiten beschouwing • te laten. 15.4
X is de kijktijd van de Nederlander in uren. H0 : µ = 28,4, H1 : µ < 28,4 en α= 0,025. De overschrijdingskans van 27,6 is P( ≤ 27,6) = normalcdf ≈ 0,034 P( ≤ 27,6) > α dus H0 wordt niet verworpen. Conclusie: je kunt het niet eens zijn met de uitspraak van de medewerker van ‘De Ster’. opgave 21
Binomiale toets • Bij een binomiale toets heeft de nulhypothese de vorm H0 : p = p0. • Is de toets linkszijdig, dan is H1 : p < p0. • Is de toets rechtszijdig, dan is H1 : p > p0. • Is de toets tweezijdig, dan is H1 : p≠ p0. • Het al dan niet verwerpen van H0 hangt af • van het steekproefresultaat. • Onder H0 is X binomiaal verdeeld met • p = p0 ; n is de steekproefomvang.
X = het aantal personen dat in één keer voor het rijexamen slaagt. H0 : p = 0,35 en H1 : p > 0,35. De overschrijdingskans van 19 is P(X≥ 19) = 1 – P(X ≤ 18) = 1 – binomcdf(40, 0.35, 18) ≈ 0,070 P(X ≥ 19) > α dus H0 wordt niet verworpen. Conclusie: er is aanleiding de bewering van de rijschoolhouder in twijfel te trekken. opgave 24 a b
X = het aantal patiënten waarbij het middel een positieve uitwerking had. H0 : p = 0,80, H1 : p < 0,80 en α = 0,05. Verwerp H0 als X ≤ g. P(X ≤ g) ≤ 0,05 binomcdf(500, 0.80, g) ≤ 0,05 TICasio Voer in y1 = binomcdf(500, 0.80, x) Proberen geeft Uit de tabel volgt P(X ≤ 384) ≈ 0,0434 x = 384 geeft y1 ≈ 0,0434 P(X ≤ 385) ≈ 0,0543 x = 385 geeft y1 ≈ 0,0543 Verwerp H0 als X ≤ 384. Verwerp H0 als X ≤ 384. Conclusie: het kleinste aantal patiënten waarbij je de bewering van de fabrikant niet verwerpt is 385. opgave 30
Beslissingsvoorschrift bij significantieniveau α • Linkszijdig: Verwerp H0 als X≤ g. • Kies g zo, dat P(X ≤ g) ≤ α. • Rechtszijdig: Verwerp H0 als X≥ g. • Kies g zo, dat P(X ≥ g) ≤ α. • Tweezijdig: Verwerp H0 als X≤ gl of X≥ gr • Kies glen gr zo, dat • P(X ≤ gl) ≤ 0,5α en P(X ≥ gr) ≤ 0,5α
Verwerp H0 als X≤ gl of X ≥ gr TI binomcdf(50, 0.3, gl) ≤ 0,05 P(X ≤ gr) ≤ 0,05 1 – P(X ≤ gr – 1) ≤ 0,05 Je krijgt 1 – binomcdf(50, 0.3, gr – 1) ≤ 0,05 binomcdf(50, 0.3, 9) ≈ 0,0402 Je krijgt binomcdf(50, 0.3, 10) ≈ 0,0789 1 – binomcdf(50, 0.3, 19) ≈ 0,0848 Dus gl = 9 1 – binomcdf(50, 0.3, 20) ≈ 0,0478 gr– 1 = 20 dus gr = 21 Conclusie: de nulhypothese wordt verworpen bij steekproefresultaten van 9 of minder en van 21 of meer. opgave 34
P(tomaat wordt doorgedraaid) = P(X < 7,2) = normalcdf(–1099, 7.2, 7.9, 0.5) ≈ 0,081 X = het aantal tomaten dat na meting moet worden doorgedraaid. H0 : p = 0,081, H1 : p < 0,081 en α = 0,01. De overschrijdingskans van 65 is P(X ≤ 65) = binomcdf(900, 0.081, 65) ≈ 0,184 P(X ≤ 65) > α dus H0 wordt niet verworpen. Conclusie: er is niet aangetoond dat het middel S3Fb de diameter vergroot. opgave 41 a b
Iemand denkt dat leerlingen gemiddeld rond de € 35,- zakgeld krijgen per week.Dit is in mijn ogen erg hoog en ik denk dat dat komt omdat er iemand is die een erg hoog bedrag krijgt. Daarmee is de verdeling van de zakgelden niet normaal verdeeld, maar is er sprake van een rechts scheve verdeling. De mediaan is daarom een betere maatstaaf om mee te werken. Deze is immers niet gevoelig voor uitschieters binnen de verdeling. Ik geloof dat de mediaan voor zakgeld van leerlingenligt bij hoogstens €15,-Als significantie niveau nemen we 5% Navraag bij leerlingen wees uit dat zij het volgende kregen:20 20 25 12,50 17,50 25 10 20 15 12 15 25 20 17,50 + + + - + + - + - + + + P(X>=9) = 1 – binomcdf ( 12, 0.5 , 8 ) = 0.073 Ik krijg gelijk wat betreft de mediaan waarde.
Het toetsen van de mediaan met de tekentoets • Bij het toetsen van de hypothese ‘de mediaan is m0’ tegen de hypothese • ‘de mediaan is niet m0’ bereken je van alle steekproefresultaten het teken • van waarneming – m0. • Er ontstaat zo een rij van plus- en mintekens. • Indien de mediaan werkelijk m0 is, is de kans op een plusteken gelijk aan 0,5. • Het aantal plustekens is dan binomiaal verdeeld met p = 0,5. • Dus H0 : p = 0,5 en H1 : p ≠ 0,5. • Gebruik vervolgens de overschrijdingskans van het steekproefresultaat om de • juiste conclusie te trekken. • Bij deze methode laat je de waarnemingen waarvoor waarneming – m0 = 0 • buiten beschouwing.
Is van een verdeling niet met zekerheid te zeggen dat deze normaal verdeeld is dan is de tekentoets een van de nuttigste manieren om toch een uitspraak te kunnen toetsen. Een voorbeeld waarbij de tekentoets de voorkeur heeft is bij het onderzoeken van een verbetertraject bij een klein aantal waarnemingen. Door het klein aantal waarnemingen is het lastig te bepalen of iets b.v. normaal of binominaal verdeeld is. ( er is sprake van verdelingsvrije toetsing).
Voorbeeld: Een groep leerlingen heeft als voorbereiding op hun engels-mondeling twee weken lang alleen maar naar de bbc/sky /cnn gekeken/geluisterd. Leerlingen uit de parallelklas denken dat dit geen verbetering oplevert en doen dit dan ook niet. Is er reden om aan te nemen dat de tweede groep gelijk heeft? Neem α = 0,01 Voor en na deze periode is er bij de leerlingen een luistertoets afgenomen. Dit gaf de volgende resultaten (aantal punten): Voor:32 31 29 10 30 33 22 25 32 20 30 20 24 24 31 30 15 32 23 23 Na:34 31 35 16 33 36 21 28 26 26 36 26 27 24 30 31 15 34 26 25 Teken: + + + + + - + - + + + + - + + + + H0 : p = 0,5, H1 : p > 0,5 waarbij X= het aantal plussen (verbeteringen) P(X ≥ 14) = 1 – P(X ≤ 13) = 1 – binomcdf(17, 0.5, 13) ≈ 0,0064 P(X ≥ 14) ≤ α dus H0 wordt verworpen, groep twee krijgt geen gelijk.
11,3 8,8 6,4 8,7 14,6 16,2 12,4 7,1 15,2 10,3 9,5 17,2 7,8 Het teken van waarneming – 15 geeft: – – – – – + – – + – – + – X = het aantal plustekens in de steekproef met lengte 13, dus X = 3. H0 : p = 0,5, H1 : p < 0,5 en α = 0,10. De overschrijdingskans van 3 is P(X ≤ 3) = binomcdf(13, 0.5, 3) ≈ 0,046 P(X ≤ 3) ≤ α dus H0 wordt verworpen. Conclusie: er is aanleiding de bewering van de boswachter in twijfel te trekken. opgave 44
X = het aantal twintigjarige jongens dat zwaarder is dan 75,6 kg. H0 : p = 0,5, H1 : p > 0,5 en α = 0,025. De overschrijdingskans van 138 is P(X ≥ 138) = 1 – P(X ≤ 137) = 1 – binomcdf(250, 0.5, 137) ≈ 0,057 P(X ≥ 138) > α dus H0 wordt niet verworpen. Conclusie: er mag niet geconcludeerd worden dat het gemiddelde gewicht is toegenomen. opgave 47
Is er een significant verschil tussen twee rijen waarnemingsgetallen • Om te onderzoeken of er een significant verschil bestaat tussen twee rijen • waarnemingsgetallen kun je de tekentoets gebruiken. • Bij elk paar stel je vast of het verschil positief of negatief is. • De rij plus- en mintekens die zo ontstaat gebruik je als steekproef uit een • binomiale verdeling, waarbij de toetsingsgrootheid het aantal plustekens is. • De nulhypothese is H0 : p = 0,5. • Immers als er geen verschil is tussen de rijen waarnemingsgetallen is de kans • op een plusteken gelijk aan de kans op een minteken. • De alternatieve hypothese is afhankelijk van de probleemstelling, • H1 : p < 0,5 of H1 : p > 0,5 of H1 : p≠ 0,5. • Het is gebruikelijk om de paren waarbij het verschil nul is, buiten beschouwing • te laten.
opgave 49 Het teken van na – voor is 0 + – – – 0 – + – – – – – – – 0 X = het aantal mintekens in de steekproef van lengte 13, dus X = 11. H0 : p = 0,5, H1 : p > 0,5 en α = 0,05. De overschrijdingskans van 11 is P(X ≥ 11) = 1 – P(X ≤ 10) = 1 – binomcdf(13, 0.5, 10) ≈ 0,011 P(X ≥ 11) ≤ α dus H0 wordt verworpen. Conclusie: dit resultaat geeft aanleiding te veronderstellen dat het middel het aantal bladluizen vermindert.
Het teken van thuis – uit is + + + + – + – 0 – + X = het aantal plustekens in de steekproef van lengte 9 dus X = 6. H0 : p = 0,50, H1 : p > 0,50 en α = 0,01. De overschrijdingskans van 6 is P(X ≥ 6) = 1 – P(X ≤ 5) = 1 – binomcdf(9, 0.5, 5) ≈ 0,254 P(X ≥ 6) > α dus H0 wordt niet verworpen. Conclusie: er is geen aanleiding te veronderstellen dat ‘thuisvoordeel’ inderdaad bestaat. opgave 53