250 likes | 381 Views
Agenda. Afhængige og uafhængige stikprøver Test i 2 u afhængige stikprøver Test i 2 afhængige stikprøver. Afhængige stikprøver (dependent samples).
E N D
Agenda • Afhængige og uafhængige stikprøver • Test i 2 uafhængige stikprøver • Test i 2 afhængige stikprøver
Afhængige stikprøver(dependent samples) Afhængige stikprøver forekommer, når enhederne (f.eks. personerne) i stikprøverne kan matches parvis: Hver person i den ene stikprøve kan matches med en person i den anden. Eksempel 1: Der indsamles data om samme person på to forskellige tidspunkter => stikprøveenheder kan matches. Eksempel 2: Tvillinger ved studiet af effekten af arv og miljø. 2
Uafhængige stikprøver(independent samples) 2 stikprøver hvor observationerne i den ene stikprøve er uafhængige af ditto i den anden. Et antal personer udtages simpel tilfældigt og deles tilfældigt i to grupper. Personerne til en meningsmåling udtages simpelt tilfældigt og deles yderligere op, f.eks. efter deres køn. 3
Eksempel: Mobilapplikation og hvilepuls En applikation til en mobiltelefon skal motivere sine brugere til jævnlig fysisk træning. I en undersøgelse sammenlignes den gennemsnitlige hvilepuls blandt personer der har hhv. ikke har applikationen. Er det to afhængige eller uafhængige stikprøver? 4
Signifikanstest ved to stikprøver Fremgangsmåde (de fem trin): Forudsætninger Hypoteseformulering Beregning af en teststørrelse, fx z-score Omregning af teststørrelsen til en P-værdi Konklusion
Sml. af gns. fra to uafhængige stikprøver • Forudsætninger • En signifikanstest forudsætter, at data er skabt ved simpel tilfældig udvælgelse. • Andre forudsætninger kan vedrøre • Stikprøvestørrelsen • F.eks. forudsætter teststørrelsen z, at n > 30. • Teststørrelsen t minder meget om z og anvendes, når n<30. • Populationens fordeling • F.eks. forudsætter teststørrelsen t, at popula-tionen er normalfordelt. Det gør z ikke, men z kræver, at n > 30 (hvorfor?) 6
2. Hypoteser Nulhypotesen er hypotesen om “ingen forskel” eller “ingen effekt”: H0: µ1 = µ2 Da µ1 = µ2 <=> µ1- µ2 = 0 skriver man ofte H0 som H0: µ1 - µ2 = 0 Alternativhypotesen er en af følgende: Ha: (µ1- µ2) ≠ 0 (to-sidet test) Ha: (µ1- µ2) < 0 (et-sidet test) Ha: (µ1- µ2) > 0 (et-sidet test) Sml. af gns. fra to uafhængige stikprøver 7
3. Teststørrelse Test af middelværdi i 1 stikprøve Test af middelværdier i 2uafhængige stikprøver: Sml. af gns. fra to uafhængige stikprøver 8
4. P-værdi: Sandsynligheden for at observere test-størrelsen, z eller t, (hvis nulhypotesen er sand). Sandsynligheden findes v.hj.a. Excel. 5. Konklusion: Små P-værdier er beviser mod nulhypotesen H0 (til støtte for Ha). Hvis H0 afvises … har vi IKKE bevist, at Ha er sand. Vores undersøgelse har ledt os frem til at konkludere, at Ho næppe er sand. Så vi tror på, at det snarere er Ha der gælder. Sml. af gns. fra to uafhængige stikprøver 9
Har applikationsbrugere en lavere hvilepuls? Nulhypotesen er “ingen forskel” eller “ingen effekt”: H0: (µ1 - µ2) = 0 Alternativhypotesen er en lavere hvilepuls: Ha: (µ1 - µ2) < 0 Test H0 på et 5% signifikansniveau Eksempel: Test af gns. fra to uafhængige stikprøver 10
Konklusion: P-værdien på 0,0087 er mindre end 5 %. H0 afvises. ”Beviserne” er stærke nok til at konkludere, at der er forskel på den gennemsnitlige hvilepuls for personer med og uden applikationen. I følge testen er der grund til at tro på, at den gennemsnitlige hvilepuls er lavere for personer, der benytter sig af applikationen. Hvad er forskellen på test i 1 stikprøve og test i 2 uafhængige stikprøver? Eksempel: Test af gns. fra to uafhængige stikprøver 13
Opgave: Load tider Efter skift til et nyt webhotel er download tiden på forskellige elementer (tekstsider, billeder, videoer etc.) på en hjemmeside blevet målt.Downloadtiderne målt i millisekunder fremgår af tabellen. Er den gns. downloadtid blevet mindre? 14
Afhængige stikprøver(dependent samples) Afhængige stikprøver forekommer, når data i stikprøv-erne kan matches parvis. Dvs. at hver person i den ene stikprøve matches direkte med en person i den anden. Eksempel: Der indsamles data om samme person på to forskellige tidspunkter. De to stikprøver består dermed af samme personer (matchende par). Eksempel: Tvillinger ved det klassiske studie af arv og miljø. 15
Den statistiske analyse af mobilapplikationen blev gennemført med to uafhængige stikprøver. Den ene gruppe (forsøgsgruppen) benyttede applikationen. Den anden gruppe (kontrolgruppen) benyttede ikke applikationen. Et alternativt design benytter de samme testpersoner i begge stikprøver; først uden og siden med applikationen. Hvorfor denne rækkefølge? Hvilepulsen måles før anvendelse og f.eks. efter en måneds brug. Hvordan tages stikprøven i praksis? Test af gns. fra to afhængige stikprøver 16
Eksempel: Test af gns. fra to afhængige stikprøver Data. Benytter testpersonen applikationen? Ja, Nej, D=Diff. 17
Differencen mellem de to stikprøvers gennemsnit ( – ) er lig gennemsnittet af differencerne, , for de matchende par. Differencen mellem populationernes gennemsnit (µ1 – µ2) er lig parameteret µd, dvs. differencernes populations- gennemsnit. Det statistiske test af de parvise differencer er et special tilfælde af det statistisk test vedrørende en populations gennemsnit, baseret på en enkelt stikprøve. Test af gns. fra to afhængige stikprøver 18
Hvad er fordelen ved afhængige stikprøver? Procedure ved sammenligning af gennemsnit i 2 afhængige stikprøver: For hvert matchende par beregnes differencen, d d = (hvilepuls uden app) – (hvilepuls med app) Differencerne kalder vi Test af gns. fra to afhængige stikprøver 19
For at teste hypotesen om ens gennemsnit, H0: µ1 = µ2, tester man H0: µd = 0, svarende til differencen (µ1-µ2). Man tester på samme måde som ved 1 stikprøve. Teststørrelsen er: Test af gns. fra to afhængige stikprøver 20
1. Forudsætninger Stikprøven er udvalgt simpelt tilfældigt. For n < 30 forudsættes, at populationen er normalfordelt og t benyttes som teststørrelse. Dette er vigtigt ved små stikprøver Test af gns. fra to afhængige stikprøver 21
2. Hypoteser H0: µd = 0 (hvilket er dss., at de to populations gennemsnit er ens) Ha: µd < 0 3. Teststørrelse Test af gns. fra to afhængige stikprøver 22
Test af gns. fra to afhængige stikprøver 4. Omregning til en P-værdi z = -1,98 P = (z < -1,98) ≈ 2 % 23
5. Konklusion P-værdien er under 5 %, hvorfor nul-hypotesen afvises. Der er gode beviser mod nul-hypotesen, hvorfor den afvises. Der er grund til at tro, at den gennemsnitlige hvilepuls er lavere for brugere af applikationen. Test af gns. fra to afhængige stikprøver 24
Opgave: Load tider Efter skift til et nyt webhotel er downloadtiden på forskellige elementer (tekstsider, billeder, videoer etc.) på en hjemmeside blevet målt. Downloadtiderne målt i millisekunder fremgår af tabellen. Er den gns. downloadtid blevet mindre? 25