Signifikanstest ved (en eller) to stikprøver

Signifikanstest ved (en eller) to stikprøver Fremgangsmåde – de fem trin Forudsætninger Hypoteseformulering Beregning af en teststørrelse, fx z-score Omregning af teststørrelsen til en P-værdi Konklusion

Uafhængige stikprøver(independent samples) To stikprøver, hvor observationerne i den ene stikprøve er u-afhængige af ditto i den anden. Eksempel: Et antal personer udtaget simpel tilfældigt deles tilfældigt i to grupper hvorefter, de bedes vurdere to forskellige hjemmesider (eksperiment). Eksempel: Personerne til en meningsmåling udtages simpelt tilfældigt til en stikprøve og deles yderligere op, f.eks. efter deres køn. 2

Afhængige stikprøver(dependent samples) Afhængige stikprøver forekommer, når data i stikprøv-erne kan matches parvis: Hver person i den ene stik-prøve kan matches med en person i den anden. Eksempel: Der indsamles data om samme person på to forskellige tidspunkter. Mao. består de to stikprøver af de samme personer (og disse kan matches). Eksempel: Tvillinger ved det klassiske studie af arv og miljø. 3

Eksempel: Mobilapplikation og hvilepuls En applikation til en mobiltelefon skal motivere sine brugere til jævnlig fysisk træning. I en undersøgelse sammenlignes den gennemsnitlige hvilepuls blandt personer der har hhv. ikke har applikationen. Er det to afhængige eller uafhængige stikprøver? 4

Sml. af gns. fra to uafhængige stikprøver • Forudsætninger • En signifikanstest forudsætter, at data er skabt ved simpel tilfældig udvælgelse. • Andre forudsætninger kan vedrøre • Stikprøvestørrelsen • F.eks. forudsætter teststørrelsen z, at n > 30. • Teststørrelsen t minder meget om z og anvendes, når n<30. • Populationens fordeling • F.eks. forudsætter teststørrelsen t, at popula-tionen er normalfordelt.Det gør z ikke, men z kræver, at n > 30 (hvorfor?) 5

2. Hypoteser Nulhypotesen er hypotesen om “ingen forskel” eller “ingen effekt”: H0: (µ1- µ2) =0 idet µ1 = µ2 => µ1- µ2 = 0 Alternativhypotesen er en af følgende: Ha: (µ1- µ2) ≠ 0 (to-sidet test) Ha: (µ1- µ2) < 0 (et-sidet test) Ha: (µ1- µ2) > 0 (et-sidet test) Sml. af gns. fra to uafhængige stikprøver 6

3. Teststørrelse Test af middelværdi i 1 stikprøve Test af middelværdier i 2 uafhængige stikprøver: Sml. af gns. fra to uafhængige stikprøver 7

4. P-værdi: Sandsynligheden for at observere test-størrelsen (hvis nulhypotesen er sand). Sandsynlig-heden findes v.hj.a. Excel. 5. Konklusion: Små P-værdier er beviser mod nulhypotesen H0 (til støtte for Ha). Sml. af gns. fra to uafhængige stikprøver 8

Har applikationsbrugere en lavere hvilepuls? Nulhypotesen er “ingen forskel” eller “ingen effekt”: H0: (µ1- µ2) =0 Alternativhypotesen er en lavere hvilepuls: Ha: (µ1- µ2) < 0 Test H0 på et 5% signifikansniveau Eksempel: Test af gns. fra to uafhængige stikprøver 9

Eksempel: Test af gns. fra to uafhængige stikprøver 10

Eksempel: Test af gns. fra to uafhængige stikprøver 11

Konklusion: P-værdien på 0,0087 er mindre end 5 %. H0 afvises. ”Beviserne” er stærke nok til at konkludere, at der er forskel på den gennemsnitlige hvilepuls for personer med og uden applikationen. I følge testen er der grund til at tro på, at den gennemsnitlige hvilepuls er lavere for personer, der benytter sig af applikationen. Hvad er forskellen på test i en stikprøve og test i to uafhængige stikprøver? Eksempel: Test af gns. fra to uafhængige stikprøver 12

Opgave: Load tider Efter skift til et nyt webhotel er download tiden på forskellige elementer (tekstsider, billeder, videoer etc.) på en hjemmeside blevet målt.Downloadtiderne målt i millisekunder fremgår af tabellen. Er den gns. downloadtid blevet mindre? 13

Afhængige stikprøver(dependent samples) Afhængige stikprøver forekommer, når data i stikprøv-erne kan matches parvis. Dvs. at hver person i den ene stikprøve matches direkte med en person i den anden. Eksempel: Der indsamles data om samme person på to forskellige tidspunkter. De to stikprøver består dermed af samme personer (matchende par). Eksempel: Tvillinger ved det klassiske studie af arv og miljø. 14

Den statistiske analyse af mobilapplikationen blev gennemført med to uafhængige stikprøver. Den ene gruppe (forsøgsgruppen) benyttede applikationen. Den anden gruppe (kontrolgruppen) benyttede ikke applikationen. Et alternativt design benytter de samme testpersoner i begge stikprøver; først uden og siden med applikationen. Hvorfor denne rækkefølge? Hvilepulsen måles før anvendelse og f.eks. efter en måneds brug. Hvordan tages stikprøven i praksis? Test af gns. fra to afhængige stikprøver 15

Eksempel: Test af gns. fra to afhængige stikprøver Data. Benytter testpersonen applikationen? Ja, Nej, D=Diff. 16

Differencen mellem de to stikprøvers gennemsnit ( – ) er lig gennemsnittet af differencerne, , for de matchende par. Differencen mellem populationernes gennemsnit (µ1 – µ2) er lig parameteret µd, dvs. differencernes populations- gennemsnit. Det statistiske test af de parvise differencer er et special tilfælde af det statistisk test vedrørende en populations gennemsnit, baseret på en enkelt stikprøve. Test af gns. fra to afhængige stikprøver 17

Hvad er fordelen ved afhængige stikprøver? Procedure ved sammenligning af gennemsnit i 2 afhængige stikprøver: For hvert matchende par beregnes differencen, d d = (hvilepuls uden applikationen) – (hvilepuls med applikationen) Differencerne kalder vi Test af gns. fra to afhængige stikprøver 18

For at teste hypotesen om ens gennemsnit, H0: µ1 = µ2, tester man H0: µd = 0, svarende til differencen (µ1-µ2). Man tester på samme måde som ved en enkelt stikprøve. Teststørrelsen er: Test af gns. fra to afhængige stikprøver 19

1. Forudsætninger Stikprøven er udvalgt simpelt tilfældigt. For n < 30 forudsættes, at populationen er normalfordelt. Dette er vigtigt ved små stikprøver Test af gns. fra to afhængige stikprøver 20

2. Hypoteser H0: µd = 0 (hvilket er dss., at de to populations gennemsnit er ens) Ha: µd < 0 3. Teststørrelse Test af gns. fra to afhængige stikprøver 21

Test af gns. fra to afhængige stikprøver 4. Omregning til en P-værdi z = -1,98 P = (z < -1,98) ≈ 2 % 22

5. Konklusion P-værdien er under 5 %, hvorfor nul-hypotesen afvises. Der er gode beviser mod nul-hypotesen, hvorfor den afvises. Der er grund til at tro, at den gennemsnitlige hvilepuls er lavere for brugere af applikationen. Test af gns. fra to afhængige stikprøver 23

Opgave: Load tider Efter skift til et nyt webhotel er download tiden på forskellige elementer (tekstsider, billeder, videoer etc.) på en hjemmeside blevet målt.Downloadtiderne målt i millisekunder fremgår af tabellen. Er den gns. downloadtid blevet mindre? 24

Signifikanstest ved (en eller) to stikprøver