1 / 25

Agenda

Agenda. Afhængige og uafhængige stikprøver Test i 2 u afhængige stikprøver Test i 2 afhængige stikprøver. Afhængige stikprøver (dependent samples).

kynton
Download Presentation

Agenda

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Agenda • Afhængige og uafhængige stikprøver • Test i 2 uafhængige stikprøver • Test i 2 afhængige stikprøver

  2. Afhængige stikprøver(dependent samples) Afhængige stikprøver forekommer, når enhederne (f.eks. personerne) i stikprøverne kan matches parvis: Hver person i den ene stikprøve kan matches med en person i den anden. Eksempel 1: Der indsamles data om samme person på to forskellige tidspunkter => stikprøveenheder kan matches. Eksempel 2: Tvillinger ved studiet af effekten af arv og miljø. 2

  3. Uafhængige stikprøver(independent samples) 2 stikprøver hvor observationerne i den ene stikprøve er uafhængige af ditto i den anden. Et antal personer udtages simpel tilfældigt og deles tilfældigt i to grupper. Personerne til en meningsmåling udtages simpelt tilfældigt og deles yderligere op, f.eks. efter deres køn. 3

  4. Eksempel: Mobilapplikation og hvilepuls En applikation til en mobiltelefon skal motivere sine brugere til jævnlig fysisk træning. I en undersøgelse sammenlignes den gennemsnitlige hvilepuls blandt personer der har hhv. ikke har applikationen. Er det to afhængige eller uafhængige stikprøver? 4

  5. Signifikanstest ved to stikprøver Fremgangsmåde (de fem trin): Forudsætninger Hypoteseformulering Beregning af en teststørrelse, fx z-score Omregning af teststørrelsen til en P-værdi Konklusion

  6. Sml. af gns. fra to uafhængige stikprøver • Forudsætninger • En signifikanstest forudsætter, at data er skabt ved simpel tilfældig udvælgelse. • Andre forudsætninger kan vedrøre • Stikprøvestørrelsen • F.eks. forudsætter teststørrelsen z, at n > 30. • Teststørrelsen t minder meget om z og anvendes, når n<30. • Populationens fordeling • F.eks. forudsætter teststørrelsen t, at popula-tionen er normalfordelt. Det gør z ikke, men z kræver, at n > 30 (hvorfor?) 6

  7. 2. Hypoteser Nulhypotesen er hypotesen om “ingen forskel” eller “ingen effekt”: H0: µ1 = µ2 Da µ1 = µ2 <=> µ1- µ2 = 0 skriver man ofte H0 som H0: µ1 - µ2 = 0 Alternativhypotesen er en af følgende: Ha: (µ1- µ2) ≠ 0 (to-sidet test) Ha: (µ1- µ2) < 0 (et-sidet test) Ha: (µ1- µ2) > 0 (et-sidet test) Sml. af gns. fra to uafhængige stikprøver 7

  8. 3. Teststørrelse Test af middelværdi i 1 stikprøve Test af middelværdier i 2uafhængige stikprøver: Sml. af gns. fra to uafhængige stikprøver 8

  9. 4. P-værdi: Sandsynligheden for at observere test-størrelsen, z eller t, (hvis nulhypotesen er sand). Sandsynligheden findes v.hj.a. Excel. 5. Konklusion: Små P-værdier er beviser mod nulhypotesen H0 (til støtte for Ha). Hvis H0 afvises … har vi IKKE bevist, at Ha er sand. Vores undersøgelse har ledt os frem til at konkludere, at Ho næppe er sand. Så vi tror på, at det snarere er Ha der gælder. Sml. af gns. fra to uafhængige stikprøver 9

  10. Har applikationsbrugere en lavere hvilepuls? Nulhypotesen er “ingen forskel” eller “ingen effekt”: H0: (µ1 - µ2) = 0 Alternativhypotesen er en lavere hvilepuls: Ha: (µ1 - µ2) < 0 Test H0 på et 5% signifikansniveau Eksempel: Test af gns. fra to uafhængige stikprøver 10

  11. Eksempel: Test af gns. fra to uafhængige stikprøver 11

  12. Eksempel: Test af gns. fra to uafhængige stikprøver 12

  13. Konklusion: P-værdien på 0,0087 er mindre end 5 %. H0 afvises. ”Beviserne” er stærke nok til at konkludere, at der er forskel på den gennemsnitlige hvilepuls for personer med og uden applikationen. I følge testen er der grund til at tro på, at den gennemsnitlige hvilepuls er lavere for personer, der benytter sig af applikationen. Hvad er forskellen på test i 1 stikprøve og test i 2 uafhængige stikprøver? Eksempel: Test af gns. fra to uafhængige stikprøver 13

  14. Opgave: Load tider Efter skift til et nyt webhotel er download tiden på forskellige elementer (tekstsider, billeder, videoer etc.) på en hjemmeside blevet målt.Downloadtiderne målt i millisekunder fremgår af tabellen. Er den gns. downloadtid blevet mindre? 14

  15. Afhængige stikprøver(dependent samples) Afhængige stikprøver forekommer, når data i stikprøv-erne kan matches parvis. Dvs. at hver person i den ene stikprøve matches direkte med en person i den anden. Eksempel: Der indsamles data om samme person på to forskellige tidspunkter. De to stikprøver består dermed af samme personer (matchende par). Eksempel: Tvillinger ved det klassiske studie af arv og miljø. 15

  16. Den statistiske analyse af mobilapplikationen blev gennemført med to uafhængige stikprøver. Den ene gruppe (forsøgsgruppen) benyttede applikationen. Den anden gruppe (kontrolgruppen) benyttede ikke applikationen. Et alternativt design benytter de samme testpersoner i begge stikprøver; først uden og siden med applikationen. Hvorfor denne rækkefølge? Hvilepulsen måles før anvendelse og f.eks. efter en måneds brug. Hvordan tages stikprøven i praksis? Test af gns. fra to afhængige stikprøver 16

  17. Eksempel: Test af gns. fra to afhængige stikprøver Data. Benytter testpersonen applikationen? Ja, Nej, D=Diff. 17

  18. Differencen mellem de to stikprøvers gennemsnit ( – ) er lig gennemsnittet af differencerne, , for de matchende par. Differencen mellem populationernes gennemsnit (µ1 – µ2) er lig parameteret µd, dvs. differencernes populations- gennemsnit. Det statistiske test af de parvise differencer er et special tilfælde af det statistisk test vedrørende en populations gennemsnit, baseret på en enkelt stikprøve. Test af gns. fra to afhængige stikprøver 18

  19. Hvad er fordelen ved afhængige stikprøver? Procedure ved sammenligning af gennemsnit i 2 afhængige stikprøver: For hvert matchende par beregnes differencen, d d = (hvilepuls uden app) – (hvilepuls med app) Differencerne kalder vi Test af gns. fra to afhængige stikprøver 19

  20. For at teste hypotesen om ens gennemsnit, H0: µ1 = µ2, tester man H0: µd = 0, svarende til differencen (µ1-µ2). Man tester på samme måde som ved 1 stikprøve. Teststørrelsen er: Test af gns. fra to afhængige stikprøver 20

  21. 1. Forudsætninger Stikprøven er udvalgt simpelt tilfældigt. For n < 30 forudsættes, at populationen er normalfordelt og t benyttes som teststørrelse. Dette er vigtigt ved små stikprøver Test af gns. fra to afhængige stikprøver 21

  22. 2. Hypoteser H0: µd = 0 (hvilket er dss., at de to populations gennemsnit er ens) Ha: µd < 0 3. Teststørrelse Test af gns. fra to afhængige stikprøver 22

  23. Test af gns. fra to afhængige stikprøver 4. Omregning til en P-værdi z = -1,98 P = (z < -1,98) ≈ 2 % 23

  24. 5. Konklusion P-værdien er under 5 %, hvorfor nul-hypotesen afvises. Der er gode beviser mod nul-hypotesen, hvorfor den afvises. Der er grund til at tro, at den gennemsnitlige hvilepuls er lavere for brugere af applikationen. Test af gns. fra to afhængige stikprøver 24

  25. Opgave: Load tider Efter skift til et nyt webhotel er downloadtiden på forskellige elementer (tekstsider, billeder, videoer etc.) på en hjemmeside blevet målt. Downloadtiderne målt i millisekunder fremgår af tabellen. Er den gns. downloadtid blevet mindre? 25

More Related