540 likes | 861 Views
Aðferðafræði II 17-10-2013. Upptaka 6 Kafli 8 Stefán Hrafn Jónsson. Dagskráin í dag og næstu daga. 16.10 Kafli 8 Stefán Hrafn 17.10 Kafli 8. Aníta 23.10 Upphaf kafla 9. Stefán Og t æknileg atriði við próftöku 24.10 Próf í kennslustofu í tíma í stofu HT 105.
E N D
Aðferðafræði II17-10-2013 Upptaka 6 Kafli 8 Stefán Hrafn Jónsson
Dagskráin í dag og næstu daga • 16.10 Kafli 8 Stefán Hrafn • 17.10 Kafli 8. Aníta • 23.10 Upphaf kafla 9. Stefán • Og tæknileg atriði við próftöku • 24.10 Próf í kennslustofu í tíma í stofu HT 105. • Þröngt verða sáttir að sitja
Kafli 8 í dag • Um upptökur o.fl. • Tilgátuprófun • Dæmi bls 183 (mean, onesample) • Fimm skref tilgátuprófunar • Dæmi bls 205 (proportion, onesample) (ekki í upptöku) Lykilatriði að vita hvort við erum með eitt eða fleiri úrtök • Dæmi á töflu og í Socrative • Spurningar og svör (QA)
Á morgun • Aníka • T dreifingin • Að velja alpha mörk • Type I error • Type II error • Annað
Höfundaréttur • Þessar glærur og þessi upptaka er aðeins ætlaðar til notkunar í kennslu og námi í Félags og mannvísindadeild Háskóla Íslands í námskeiðinu: • Allur réttur áskilinn, Stefán Hrafn Jónsson • Notkun fyrir önnur námskeið eru háð skriflegu leyfi kennara
Gefið Meðaltal í þýði 140 kr Staðalfrávik í þýði 30 kr Úrtak N = 100 Einfalt tilviljunarúrtak Samkvæmt central limit theorem þá er meðaltal úrtakadreifingarinnar 140, sama og í þýði . Staðalfrávik úrtakadreifingar er 3 og er reiknað frá staðalfráviki þýðis deilt með kvaðratrót af úrtaksstærð eða 30/10 (kvaðrat rót af 100 er 10) 143 er eitt staðalfrávik (úrtakadreifingar) fyrir ofan meðaltal 137 er einu staðalfrávíki fyri neðan meðaltal. Eitt staðalfravik er oft birt sem eitt Z gildi Gefið Meðaltal í þýði 140 kr Staðalfrávik í þýði 30 kr Úrtak N = 100 Spurt er: Hverjar eru líkurnar á að eitt úrtak af stærð 100 úr þessu þýði gefi meðaltal sem er á bilinu 134 til 146? Lykill hér að vita að 134 er tveimur staðalfrávíkum undir meðaltali. Hér erum við að tala um er staðalfrávikum úrtakadreifingar. Tvö staðalfrávik undir meðaltali jafngildir -2 (tveimur) Z gildum Við þurfum oft að reikna þetta Z gildi með formúlu (sjá síðar)
H0 : Núlltilgáta • Segir að enginn munur sé á meðaltölum í þessum 2 þýðum • Munur sem fram kemur er tilkominn vegna tilviljunarúrtaks • H1: Rannsóknartilgáta • Segir að munur sem kemur fram sé tilkominn vegna þess að það sé raunverulegur munur á meðaltölum í þessum tveimur þýðum.
Svör dæmi 8.1 • Alpha Form Z(critical) • .05 Einhliða Rétt svar er 1,65 • .10 Tvíhliða Rétt svar er 1,65 • .06 Tvíhliða Rétt svar er 1,88 • .01 Einhliða Rétt svar er 2,33 • .02 Tvíhliða Rétt svar er 2,33 • SP8.1b • Alpha Form N (fjöldi í þýði) t(critical) • .10 Tvíhliða 31 Rétt svar er 1,697 • .02 Tvíhliða 24 Rétt svar er 2,492 • .01 Tvíhliða 121 Rétt svar er 2,617 • .01 Einhliða 31 Rétt svar er 2,457 • .05 Einhliða 61 Rétt svar er 1,671
Kafli 8 • Ýmist notast við Z próf eða t-próf • Z próf er einfaldara og því reiknað þegar það á við sérstaklega í höndunum. • Notum t-próf (onesamplet-test) þegar við vitum ekki sigma (staðalfrávik þýðis) og þegar N < 100 • Í SPSS notum við nánast alltaf t-próf því Z og t-próf renna saman þegar N > 100 (sumir miða við 120)
Klára 8. kafla með formúlu á tússtöflu • Z obtained for proportions • Ef við vitum hlutfall í þýði og viljum vita hvort hópur (annað þýði, undirhópur) er með annað hlutfall þá er þessi formúla notuð (teikna á tússtöflu): • Zreiknað=Ps-Pu /(SQR(Pu(1-Pu)/N) • Dæmi bls. 205 • Z er reiknað þegar N er stórt. Bókin glímir ekki við próf fyrir hlutföll með smáu N þess vegna sleppum við því líka.
8. kafli • Öll grunnatriði í marktektarprófum kynnt í kafla 8. • Núlltilgátan segir að ekki sé munur. Hvort heldur sem um er að ræða hlutföll eða meðaltöl • Flest tölfræðipróf felast í að finna líkurnar á niðurstöðu úrtaks komi fram ef núlltilgátan er rétt. • Fimm skrefa ferlið er grunnur af tölfræðiprófum í námskeiðinu og bókinni. • Breytilegt frá einu próf til annars hvað fer í hvert skref. • Ef við getum spáð fyrir um stefnu sambandsins (a er hærri en b) frekar er bara að það sé munur (a er ekki jafnt og b) þá erum við með einhliða próf (onetail test).
8. kafli • Rannsakandi getur gert tvennskonar villur (í viðbót við klaufavillur) í tilgátuprófum • Alpha (tegund 1) villu þegar við höfnum núlltilgátu þegar hún er rétt . Höfnunarvilla • Beta (tegund 2) villu þegar við höfnum ekki núlltilgátu þegar hún er röng. Fastheldnisvilla
Fjalla almennara um tilgátuprófun • Fimm skref tilgátuprófunar • Z(vendi) og Z(reiknað) • Einhliðapróf og tvíhliðapróf • Type 1 (alfa) og Type 2 (beta) error • Höfnunarmistök og fastheldnimistök
Upprifjun • Við notum kenninguna um úrtakadreifingu sem grunn til að meta líkur á að úrtak komi úr tilteknu þýði eða ekki. • Eða hvort tveir hópar (tvö úrtök) komi úr sama þýði • Við notum það til að meta hvort tölfræðilega marktækur munur sé á milli hópa
Við byrjum á því að reikna • Tölfræðipróf fyrir einn hóp. One sample • Meðaltal eins úrtaks borið saman við meðaltal þýðis þegar það er vitað. • Afar sjaldgæft að við vitum meðaltal þýðis • Gagnlegt að byrja á einföldu prófi sem fyrsta skref inn í heim tilgátuprófunar
Tilgátuprófun • Tilgátuprófun hjálpar okkur að að álykta um mælanlegan mun milli hópa • Nokkur dæmi: • Gengur stúlkum betur í námi en piltum? • Líður börnum einstæðra forledra verr í skóla en börnum þar sem tveir forledrar eru í heimili? • Eru karlar með hærri laun en konur? • Eða er þetta bara flökt í úrtaki?
Eru börn unglingsmæðra líklegri til að eignast börn á unglingsárum en aðrir? • Er sálfræðiaðtoð árangursríkari en læknisaðstoð sem meðferð við depurð? • Er dánartíðni hærri í löndum þar sem ríkir ójöfnuður?
Ef við tökum eitt úrtak N=100, hverjar eru líkurnar á því að þetta eina úrtak sé með meðaltal: • Lægra en 134 kr? • Hærra en 146 kr? • Annað hvort lægra en 134 kr eða hærra en 146kr. • Hærra en 149 kr? • Lægra en 128 kr?
Tilvísun í úrtak björgunarsveitarfólks og aldur Íslendinga frá í síðasta tíma. Ef við vitum meðaltal og staðalfrávik í þýði þá getum við metið líkur þess að eitt tiltekið úrtak sem við tökum komi úr þessu tiltekna þýði. Við setjum fram tvær tilgátur sem skýringu þess að meðaltal úrtaks (úrtak björgunarsveitar-manna) er annað en meðaltal þessa tiltekna þýðis (allra Íslendinga).
H1 og H0 • Fyrri tilgátan, rannsóknartilgátan, H1, er að það sé raunverulegur aldursmunur á félögum í björgunarsveit og fullorðnum Íslendingum. • Seinni tilgátan, núlltilgátan, H0er að það sé enginn raunverulegur munur heldur sé sá munur sem mælist hafi tilkomið vegna tilviljunar.
Tilgátuprófun • Gengur út á að reyna að hafna H0 • Ýmist hafnar rannsakandi H0 eða tekst ekki að hafna H0 • Ef að það eru litlar líkur á að H0 sésönn (minni líkur en alfamörkin. Alfa er oft 0,05) • Ef það eru minni en 5% líkur á að eitt úrtak úr þessu þýði sé með svo hátt eða látt meðaltal • þá höfnum við núlltilgátunni.
Fimm stig tilgátuprófunar • 1. Setjum fram forsendur okkar. Könnum hvort kröfum tölfræðiprófs séu fullnægt. • 2. Setjum núlltilgátu fram með formlegum hætti • 3. Veljum úrtakadreifingu og finnum criticalregion, höfnunarsvæði. Sem dæmi, þá er höfnunarsvæði það svæði úrtakadreifingar sem er handan (beoynd) 1,96 eða -1,96
4. Reikna prófið • 5. Taka ákvörðun og túlka niðurstöður prófsins
1. Forsendur og kröfur prófsins Er t.d. meðaltal við hæfi fyrir þessa breytu. Er úrtakið tilviljunarúrtak? (random) Er N nægilega stórt fyrir þetta tiltekna próf? Vitum við meðaltal þýðis og staðalfrávik þýðis?
Setjum fram tilgátur Dæmi í bók: H0 : μ = 7.2 H1 : μ ≠ 7.2 Dæmi úr síðasta tíma: H0 : μ = 45,47 H1 : μ ≠ 45,47
Veljum úrtakadreifingu og finnum höfnunarsvæði • Ef við styðjumst við normaldreifinguna þá er svokallað Z-próf við hæfi • Stærð höfnunarsvæðis er jöfn alfa. • Z critical = er það Z gildi sem afmarkar höfnunarsvæði. • Z critical er nefnt Z (vendi) á íslensku • Z (vendi) er 1,96 ef við erum með alfa mörk = 0,05 og tvíliða próf
Einhliða eða tvíhliðapróf? Dæmi um tvíhlíðapróf H1 : μ ≠ 7,2 (þ.e. μ er annað hvort hærra eða lægra en 7,2, tvær áttir) Dæmi um einhliðapróf H1 : μ 〉 7.2 Annað dæmi: H1 : μ 〈 7.2
Reiknum prófið • Í þessum kafla reiknum Z gildi og berum saman við Z(vendi). • (formúla 8.1 í kennslubók, bls 186) • Z (reiknað)= • Berum Z(reiknað) saman við Z(vendi)
Ef Z (reiknað)er handan Z (vendi) (beyond) • Það er lægri ef við erum með Z (vendi) sem er mínus tala [t.d. Z (vendi) = -1,65] • Hærri ef við erum með Z (vendi) sem er plústala • Ef Z (reiknað)er handan Z (vendi), þá er H0 hafnað og ályktað að úrtakið sé tekið úr öðru þýði en það sem borið er saman við • Þá er um tölfræðilega marktækan mun að ræða. • Marktækur munur á meðaltali þýðis og meðaltali úrtaks.
Tökum ákvörðun • Ef Z (reiknað)er handan (beyond) Z (vendi) þá • lendir prófgildi á höfnunarsvæði • höfnum við núlltilgátu Túlkun felur í sér tilvísun í hvort það sétölfræðilega marktækur munur á hópum og að úrtakið sé þar með ekki tekið úr sama þýði
Table 8.1 • Ef gildi prófsins (test statistics) er í höfnunarsvæðinu, (handan Z (vendi)) þá höfnum við H0, núlltilgátu, munurinn er tölfræðilega marktækur • Ef gildi prófsins (test statistics) er ekki í höfnunarsvæðinu, (ekki handan Z (vendi)) þá höfnum við ekki H0, núlltilgátu, munurinn er ekki tölfræðilega marktækur
Einhliða eða tvíhliða próf • Alfa segir til um stærð criticalregion • Höfnunarsvæði er = alfa. • T.d. Ef alfa er = 0.05 þá er höfnunarsvæðið 5% af flatarmáli undir kúrfunni • Staðsetning höfnunarsvæðis (critical region) ræðst af því hvort við erum með einhliða eða tvíhliða próf. • Við munum að tvíhliðapróf með alfa = 0.05 afmarkast af tveimur Z gilduM [Z (vendi)], þ.e. 1,96 og -1,96
Hér er höfnunarsvæðinu, 0,05 skipt á 2 hliðar kúrfunnar, því tvíhliðapróf • Þá er Z (vendi), -1,96 og +1,96
Þegar við erum með einliðapróf • Þá er allt höfnunarsvæði sömu megin, á einni hlið normalkúrfunnar. Þá erum við bara með Z (vendi) Öðru megin, og því miðum við líka við annað gildi. Það er það Z gildi sem gefur areabeyond Z = 0,05
Bls 193 tafla 8.2 H1 : μ ≠ Tvíhliða H1 : μ 〉 Einhliða H1 : μ〈 Einhliða Ef alfa = 0.05 H1 : μ ≠ þá er Z (vendi) = +/- 1,96 H1 : μ 〉 þá er Z (vendi) = + 1,65 H1 : μ〈 þá er Z (vendi) = - 1,65
Tafla 8.3 bls 193 sýnir Z(vendi) • Fyrir önnur alfa mörk. T.d. 0,1 0,01 0,001
Dæmi úrbók bls 193 • Meðaltal allra nemenda í tilteknum skóla er 17,3 og staðalfrávik (þýðis) er 7,4. • Meðaltal 100 félagsfræðinemenda mælist 19,2 • Mæling á sophistication (líklega tilbúið dæmi)
Fimm skrefa tilgátuprófun • 1. Forsendur: Það er búið að reikna meðaltal þannig við gerum ráð fyrir að um sé að ræða jafnbila-hlutfallskvarða • Úrtakið er 100 því getum við gert ráð fyrir að úrtakadreifing sé normaldreifð samkvæmt central limit theorem. (Úrtakið nægilega stórt)
2. Setja fram 0 tilgátu • H0 : μfélagsfr= 17,3 • H1 : μfélagsfr〉 17,3 • Það er í raun skylda að setja fram tilgátu áður en meðaltal hóps er reiknað.
3. Velja úrtakadreifingu og skilgreina höfnunarsvæði • Við lögðum af stað með alfa = 0,05 • Áður samþykktum við að úrtakadreifing væri normaldreifð • Prófið er einhliða (H1 er með stefnu í eina átt) • Þá er Z (vendi) = 1,65 (sjá töflu 8,2)
4, reiknum prófið (z próf) • Reiknuð (reiknað) • Z obtained • (19,2-17,3) / (7,4 * 10) = 2,57 • 10 er kvaðrat rót af 100 • Er Z (reiknað) stærra eða minna en Z (vendi)?
Tökum ákvörðun • Z (reiknað)er stærra en Z (vendi) • Félagsfræðinemar í þessu dæmi eru því marktækt hærri á þessum ágæta kvarða en nemendur skólans. Þeir eru hærri að meðaltali.
Að velja alfa mörk • Þegar við höfnum núlltilgátu þá erum við að segja að niðurstaða (t.d. meðaltal úrtaks) sé mjög ólíklega komið úr tilgreindu þýði • Með því að velja alfamörk þá erum við að segja hvað við eigum við með óliklegt • Við gætum í 5% tilfella verið að hafna H0 tilgátu þegar tilgátan er í raun og veru sönn.
Af hverju ekki að lækka alfamörk og minnka líkur á að við gerum þessi mistök? • Því þetta eru ekki einu mistökin sem við getum gert í tilgátuprófun • Tafla 8,5
Við getum ekki samtímis minnkað líkur á að Villa af gerð 1 komi fram og líka minnkað líkur á að villa 2 komi fram
Normaldreifingin er ekki eina dreifingin • Dreifingin sem lýsir úrtakadreifingu. • t-dreifing ef N er lægra en 100. • t-dreifing tekur breytingum eftir því hversu úrtakið er stórt. • Þegar úrtak er stórt eru t-dreifing og Z-dreifing nánast eins • Þess vegna er oft reiknað t-próf sama hvað úrtakið er stórt
t-dreifing • Er breytileg eftir úrtaksstærð • t-taflan er sett fram á allt annan hátt en Z taflan. • Í raun eru gefin upp t-vendi fyrir ýmis alfa mörk. • Bæði einhliðapróf og tvíhliðapróf.