540 likes | 779 Views
Þáttagreining. 10-3-2014 Stefán Hrafn Jónsson. Röð aðgerða við greiningu gagna. Kanna dreifingu (tíðnitafla) og frágang gagna. Kanna sérstaklega vel hvort missing values séu rétt skilgreind Keyra og skoða fylgnitöflu milli atriða Keyra þáttagreiningu stundum oftar en einu sinni
E N D
Þáttagreining 10-3-2014 Stefán Hrafn Jónsson
Röð aðgerða við greiningu gagna • Kanna dreifingu (tíðnitafla) og frágang gagna. • Kanna sérstaklega vel hvort missingvalues séu rétt skilgreind • Keyra og skoða fylgnitöflu milli atriða • Keyra þáttagreiningu • stundum oftar en einu sinni • Keyra atriðagreiningu • stundum oftar en einu sinni ef fyrstu niðurstöður benda á að breytinga sé þörf • Sameina atriði í kvarða • annað hvort með compute skipun eða með þáttagreiningaskipun • Ef atriði snúa mismunandi þá þarf að snúa sumum áður en lagt er saman með compute (sjá bls 669-670 í Field) • Fjölbreytu aðhvarfsgreining eða aðra fjölbreytu greiningu
Þáttagreining skiptist í nokkur skref: • Draga út undirliggjandi þætti samkvæmt tilteknum forsendum 1b Að ákvarða fjölda þátta sem haldið er eftir • Snúa þáttum þannig að merking þeirra sé auðveldari í túlkun og meðferð • Þættir túlkaðir • Búin til þáttastig (e. factorscore) Notum niðurstöðurnar í áframhaldandi tölfræðigreiningu Lærum að nota SPSS til að framkvæma liði 1,2 og 4 auk þess að aðstoða við lið 3
Markmiðið • Skýrasemmestafdreifinguallrabreytannasemvið notum í þáttagreiningumeðsemfæstumþáttum • Aðeinfaldaflókiðfylgnifylki • Efviðerummeð7 breytur og höldumeftir 7 þætti, þáskýrumviðalladreifinguna, þ.e. 100% skýring • Fyrstiósnúniþátturinnskýrirmest, sánæstimestafþvísemeftirero.s.frv. Eftirað6 af7 þáttumhafaskýrtsitt „tekur” sá7. restina. • En of margirþættireinfaldaekkiflókiðfylgnifylki. • Viðviljumeinfaldagögnin. Aðverameð7 þættifyrir7 breytureinfaldarekkineitt.
Fylgnifylki Hversu margar duldar breytur eru líklegar til að skýra fylgnina á milli þessa atriða?
Fylgni á milli atriða Þáttagreining byggir fylgnitölum á milli atriða og finnur á svipaðan hátt og áður (0,7*0,7=0,49), fylgni á milli þátta og atriða sp4 sp5 sp1 sp2 sp3 0,74 -0,01 0,5 0,6 0,00 0,6 0,6 0,02 0,6 0,02 Takið eftir fylgni milli sp5 og annarra atriða
Hvað geta margir þættir skýrt fylgnina á milli atriðanna? • Þáttgreining snýst um að finna þessa þætti • Finna hvað þeir eru margir • Gefa þessum þáttum nafn og túlka þá
Hvað geta margir (eða fáir) þættir skýrt fylgnina á milli atriðanna? • Þáttgreining snýst um að finna þessa þætti • Finna hvað þeir eru margir • Gefa þessum þáttum nafn og túlka þá
Þættir geta • mögulega verið frá einum og í mesta lagi jafn margir og breyturnar (atriðin) • þáttagreining snýst um að velja fáa þætti sem skýra sem mest af breytileika í atriðunum
Mælingalíkan Dulin breyta D2 Dulin breyta D1 -0,03 0,006 0,99 0,8 0,8 0,9 0,9 sp4 sp5 sp1 sp2 sp3 0,74 0,5 0,6 0,6 0,6 0,6 Villuþáttum (e1 til e5) sleppt til að einfalda framsetningu líkansins
Þáttur (e. Factor, Component) Dulin breyta (e. Latent variable) Vídd Mælingalíkan Dulin breyta D2 Dulin breyta D1 Þáttahleðsla 0,99 0,8 0,8 0,9 0,9 sp4 sp5 sp1 sp2 sp3 Atriði (e. item) e1 e2 e4 e5 e3
Hvertereigiðgildifyrirþáttinn D1? Dulin breyta D1 0,006 0,8 0,8 0,9 0,9 sp4 sp5 sp1 sp2 sp3
Hvertereigiðgildiþáttar D1? Dulin breyta D1 0,006 0,8 0,8 0,9 0,9 sp4 sp5 sp1 sp2 sp3 Eigiðgildiþáttar D1 er 2,9 Hverterhæstamögulegaeigiðgildiefviðerummeð 5 atriði (5 breytur)? Hversuhátthlutfaller 2,9 afsvarinuviðspurningunnihéraðofan?
Halda áfram með sýnidæmi • SPSS vinna með viðhorf til fóstureyðinga
Meira en ein vídd á sama hugtaki • Greind • V = Verbal, Q = Quantitative, A = Analytical • Mismunandi margar víddir í greind eftir kenningum og mælitækjum • Oft fylgni á milli vídda/þátta • Tekjur • Launatekjur • Fjármagnstekjur • Oft er fylgni á milli
Principal Component (PC) • Meginmarkmiðiðþáttagreiningareraðhámarkaskýrðadreifingu á öllumbreytunumsemeru í fylgnifylkinu • Eittafmarkmiðumlínulegraraðhvarfsgreiningarereinnigaðhámarkaskýrðadreifingu, en þáeinnartiltekinnarbreytu (fylgibreytunnar)
Að draga út þætti og túlka • Fjöldi þátta • Við viljum einfalda flókið fylgnifylki • Færri þættir, einfaldari niðurstaða • Án þess þó að blanda saman mælingum sem ekki ætti að blanda saman
Eigenvalue • Efallarþáttahleðslur, háar og lágar (< 0,3) erusettar í annaðveldi og alltlagtsamanfáumviðgildisemkallasteigiðgildieða eigenvalue • Efviðleggjumsamanöll eigenvalue getursú summa mestverið = fjöldiatriða • Ef k erfjöldiatriða og viðdrögum út k þættiþáerheildarsummaeigingilda = k • Meðal eigenvalue þáttaerþá k/k = 1.
Eigenvalue • PC vinnur þannig að draga út þátt sem skýrir sem mest af dreifingu breytanna í fylgnifylkinu • Fyrsti þáttur skýrir mest • Síðan er haldið áfram að draga út þætti sem skýra sem mest af afganginum • Næstu þættir skýra minna og minna hver • Hámark er hægt að skýra 100% af dreifingu þeirra breyta sem eru í úrvinnslunni • Ef þættir eru jafn margir breytum þá höfum við skýrt alla dreifingu.
Þáttaskýring og eigingildi • Sleppum gl 20
Draga út þætti • SPSS dregur út þætti fyrir okkur þannig að þeir skýri sem mest af dreifingu breytanna (atriðanna) sem við mælum. • Ef við erum með k atriði þá getum við valið 1 til k þætti. • Við veljum þætti með 2 aðferðum. • A) þátt sem er með hærra eigiðgildi en 1 (viðmið Keiser). • B) Þátt sem skýrir umtalsvert meira en næsti þáttur á eftir (þegar línan er ekki lengur flöt) skriðuprófið
Fjöldi þátta • Hægt er að nota tvö viðmið til að ákvarða fjölda þátta. • Eigenvaluehærra en 1,0 (viðmið Keiser) • Tökum þætti fyrir ofan beygju (olnboga) í skriðuprófi (skriðupróf, screetest)
Fjöldi þátta • Ef skriðuprófi og eigenvalue > 1 ber ekki saman þarf að meta niðurstöður útfrá kenningarlegum forsendum • Til að láta skriðupróf ráða (ef annað en eigenvalue > 1,0) þarf að keyra þátttagreiningu aftur • Skrifa inn fjölda þátta undir extract
Vinsældir fólksDæmi úr Field, bls 620-627-eldri (2.) útgáfa • Nokkrar mælingar á persónuleika fólks • Félagsleg færni – Social skills • Hversu áhugsamt fólk er – Interest • Hversu mikið fólk talar við aðra – Talk1 • Hlutfall tíma sem fólk talar um sjálft sig – Talk2 • Sjálfselska/eigingirni – Selfish • Tilhneiging til að ljúga að fólki – Liar
Field finnur 2 þætti • Teiknum þættina upp í hnitakerfi (Field bls 622) á töfluna • Hornrétt hnitakerfi (Field bls 622) • Ef við vitum gildi (staðsetningu) punkts á annarri víddinni, segir það eitthvað um gildi (staðsetningu) á hinni víddinni? • Hornskakkt hnitakerfi (Field bls 635) • Ef við vitum gildi punkts á annarri víddinni vitum við eitthvað um gildi á hinni víddinni?
Þáttaskýring og eigingildi • Notum Excel skjal á skráarsvæði
Túlkun þátta og nafngiftir • Að túlka þætti er að lýsa þáttum með tilvísun í þær breytur sem hlaða hátt á þáttinn • Nafngift felst í að finna eitt (eða fá) orð sem lýsir í hnotskurn duldu breytunni • Lágar þáttahleðslur eru ekki notaðar í túlkun þátta • Hvað er lá þáttahleðsla? Misjafnt hvað miðað er við, en algengt er að miða við hleðslur undir 0,4 eða 0,3 • Ef hleðslur eru á meðal lágar (á mörkunum) er stuðst minna við þær í túlkun þátta
Dæmi um túlkun og nafngift duldinnar breytu (frá Field) • Dulda breytan Tillitsemi mælir einkenni fólks sem snýr að því hversu mikið eða lítið það lýgur að fólki, hversu mikið eða lítið það talar um sjálft sig og hversu sjálfselkst það er. Fólk getur verið með mjög hátt gildi á tillitsemi, þá lýgur það sjaldan eða aldrei, talar lítið um sjálft sig er ekki sjálfselskt. Fólk getur verið með lágt gildi á tillitsemi, þá er það.....
Dæmi um dulda breytu frá Field • Hin dulda breytan er Félagslyndi sem mælir einkenni fólks sem snýr að því.....
Fjöldi í úrtaki (sem svara) • Erfitt hefur reynst að segja hversu marga einstaklinga (svör þátttakenda) þarf í þáttagreiningu • Sumir segja 10 (eða 10-15) sinnum fleiri þátttakendur en fjöldi breyta • Sumir segja 10-15 sinnum fleiri upp að 300 manna úrtaki. • Aðrir segja um stærð úrtaks: • 100 manna slæmt • 300 manna gott • 1000 mjög gott (excellent)
Úrtaksstærð • Rannsóknir hafa sýnt að til þess að fá stöðuga (trausta) niðurstöðu þá skiptir máli úrtaksstærð og hversu háar þáttahleðslur eru. • Ef 4 þáttahleðslur eru hærri en 0,6 þá er úrtaksstærð ekki stórt atriði (mega vera tiltölulega fáir) • Því fleiri þátttakendur því betra • SPSS býður uppá próf til að kanna hvort gögn henti í þáttagreiningu
Bartlett‘s Test of Sphericity • Þarf að vera marktækt sig < 0,05 • KMO próf þarf að vera með gildi yfir 0,5 til að hægt sé að þáttagreina gögnin • Milli 0,5 og 0,7 er mediocre (slakt) • Milli 0,7 og 0,8 gott • Milli og 0,8 og 0,9 mjög gott • Yfir 0,9 superb
Eigenvalue • PC vinnur þannig að draga út þátt sem skýrir sem mest af dreifingu breytanna í fylgnifylkinu • Fyrsti þáttur skýrir mest • Síðan er haldið áfram að draga út þætti sem skýra sem mest af afganginum • Næstu þættir skýra minna og minna hver • Hámark er hægt að skýra 100% af dreifingu þeirra breyta sem eru í úrvinnslunni • Ef þættir eru jafn margir breytum þá höfum við skýrt alla dreifingu.
Hvernig ákveðum við fjölda þátta? • Viðmið Keiser segir að draga eigi út þætti með eigingildi hærra en 1,0 (Keiser criteria) • Hugmyndin er í raun sú að • Þáttur er ansi aumur ef hann nær ekki að skýra meira en meðal breyta • Aumingjar fá ekki að vera með
Skriðupróf • Aðrir notast við svokallað skriðupróf Gleymum aldrei kenningarlegum forsendum.
Fylgni á milli vídda • Þá þarf að nota annarskonar snúning • Meira um snúning í næsta tíma
Þáttastig • Einfaldasta leiðin: • Hentar vel ef við erum með einn þátt. Að leggja saman þær breytur (atriði) sem hlaða á sama þátt eftir að hafa keyrt atriðagreiningu (chronbacks alpha ofl.) • Þegar við leggjum atriðin saman þá eru öll atriðin með sama vægi. • Við getum sagt við margföldum hvert atriði með einum áður en lagt er saman
Þáttastig Þær flóknu • SPSS reiknar aðhvarfsgreiningarstig (regressionscore) • Þá er þáttastig sett saman úr öllum atriðum en hvert atriði vegur ekki jafn þungt. • Hvert atriði er margfaldað með sér stuðli sem byggir á þáttahleðslum. • Flókna aðferðin er stundum nauðsynleg ef við erum með 2 eða fleiri þætti.
Fleiri flóknar • Aðferðir Anderson-Rubin og Bartlet eru útfærslur á aðhvarfsgreiningaraðaðferðinni. Gefa svipaðar niðurstöður, • Bartlett leiðréttir kerfisbundna skekkju í Regression aðferðinni en getur gefið fylgni á milli hornréttra þátta sem er slæmt ef við viljum halda þeim hornréttum (án fylgni) • Anderson-Rubin er leið til að viðhalda kostum regressionþáttastiga en gefa þáttastig sem eru ekki með fylgni hvert við annað.
Þáttastig • Einfaldasta leiðin er að leggja saman atriði • Ef reikna á þáttastig fyrir 2 eða fleiri þætti og nota í áframhaldandi greiningu (t.d. aðhvarfsgreiningu) þarf að huga vel að því hvort breyturnar (þáttastig, þættirnir) eigi að hafa fylgni sín á milli • Að leggja saman tvo kvarða með compute tryggir ekki að engin fylgni sé á milli þessara breyta • Til að tryggja það þarf að nota Anderson-Rubin aðferðina
Þáttastig • Þegar þáttagreining kemur fram með einn þátt þá er ekki mikill munur á einföldum samanlögðum kvarða, regression aðferðinni eða Anderson-Rubin ef áreiðanleikinn er góður.
Hornréttur snúningur • Möguleg þáttalausn fyrir snúning
Hornréttur snúningur • Möguleg þáttalausn eftir snúning • Þættir hafa nú tilvísanir í færri atriði • Tilvísanirnar eru sterkari (hærri fylgni, hærri þáttahleðslur) • Þættirnir eru auðveldarí í túlkun • Sjá einnig dæmi í Field bls. 635