1 / 39

Analiza glavnih komponent ter eksploratorna in konfirmatorna faktorska analiza

Analiza glavnih komponent ter eksploratorna in konfirmatorna faktorska analiza Psihologija - magistrski študij Metodologija psihološkega raziskovanja 2003/04 Gregor Sočan Katedra za psihološko metodologijo. gregor.socan@ff.uni-lj.si. O čem bomo govorili?.

sinjin
Download Presentation

Analiza glavnih komponent ter eksploratorna in konfirmatorna faktorska analiza

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Analiza glavnih komponent ter eksploratorna in konfirmatorna faktorska analiza Psihologija - magistrski študijMetodologija psihološkega raziskovanja2003/04Gregor SočanKatedra za psihološko metodologijo gregor.socan@ff.uni-lj.si

  2. O čem bomo govorili? • Opredelitev EFA in PCA: podobnosti in razlike. • Nekateri specifični problemi pri uporabi EFA. • Posebni primeri PCA in EFA. • Konfirmatorna FA. • Primerjava in evalvacija treh metod.

  3. Analiza glavnih komponent (Principal Component Analysis, PCA; Pearson, 1901): “informacijo, vsebovano v n spremenljivkah, optimalno povzamemo s k nekoreliranimi obteženimi vsotami (komponentami)” Komponente so natanko določene z izmerjenimi spremenljivkami: Komponentai = bi1  X1 + bi2  X2 + … + bin  Xn in obratno: Xiai1  K1 + ai2  K2 + … + aik  Kk (=, če k=n) Prvih p komponent pojasni največji možni delež variance n spremenljivk.

  4. Grafična ponazoritev: Komponente kot glavne dimenzije prostora spremenljivk.

  5. (Eksploratorna) faktorska analiza (EFA): Iščemo “neopazljive”, “latentne” spremenljivke, s katerimi lahko pojasnimo korelacije med opazovanimi spremenljivkami. Korelacije med 3 testi sposobnosti: g 0,8 0,6 0,9 B P R Varianca h2(B) = 0,64 skupnih faktorjev h2(P) = 0,81 (komunaliteta) h2(R) = 0,36 0,36 0,19 0,64

  6. Podobnost: Kot komponente so tudi faktorji spremenljivke oz. dimenzije. Razliki: EFA analizira le skupno varianco (komunaliteto). Faktorji so latentni: niso enaki obteženim vsotam spremenljivk.

  7. Ali je PCA vrsta EFA? • Za: • z EFA in PCA pogosto dobimo zelo podobne rezultate; • vsak algoritem EFA vsebuje tudi PCA. • Proti: • rezultati lahko precej različni; • različni cilji; • različen empirični status komponent/faktorjev; • nerealna predpostavka o popolni komunaliteti.

  8. Algoritmi EFA: • 1. FA največjega verjetja • (Maximum Likelihood FA, MLFA) • “maksimizira funkcijo verjetja za korelacije med spremenljivkami” • Matematično elegantna: • analitične standardne napake parametrov; • inferenčni testi; • asimptotično učinkovite ocene.

  9. 2. Metoda najmanjših kvadratov (Minres, Iterated principal factors, Principal-axis, ULS... ) “minimizira vsoto kvadriranih razlik med dejanskimi in ocenjenimi korelacijami med spremenljivkami” Empirično uspešnejša od MLFA, zlasti v neugodnih pogojih (Briggs & MacCallum, 2003; Sočan, 2003).

  10. 3. Metoda najmanjšega ranga • (Minimum Rank FA, MRFA) • minimizira varianco “ignoriranih” faktorjev; • ne producira kakršnihkoli negativnih varianc; • “pravilna” reducirana korelacijska matrika; • omogoča izračun % nepojasnjene komunalitete! • Po glavnih empiričnih lastnostih primerljiva z metodo najmanjših kvadratov.

  11. Izbira algoritma odvisna tudi od preferenc uporabnika: • uporaba inferenčnih testov (MLFA) • stabilnost v neugodnih pogojih (Minres) • ocena nepojasnjene skupne variance (MRFA) • ...

  12. Primer: Pearsonovi korelacijski koeficienti med rezultati 9 lestvic impulzivnosti (Zadravec, 2003) krepko: |r|>0,3 Imp1: Eysenckova lestvica imp., Pustol: Eysenckova lestvica pustolovskosti; Funkc.: funkcionalna imp.; Disfunk.: disfunkcionala i.; Imp2: Barrattova lestvica i.; Thrill: Zuckermanova lestvica pustolovskosti; Exper.: Zuckermanova lestvica iskanja izkušenj; Disinh.: Zuckermanova lestvica disinhibicije

  13. Koliko faktorjev / komponent izločiti? V praksi nikoli ne izločimo “pravilnega” števila faktorjev! Interpretabilnost oz. uporabnost. Morda najpogosteje upo/zlorabljen: Kaiserjev kriterij: obržimo faktorje z lastno vrednostjo > 1; smiseln le pri PCA, vendar tudi tam vprašljiv.

  14. 2 preizkus pri metodi največjega verjetja: H0: vzorčni k = populacijski k (k: število izločenih faktorjev) k 2df p 1 337,0 27 .000 2 46,7 19 .000 3 10,5 12 .576

  15. Cattellov scree-test

  16. Težavi scree-testa: • neobjektivnost • v SPSS le za PCA (neprimerljiv z EFA!)

  17. % pojasnjene skupne variance (komunalitete) pri metodi najmanjšega ranga

  18. Vzporedna analiza

  19. Rotacija: izboljšanje interpretabilnosti Pravokotne rotacije ohranjajo nekorelirane faktorje / komponente (“standard”: Varimax) Poševnokotne rotacije dopuščajo korelacije med faktorji. Nekoreliranost faktorjev vs. natančnost opisa.

  20. ULS rešitve z dvema faktorjema brez rotacije ter s pravokotno in poševno rotacijo (krepko: a>0,40)

  21. Dvofaktorska ULS rešitev pred in po rotaciji (Varimax)

  22. Dvofaktorska vs. trifaktorska rešitev: s tremi faktorji bolje zajamemo lestvice iskanja dražljajev. (Oblimin, krepko>0,5)

  23. Kvantifikacija faktorjev / komponent • (faktorske točke/dosežki; factor scores): • natančne vrednosti le pri PCA • EFA: “nedoločenost” faktorjev - faktorske vrednosti lahko le ocenimo

  24. Podatki za EFA / PCA: • dvosmerna matrika osebe  spremenljivke • intervalni podatki (ekvivalentne razlike med vrednostmi) • linearne povezave so smiselne

  25. Koliko oseb potrebujemo? Najpomembnejši dejavnik natančnosti rešitve: kombinacija števila oseb in povprečne komunalitete

  26. Dihotomne (binarne) spremenljivke: Linearni model ne velja več! Včasih smiselno predpostaviti, da vrednosti temeljijo na zvezni latentni spremenljivki: analiza tetrahoričnih koeficientov. NOHARM ipd. modeli latentnih potez: povezava s teorijo odgovora na postavko (item-response theory) Za stabilne rezultate verjetno potreben velik vzorec!

  27. Kvalitativne (nominalne) spremenljivke z več kot 2 vrednostima: Analiza homogenosti (alternativa PCA) 1. pretvorba v indikatorske spremenljivke 2. kvantifikacijska matrika: obtežitev indikatorskih spremenljivk, tako da maksimiziramo korelacijo s “komponento”

  28. Trismerni podatki npr. osebe  spremenljivke  časovne točke Trismerna komponentna analiza: imamo: Namesto A, B, C: komponente oseb, spremenljivk in časovnih točk G: 3-D jedrna matrika: skrčena matrika podatkov

  29. Kritike faktorske analize  realnost obstoja faktorjev  latentne spremenljivke tudi v “eksaktnih” vedah  nedoločljivost faktorjev  faktorji so razlagalne spremenljivke  arbitrarnost rotacij  faktorji so referenčni okvir, ne nujno realno obstoječe entitete  domnevna neuspešnost pri odkrivanju znane strukture  napačna uporaba metode privede do napačnih rezultatov

  30. Kako se izogniti zmotnim rezultatom? • ustreznost podatkov (merski nivo, linearnost odnosov); • dovolj veliko število spremenljivk; • smiselna izbira spremenljivk; • velikost vzorca (odvisna od komunalitete); • izbira PCA / EFA / CFA kaj drugega; • odločitev o številu faktorjev; • izbira rotacije; • previdnost pri interpretaciji: faktorji lahko ustrezajo specifičnim strukturam, vendar to ni nujno!

  31. KONFIRMATORNAFAKTORSKA ANALIZA: • Izhajamo iz vnaprejšnjih hipotez o faktorski strukturi: • število faktorjev in • faktorske uteži. V praksi določimo, katere uteži so enake 0 in katere so “proste”.

  32. Izhodišče: osnovni model faktorske analize:  =  +   = kovariančna matrika  = matrika faktorskih uteži  = simet. matrika korelacij med faktorji  = diag. matrika unikvitet EFA: vsi elementi  in diag. elementi  so prosti (pri poševni rotaciji tudi izvendiag. elementi  KFA: nekatere elemente fiksiramo

  33. Ocenjevanje parametrov:reševanje sistema strukturnih enačb, dobljenih s primerjavo empirične in inplicirane kovariančne matrike.Metode:največje verjetje (ML)najmanjši kvadrati (ULS),obteženi najmanjši kvadrati (WLS)...

  34. Implicirana (ocenjena) kovariančna matrika: Npr. 1 latentna spremenljivka, 2 opazovani spremenljivki: Strukturne enačbe: 12 = 12 + 11 12 = 12 22 = 22 + 22

  35. Identifikacija: Parametre modela je možno enoznačno določiti le, če število prostih parametrov ni preveliko. t - pravilo: št. prostih parametrov < p(p+1)/2 (p = št. spremenljivk)

  36. Ocenjevanje ustreznosti modela: • 2test, • glede na pojasnjeno varianco: GFI, AGFI… • glede na razliko med ocenjevanim in ničelnim modelom: NFI, NNFI… • glede na razlike med dejanskimi in reproduciranimi kovariancami: RMSEA, RMR...

  37. Diagram poti (path diagram)

  38. Primerjava rešitev: EFA: iskanje strukture v novih, neraziskanih problemih KFA: preverjanje strukturnih hipotez v situacijah z dobro teoretično osnovo

  39. Literatura: • Bollen, K.A. (1989).Structural equations with latent variables. New York: Wiley. /KFA • Gorsuch, R.L. (1983).Factor analysis. Hillsdale: Lawrence Erlbaum. /EFA • Kaplan, D. (2000).Structural equation modeling: Foundations and extensions. Thousand Oaks: Sage. /KFA • Nunnally, J.C. in Bernstein, I.H. (1994).Psychometric theory. New York: McGraw-Hill. /PCA, EFA, KFA • Stevens, J. (1996, 2001).Applied multivariate statistics for the social sciences. Mahwah, NJ: Laurence Erlbaum. /PCA, KFA

More Related