470 likes | 980 Views
Analiza glavnih komponent ter eksploratorna in konfirmatorna faktorska analiza Psihologija - magistrski študij Metodologija psihološkega raziskovanja 2003/04 Gregor Sočan Katedra za psihološko metodologijo. gregor.socan@ff.uni-lj.si. O čem bomo govorili?.
E N D
Analiza glavnih komponent ter eksploratorna in konfirmatorna faktorska analiza Psihologija - magistrski študijMetodologija psihološkega raziskovanja2003/04Gregor SočanKatedra za psihološko metodologijo gregor.socan@ff.uni-lj.si
O čem bomo govorili? • Opredelitev EFA in PCA: podobnosti in razlike. • Nekateri specifični problemi pri uporabi EFA. • Posebni primeri PCA in EFA. • Konfirmatorna FA. • Primerjava in evalvacija treh metod.
Analiza glavnih komponent (Principal Component Analysis, PCA; Pearson, 1901): “informacijo, vsebovano v n spremenljivkah, optimalno povzamemo s k nekoreliranimi obteženimi vsotami (komponentami)” Komponente so natanko določene z izmerjenimi spremenljivkami: Komponentai = bi1 X1 + bi2 X2 + … + bin Xn in obratno: Xiai1 K1 + ai2 K2 + … + aik Kk (=, če k=n) Prvih p komponent pojasni največji možni delež variance n spremenljivk.
Grafična ponazoritev: Komponente kot glavne dimenzije prostora spremenljivk.
(Eksploratorna) faktorska analiza (EFA): Iščemo “neopazljive”, “latentne” spremenljivke, s katerimi lahko pojasnimo korelacije med opazovanimi spremenljivkami. Korelacije med 3 testi sposobnosti: g 0,8 0,6 0,9 B P R Varianca h2(B) = 0,64 skupnih faktorjev h2(P) = 0,81 (komunaliteta) h2(R) = 0,36 0,36 0,19 0,64
Podobnost: Kot komponente so tudi faktorji spremenljivke oz. dimenzije. Razliki: EFA analizira le skupno varianco (komunaliteto). Faktorji so latentni: niso enaki obteženim vsotam spremenljivk.
Ali je PCA vrsta EFA? • Za: • z EFA in PCA pogosto dobimo zelo podobne rezultate; • vsak algoritem EFA vsebuje tudi PCA. • Proti: • rezultati lahko precej različni; • različni cilji; • različen empirični status komponent/faktorjev; • nerealna predpostavka o popolni komunaliteti.
Algoritmi EFA: • 1. FA največjega verjetja • (Maximum Likelihood FA, MLFA) • “maksimizira funkcijo verjetja za korelacije med spremenljivkami” • Matematično elegantna: • analitične standardne napake parametrov; • inferenčni testi; • asimptotično učinkovite ocene.
2. Metoda najmanjših kvadratov (Minres, Iterated principal factors, Principal-axis, ULS... ) “minimizira vsoto kvadriranih razlik med dejanskimi in ocenjenimi korelacijami med spremenljivkami” Empirično uspešnejša od MLFA, zlasti v neugodnih pogojih (Briggs & MacCallum, 2003; Sočan, 2003).
3. Metoda najmanjšega ranga • (Minimum Rank FA, MRFA) • minimizira varianco “ignoriranih” faktorjev; • ne producira kakršnihkoli negativnih varianc; • “pravilna” reducirana korelacijska matrika; • omogoča izračun % nepojasnjene komunalitete! • Po glavnih empiričnih lastnostih primerljiva z metodo najmanjših kvadratov.
Izbira algoritma odvisna tudi od preferenc uporabnika: • uporaba inferenčnih testov (MLFA) • stabilnost v neugodnih pogojih (Minres) • ocena nepojasnjene skupne variance (MRFA) • ...
Primer: Pearsonovi korelacijski koeficienti med rezultati 9 lestvic impulzivnosti (Zadravec, 2003) krepko: |r|>0,3 Imp1: Eysenckova lestvica imp., Pustol: Eysenckova lestvica pustolovskosti; Funkc.: funkcionalna imp.; Disfunk.: disfunkcionala i.; Imp2: Barrattova lestvica i.; Thrill: Zuckermanova lestvica pustolovskosti; Exper.: Zuckermanova lestvica iskanja izkušenj; Disinh.: Zuckermanova lestvica disinhibicije
Koliko faktorjev / komponent izločiti? V praksi nikoli ne izločimo “pravilnega” števila faktorjev! Interpretabilnost oz. uporabnost. Morda najpogosteje upo/zlorabljen: Kaiserjev kriterij: obržimo faktorje z lastno vrednostjo > 1; smiseln le pri PCA, vendar tudi tam vprašljiv.
2 preizkus pri metodi največjega verjetja: H0: vzorčni k = populacijski k (k: število izločenih faktorjev) k 2df p 1 337,0 27 .000 2 46,7 19 .000 3 10,5 12 .576
Težavi scree-testa: • neobjektivnost • v SPSS le za PCA (neprimerljiv z EFA!)
% pojasnjene skupne variance (komunalitete) pri metodi najmanjšega ranga
Rotacija: izboljšanje interpretabilnosti Pravokotne rotacije ohranjajo nekorelirane faktorje / komponente (“standard”: Varimax) Poševnokotne rotacije dopuščajo korelacije med faktorji. Nekoreliranost faktorjev vs. natančnost opisa.
ULS rešitve z dvema faktorjema brez rotacije ter s pravokotno in poševno rotacijo (krepko: a>0,40)
Dvofaktorska vs. trifaktorska rešitev: s tremi faktorji bolje zajamemo lestvice iskanja dražljajev. (Oblimin, krepko>0,5)
Kvantifikacija faktorjev / komponent • (faktorske točke/dosežki; factor scores): • natančne vrednosti le pri PCA • EFA: “nedoločenost” faktorjev - faktorske vrednosti lahko le ocenimo
Podatki za EFA / PCA: • dvosmerna matrika osebe spremenljivke • intervalni podatki (ekvivalentne razlike med vrednostmi) • linearne povezave so smiselne
Koliko oseb potrebujemo? Najpomembnejši dejavnik natančnosti rešitve: kombinacija števila oseb in povprečne komunalitete
Dihotomne (binarne) spremenljivke: Linearni model ne velja več! Včasih smiselno predpostaviti, da vrednosti temeljijo na zvezni latentni spremenljivki: analiza tetrahoričnih koeficientov. NOHARM ipd. modeli latentnih potez: povezava s teorijo odgovora na postavko (item-response theory) Za stabilne rezultate verjetno potreben velik vzorec!
Kvalitativne (nominalne) spremenljivke z več kot 2 vrednostima: Analiza homogenosti (alternativa PCA) 1. pretvorba v indikatorske spremenljivke 2. kvantifikacijska matrika: obtežitev indikatorskih spremenljivk, tako da maksimiziramo korelacijo s “komponento”
Trismerni podatki npr. osebe spremenljivke časovne točke Trismerna komponentna analiza: imamo: Namesto A, B, C: komponente oseb, spremenljivk in časovnih točk G: 3-D jedrna matrika: skrčena matrika podatkov
Kritike faktorske analize realnost obstoja faktorjev latentne spremenljivke tudi v “eksaktnih” vedah nedoločljivost faktorjev faktorji so razlagalne spremenljivke arbitrarnost rotacij faktorji so referenčni okvir, ne nujno realno obstoječe entitete domnevna neuspešnost pri odkrivanju znane strukture napačna uporaba metode privede do napačnih rezultatov
Kako se izogniti zmotnim rezultatom? • ustreznost podatkov (merski nivo, linearnost odnosov); • dovolj veliko število spremenljivk; • smiselna izbira spremenljivk; • velikost vzorca (odvisna od komunalitete); • izbira PCA / EFA / CFA kaj drugega; • odločitev o številu faktorjev; • izbira rotacije; • previdnost pri interpretaciji: faktorji lahko ustrezajo specifičnim strukturam, vendar to ni nujno!
KONFIRMATORNAFAKTORSKA ANALIZA: • Izhajamo iz vnaprejšnjih hipotez o faktorski strukturi: • število faktorjev in • faktorske uteži. V praksi določimo, katere uteži so enake 0 in katere so “proste”.
Izhodišče: osnovni model faktorske analize: = + = kovariančna matrika = matrika faktorskih uteži = simet. matrika korelacij med faktorji = diag. matrika unikvitet EFA: vsi elementi in diag. elementi so prosti (pri poševni rotaciji tudi izvendiag. elementi KFA: nekatere elemente fiksiramo
Ocenjevanje parametrov:reševanje sistema strukturnih enačb, dobljenih s primerjavo empirične in inplicirane kovariančne matrike.Metode:največje verjetje (ML)najmanjši kvadrati (ULS),obteženi najmanjši kvadrati (WLS)...
Implicirana (ocenjena) kovariančna matrika: Npr. 1 latentna spremenljivka, 2 opazovani spremenljivki: Strukturne enačbe: 12 = 12 + 11 12 = 12 22 = 22 + 22
Identifikacija: Parametre modela je možno enoznačno določiti le, če število prostih parametrov ni preveliko. t - pravilo: št. prostih parametrov < p(p+1)/2 (p = št. spremenljivk)
Ocenjevanje ustreznosti modela: • 2test, • glede na pojasnjeno varianco: GFI, AGFI… • glede na razliko med ocenjevanim in ničelnim modelom: NFI, NNFI… • glede na razlike med dejanskimi in reproduciranimi kovariancami: RMSEA, RMR...
Primerjava rešitev: EFA: iskanje strukture v novih, neraziskanih problemih KFA: preverjanje strukturnih hipotez v situacijah z dobro teoretično osnovo
Literatura: • Bollen, K.A. (1989).Structural equations with latent variables. New York: Wiley. /KFA • Gorsuch, R.L. (1983).Factor analysis. Hillsdale: Lawrence Erlbaum. /EFA • Kaplan, D. (2000).Structural equation modeling: Foundations and extensions. Thousand Oaks: Sage. /KFA • Nunnally, J.C. in Bernstein, I.H. (1994).Psychometric theory. New York: McGraw-Hill. /PCA, EFA, KFA • Stevens, J. (1996, 2001).Applied multivariate statistics for the social sciences. Mahwah, NJ: Laurence Erlbaum. /PCA, KFA