250 likes | 731 Views
KONFIRMATORNA FAKTORSKA ANALIZA. Pregled vsebine. Razlika med eksploratorno in konfirmatorno FA Predpostavke faktorske analize Model strukturnih enačb in diagrami poti Ocena modela Pokazatelji “goodness of fit”. Eksploratorna FA
E N D
Pregled vsebine • Razlika med eksploratorno in konfirmatorno FA • Predpostavke faktorske analize • Model strukturnih enačb in diagrami poti • Ocena modela • Pokazatelji “goodness of fit”
Eksploratorna FA odkriti latentno strukturo relativno velikega seta spremenljivk apriorna predpostavka: katerakoli spremenljivka je povezana s katerimkoli faktorjem ne obstaja predhodna teorija, ki bi razložila obstoj posameznih faktorjev Konfirmatorna FA Namen = potrditi (konfirmirati) obstoj specifične in vnaprej predvidene faktorske strukture, kot jo predvidevamo na podlagi teorije apriorna predpostavka: vsak faktor (njihovo število in naziv sta določena vnaprej) je povezan s specifičnim setom indikatorskih spremenljivk minimalna zahteva konfirmatorne faktorske analize je, da obstaja vnaprejšnja predpostavka o številu faktorjev v modelu in pričakovanja glede nasičenosti spremenljivk s posameznimi faktorji FAKTORSKA ANALIZA Surov empirizem
PREDPOSTAVKE, ki jih moramo upoštevati, kadar se lotimo FA • Nepristranski izbor relevantnih podatkov. • Ne-prisotnost vplivnih točk (angl. »outliners«). • Intervalni merski nivo podatkov. • Linearna povezanost med spremenljivkami. • Multivariatna normalnost podatkov. • Ortagonalnost. • Obstoj latentnih dimenzij. • Zmerne do zmerno-visoke korelacije med spremenljivkami. • Interpretacija faktorjev in njihovi nazivi morajo imeti zadostno razvidno veljavnost in morajo biti teoretično utemeljeni.
ZGODOVINA… • Spearmanova dvofaktorska teorija inteligentnosti (g & s komponente) – metoda za analiziranja korelacijskih matrik (VAJE!) • Multigrupna faktorska analiza – vnaprejšnja predpostavka o povezanosti spremenljivk s faktorji (faktorji so linearne kombinacije spremenljivk), hipotetična ali tarčna matrika, pri izračunu upoštevamo vsote korelacij ali kovarianc • Cattellova Procrustesova metoda - »prisilna« (angl. forced) pravokotna ali poševna rotacijo faktorske matrike, da bi se le-ta čimbolj prilegala tarčni matriki (to je matrika hipotetičnih faktorskih nasičenosti)
MODEL STRUKTURNIH ENAČB • = serija linearnih regresijskih enačb, ki povezujejo odvisne spremenljivke z neodvisnimi • osnovna ideja: testirati, ali so spremenljivke med seboj povezane preko nekega seta linearnih odnosov, če poznamo njihove variance in kovariance • testiranje kompleksnih modelov, natančneje na testiranje strukture funkcionalnih odnosov med opazovanimi spremenljivkami in latentnimi spremenljivkami - funkcionalni odnosi so opisani s pomočjo parametrov, ki kažejo na velikost posrednega ali neposrednega efekta, ki ga imajo neodvisne spremenljivke na odvisne
5 KORAKOV MODELA STRUKTURNIH ENAČB • Predpostavimo način, kako naj bi bile spremenljivke med seboj povezane – diagrami poti • Kaj se zgodi z variancami in kovariancami? • Testiranje enačb. • Ocena parametrov in standardnih napak koeficientov v linearni enačbi. • Ali se model prilega izbranim podatkov?
DIAGRAMI POTI • najlažje komuniciramo s pomočjo matematičnih modelov tako, da narišemo njihovo sliko • Simboli, ki jih uporabljamo: Latentna spremenljivka Opazovana spremenljivka Enosmerna povezanost Dvosmerna povezanost Strukturna napaka pri latentni spremenljivki Merska napaka pri opazovani spremenljivki Korelacijski odnos
NOTACIJA MODELOV • xi…neodvisne merske spremenljivke • yi… odvisne merske spremenljivke • ξ (Ksi)..eksogeni latentni konstruki • η (eta)…endogeni latentni konstrukti • γ (gama)…zveze med latentnimi konstrukti • Λ (lambda)…zveze med merskimi spremenljivkami in latentnimi konstrukti • Φ (fi)…korelacije med eksogenimi latentnimi konstrukti • β (beta)…korelacije med endogenimi latentnimi konstrukti • δ (delta)…napake merjenja pri odvisnih spremenljivkah • ε (epsilon)…napake merjenja pri neodvisnih spremenljivkah • ζ (zeta)…rezidualna varianca v strukturi • Ψ (psi)…korelacija med rezidualnimi variancami v strukturi
1 X1 Y1 11 X2 1 1 Y2 X3 Y3 12 21 X4 Y4 2 1 X5 Y5 X6 Y6 2 1 1 2 2 3 3 4 4 5 5 6 6 PRIKAZ LISREL MODELA
MATEMATIČNA REPREZENTACIJA MODELA KFA x =λη + ε y = λξ + δ η = Bη + Гξ + ζ C = ΛΦΛ' + Ψ
OCENA MODELA • H0: Podatki so konsistentni z modelom oz. podatki se prilegajo modelu. • Pri oceni modela primerjamo S in Ŝ matriki – ocena razlike med tema dvema matrika je odvisna od metode ocene, ki jo uporabimo, da določimo parametre modela • ULS (angl. unweighter least squares), • GLS (angl. generalized (weighted) least squares), • ML (angl. maximum likelihood) • Vse tri metode ocene rešujejo strukturne enačbe iterativno, dokler ne dobimo optimalnih ocen parametrov • Razlike med S in Ŝ = funkcija diskrepance – želimo si čim nižje vrednosti! • Analogija – reševanja sistema k enačb s k neznankami
POKAZATELJI “GOODNESS OF FIT” • gre za pokazatelje stopnje prileganja med podatki in predpostavljenim modelom • = diskrepanca med opazovano in z modelom predpostavljeno kovariančno matriko ali korelacijsko matriko (+ kriterij parsimoničnosti + kompleksnost) • kategorizacija: testi pomembnosti, deskriptivni pokazatelji, informacijski pokazatelji
TESTI POMEMBNOSTI • Ničelna hipoteza testov pomembnosti je, da se dobljeni model sklada s predpostavljenim. • Kriterij prileganja (fit criterion) χ2/ (N – 1) χ2 = (N-1) / F • χ2 (biti mora statistično pomemben) • Obtežen najmanjši χ2 (normal theory reweighted least squares chi-square) • Z-test Wilsona in Helfertyja • Verjetnost dobrega prileganja
DESKRIPTIVNI POKAZATELJI • GFI • AGFI • Ničelni model χ2 • NFI • Parsimonični NFI • Ρ1 • NNFI • CFI • RMRCN • CENT • RMSEA • ECVI
INFORMACIJSKI POKAZATELJI • Upoštevajo stopnjo prileganja modelu in tudi število parametrov, ki so uporabljeni • AIC • CAIC • SBC
PRIMER: Faktorska struktura podlestvic WISC-a na vzorcu otrok z učnimi težavami • Model ocenjuje odnos med indikatorji IQ-ja in dvema konstruktoma, ki naj bi predstavljala IQ (verbalni in neverbalni) • Predpostavljen je dvofaktorski model – verbalni faktor (verbalni IQ) in neverbalni faktor (neverbalni IQ). • Zanimata nas dve hipotezi: • Ali se predpostavljeni dvofaktorski model s preprosto strukturo (vsako spremenljivko nasičuje le en faktor) prilega podatkom? • Ali obstaja pomembna kovarianca med verbalnim in neverbalnim faktorjem?
1. korak: Formuliranje hipotez in diagrama poti • hipoteza: Ali se predpostavljeni dvofaktorski model s preprosto strukturo (vsako spremenljivko nasičuje le en faktor) prilega podatkom? • hipoteza: Ali obstaja pomembna kovarianca med verbalnim in neverbalnim faktorjem?
11 poučenost 22 razumevanje 1 F1 33 računanje 44 podobnosti 55 besednjak 66 ponavljanje števil 77 dopolnjevanje slik 88 razvrščanje slik 2 F2 99 sestavljanje kock 1010 sestavljanje predmetov 1111 šifriranje
2. korak: prelimirano preverjanje identificiranosti modela • ali je model ustrezno identificiran (»just-identified«), nezadostno identificiran (»underidentified«) ali pretirano identificiran (»over-identified«). • V 11 opazovanih spremenljivk, kar pomeni, da imamo 66 podatkov (11*(11+1)/2). Hipotetični model pa predpostavlja, da moramo oceniti 23 parametrov (11 regresijskih koeficientov, 1 kovarinco, 11 varianc) • pregled podatkov – normalnost, linearnost, vplivne točke
3. korak: : SETUP IN SPECIFIKACIJA PARAMETROV V LISREL-u 4. korak: POKAZATALJI »GOODNESS OF FIT« MODELA CFA V LISREL-u in OCENA PARAMETROV (s pomočjo metode maximum likelihood) 5. korak: MODIFIKACIJA MODELA