350 likes | 546 Views
Sveučilište u Zagrebu Filozofski fakultet Odsjek za psihologiju. Primjena multivarijatnih metoda. Tema FAKTORSKA ANALIZA*. * Ova prezentacija predstavlja radni materijal.
E N D
Sveučilište u Zagrebu Filozofski fakultet Odsjek za psihologiju Primjena multivarijatnih metoda Tema FAKTORSKA ANALIZA* * Ova prezentacija predstavlja radni materijal
Faktorska analiza je skup matematičko-statističkih postupaka koji omogućuju da se u većem broju varijabli, među kojima postoji povezanost, utvrdi manji broj temeljnih varijabli koje objašnjavaju takvu međusobnu povezanost. Te temeljne varijable nazivaju se faktori. Varijable koje promatramo nazivaju se manifestne varijable, a faktori koje utvrđujemo u postupku faktorske analize nazivaju se latentne varijable.
Sadržaj teme: 1. Cilj faktorske analize 2. Rekapitulacija osnovnih pojmova i operacija 3. Problemi u primjeni faktorske analize 4. Izvođenje faktorske analize u programu SPSS 5. Interpretacija rezultata
I. REPETITORIJ OSNOVNIH POJMOVA: 1. Definicija i ciljevi FA 2. Parsimonija i interpretabilnost 3. Manifestne i latentne varijable 4. Korelacije među manifestnim varijablama kao indikacija zajedničkih faktora 5. Multifaktorski model strukture manifestnih varijabli (linearni efekti faktora, ortogonalnost latentnih varijabli, jednadžba specifikacije manifestne varijable = višestruka regresijska jednadžba)
6. Odnosi između manifestnih i latentnih varijabli (faktorska zasićenja ili saturacije=regresijski koeficijenti faktora za varijable kao kriterije) 7. Dijelovi varijance manifestnih varijabli u FA 8. Objašnjenje manifestnih varijabli pomoću faktora, rezidualne vrijednosti 9. Objašnjenje korelacija među manifestnim varijablama pomoću njihovih saturacija s faktorima (rezidualne korelacije)
10. Varijanca skupa varijabli objašnjena pomoću faktora. 11. Geometrijski prikaz odnosa manifestnih varijabli i faktora 12. Neodređenost multifaktorskih rješenja (jednostavna struktura, rotacije) 13. Psihologijska interpretacija faktora
II. PROBLEMI U PRIMJENI FAKTORSKE ANALIZE 1. Prikladnost podataka za primjenu FA - kvantitativne varijable i njihove distribucije - Bartlettov test (R=I) - KMO i MSA 2. Komponentni model i model zajedničkih faktora - metode za ekstrakciju faktora - problem određivanja komunaliteta
3. Određivanje broja značajnih faktora 4. Postizanje jednostavne strukture 5. Matrice faktorskog sklopa (obrasca) i faktorske strukture 6. Izračunavanje i procjena faktorskih rezultata 7. Kosokutne rotacije, korelacije među faktorima i faktori viših redova 8. Evaluacija primjene faktorske analize (objašnjena varijanca, rezidualni r, interpretabilnost)
U prijašnjim fazama faktorska analiza upotrebljavala se isključivo kao eksploratorna strategija. Prije 1970. termin FA koristio se bez riječi eksploratorna. Ovaj izraz uveden je kasnije kako bi se razlikovala od konfirmatorne FA uvedne približno 1969. radovima Joreskoga. Cilj je EFA da utvrdi temeljne faktore ili izvore varijacija i kovarijacija među promatranim varijablama. Kod CFA situacija je drugačija. FA se pojavljuje kao objektivan test određenog strukturalnog modela ili teorije.
Osnivač je FA engleski psiholog C. Spearman koji je ujedno postavio i prvu empirijsku teoriju inteligencije. Zj = fjG + Sj Spearmanova psihološka teorija o dva faktora kasnije je zamijenjena teorijama o više faktora. Tako je nastala multifaktorska analiza. Po toj koncepciji u svakoj manifestnoj ili promatranoj intelektualnoj aktivnosti sudjeluje nekoliko faktora ili latentnih varijabli. Prvi je takvu koncepciju iznio Garnett (1919), a termin multifaktorska analiza prvi je upotrijebio Thurstone (1931). Zj = fjA + gjB + hjC + ... + Sj
Engleski psiholozi Burt (1938) i Vernon (1961) stvaraju psihološke modele prema kojima postoji hijerarhija pojedinih faktora inteligencije. Na vrhu je G faktor koji participira u svim intelektualnim aktivnostima, ispod njega su grupni faktori višeg reda, a zatim grupni faktori nižeg reda itd.
Glavni ciljevi EFA 1. Odrediti broj zajedničkih faktora koji uvjetuju variranje skupa manifestnih varijabli 2. Odrediti jačinu povezanosti između svakog faktora i svake manifestne varijable
Načelno postoje dvije strategije korištenja faktorske analize. Jedna strategija naziva se eksploratorna faktorska analiza, a druga konfirmatorna faktorska analiza.
Cilj je eksploratorne faktorske analize da utvrdi temeljne faktore ili izvore varijacija i kovarijacija među promatranim varijablama. Cilj je ovakve strategije faktorska deskripcija određenog područja istraživanja.
Pri konfirmatornim strategijama faktorske analize istraživač polazi od unaprijed formuliranog modela, hipoteze ili teorije o strukturi temeljnih izvora varijacija i kovarijacija među manifestnim varijablama. Faktorska analiza u ovom slučaju predstavlja test pretpostavljene strukture, odnosno omogućuje testiranje strukturalnih teorija. Treba naglasiti da se oba pristupa mogu dopunjavati, te da formalno gledajući oba pristupa omogućuju testiranje teorijskih modela.
1. MULTIFAKTORSKI MODEL STRUKTURE BRUTO REZULTATA U teoriji pouzdanosti bruto rezultat je strukturiran kao linearna kombinacija: X = T + E bruto rezultat = pravi rezultat + pogreška U teoriji valjanosti pravi rezultat se dalje rastavlja. T = H + S Jednadžba bruto-rezultata može se u skladu s izrečenim napisati: X = H + S + E
Nadalje u teoriji valjanosti se pretpostavlja da je H složenica linearnog tipa. Razumno je pretpostaviti da se nekim mjernim postupkom može pobuditi određeni broj odijeljenih psiholoških osobina. Ako pretpostavimo da su njihovi efekti linearno kombinirani dobivamo izraz: H = H1 + H2 + ... + Hk tako da se jednadžba bruto rezultata može pisati: X = H1 + H2 + ... + Hk + S + E
2.1. OSNOVNE PRETPOSTAVKE ZA PROVOĐENJE FAKTORSKE ANALIZE Istraživački problemi na koje FA može dati odgovor Slučajevi kada FA nije dobar izbor za analizu podataka
2.2. PODOBNOST KORELACIJSKE MATRICE ZA FAKTORIZACIJU Prije provođenja FA potrebno je provjeriti podobnost korelacijske matrice za faktorizaciju. Bartlettov test sfericiteta koristiti se za testiranje hipoteze da je korelacijska matrica identična matrici identiteta (čije su izvandijagonalne vrijednosti nula, a na dijagonali su jedinice). Test zahtijeva da su podaci uzorak iz multivarijatne normalne populacije. Što je veća dobivena vrijednost hi-kvadrata to je manja vjerojatnost da je opažena korelacijska matrica jednaka matrici identiteta. Ako je dobiveni p veliki prihvaćamo hipotezu da se matrica ne razlikuje značajno od matrice identiteta i u tom slučaju treba razmotriti opravdanost FA. 2 = - (N-1 - (2k+5)/6) loge |R|
2.3. UTJECAJ KARAKTERISTIKA VARIJABLI: FAKTORIZACIJA ČESTICA Literatura ukazuje na moguće probleme vezane uz faktorizaciju čestica. (Bernstein, Teng, 1989.) Korelacija dvije čestice bit će uvjetovana njihovim sadržajem ali i oblikom njihovih distribucija. Može se demonstrirati kako razlika u distribucijama utječe na korelaciju dva inače sadržajno slična zadatka. Ovaj efekt poznat je pod nazivom «težinski faktor» (Carrol, 1945; Gorsuch, 1983).
2.4. KRITERIJI ZADRŽAVANJA FAKTORA: 1. Guttman i Kaiser (K1) Guttman, 1954 Kaiser, 1960 Komponenta bi trebala objašnjavati toliko varijance koliko i pojedina manifestna varijabla
2.4. KRITERIJI ZADRŽAVANJA FAKTORA: 2. Cattelov scree test Cattell (1966) predlaže scree test. Ovaj test obično sugerira manje faktora nego G-K kriterij kada je prosječna korelacija mala i broj varijabli velik. Primjedba je subjektivnost.
2.4. KRITERIJI ZADRŽAVANJA FAKTORA: 3. Interpretabilnost 4. A priori odluke na osnovi teorije 5. Kombinacija više kriterija
2.4. KRITERIJI ZADRŽAVANJA FAKTORA: 6. Paralelne analize sugerirali Humprey i Ilgen (1969)
2.4. KRITERIJI ZADRŽAVANJA FAKTORA: 7. Postotak objašnjene varijance - obično daje prevelik broj faktora - ovisi o prosječnoj korelaciji u skupu podataka 8. Bartlettovi testovi značajnosti (1950, 1954) hi kvadrat test koji testira hipotezu da su preostali kk jednaki ili da je rezidualna korelacijska matrica različita od nulte. često vodi zadržavanju trivijalnih faktora
2.5. ROTACIJA FAKTORA • - Svrha rotacije • - Thurstoneova načela jednostavne strukture • Ortogonalne i kosokutne rotacije • Varimax – Minimalizira broj varijabli koje imaju visoke saturacije s pojedinim faktorom • Olakšava interpretaciju faktora.