360 likes | 1.04k Views
FAKTORSKA ANALIZA. Grbić Milka Jovanović Dejan. Definicija - metod višedimenzionalne (multivarijacione) analize koja se koristi za opis međusobne zavisnosti velikog broja promenljivih, putem definisanja seta zajedničkih osnovnih dimenzija poznatih kao faktori.
E N D
FAKTORSKA ANALIZA Grbić Milka Jovanović Dejan
Definicija - metod višedimenzionalne (multivarijacione) analize koja se koristi za opis međusobne zavisnosti velikog broja promenljivih, putem definisanja seta zajedničkih osnovnih dimenzija poznatih kao faktori. • Zadatak- sažimanje većega broja međusobnopovezanih izvornih varijabli u manji broj zajedničkih faktora koji će ih opisivatii objasniti njihovu međusobnu povezanost. • Primena -primjenjuje se za identifikovanje dimenzija koje nisu odmah uočljive, za testiranje definisanih hipotezai za istraživanje novoga područja.
Pretpostavke: polazi se od pretpostavke da među varijablamapostoji linearna korelacija, a svaki izdvojeni faktor nije u korelaciji sa drugim faktorima. • Umesto nad velikim brojem koreliranih izvornih varijablianaliza se sprovodi nad nekoreliranim faktorima i na taj se način otklanja problemkolinearnosti varijabli.
Tabela 2. Korelaciona matrica nakon grupisanja vrijabli u faktore iskustvo kupaca u radnji ponuda proizvoda vrednost
Proces odlučivanja u faktorskoj analizi odvija se kroz 6 faza (plus dodatna faza 7) • I FAZA - Formulisanje problema (problem istraživanja) • Tehnike faktorske analize mogu ostvariti jedan od dava cilja: • identifikovanje strukture varijabli kroz sumarizaciju podataka putem ispitivanja korelacija između varijabli ili respondenata – R i Q faktorska analiza • redukcija podataka – indentifikovanje reprezentativnih varijabli iz velikog seta varijabli ili kreiranje potpuno novog seta varijabli koji je brojčano mnogo manji a koji je u stanju da zameni originalni set varijabli
II FAZA – Dizajniranje faktorske analize • Konstrukcijakorelacionematrice–matrica sa koeficijentimakorelacije između promenljivih. Ona može poslužiti umesto originalnih promenljivih kao ulazna veličina. • 2. Selekcija i merenje varijabli ( kako meriti varijable i koliko varijabli treba uključiti) • 3. Veličina uzorka – opšte pravilo je imati bar pet puta više opservacija nego što ima varijabli koje treba analizirati (prihvatljiva veličina je racio 10:1)
III FAZA – Pretpostavke u faktorskoj analizi Multikolienearnost – medjupovezanost setova varijabli Mera adekvatnosti uzorkovanja – kvantifikuje stepen interkorelacija među varijablama i podesnost faktorske analize (kreće se od 0-1) Homogenost uzorka
IV FAZA – Izvođenje (ekstrakcija) faktora i procena opšteg uklapanja • Metode ekstakcije: • a) faktorska analiza u užem smislu – indentifikuje osnovne faktore koji odražavaju zajedničke karakteristike varijabli • b) komponenetna analiza - sumira većinu originalnih informacija u minimalan broj faktora za svrhe predvidjanja • Izbor modela (metoda ekstrakcije) zavisi od: • - ciljeva faktorske analize i • - obima prethodnog znanja o varijansi
2. Broj faktora koji su odabrani da predstavljaju osnovnu strukturu podataka Kriterijumi: • Kriterijum latentnog korena – bilo koji individualni faktor treba da objasni varijansu bar jedne varijable, ako ga treba zadržati za interpretaciju (ako je latentni koren veći od 1 faktor se smatra značajnim) • A priori kiterijum – istraživač unapred (pre preduzimanja faktorske analize) zna koliko faktora treba ekstrahovati
Kriterijum procenta varijanse – baziran na ostvarenju navedenog kumulativnog procenta ukupne varijase ekstrahovane uzastopnim faktorima • Kriterijum scree testa – određujemo optimalan broj faktora koje treba izdvojiti pre nego što specifična varijansa počne da dominira nad zajedničkom • Heterogenost respondenata – ako je uzorak heterogen u pogledu bar jednog podskupa varijabli, onda će prvi faktori predstavljati one varijable koje su homogenije preko čitavoguzorka
V FAZA – Interpretiranje faktora Tri koraka su uključena u interpretaciji faktora i selekciji finalnog faktorskog rešenja: • Izračunavanje inicijalne nerotirane faktorske matrice koja pomaže u dobijanju preliminarnog broja faktora za ekstrakciju. • Rotacija faktora ostvaruje jednostavnija i teoretski značajnija faktorska rešenja. • Respecifikacija faktorskog modela se ostvaruje vraćanjem na fazu ekstrakcije, ekstrakcijom faktora i njihovom ponovnom interpretacijom.
Rotacija faktora • Efekat rotiranja faktorske matrice je da se redistribuira varijansa sa ranijih faktora na kasnije faktore, s ciljem da se ostvari jednostavnija teoretski značajnija faktorska matrica Rotacija može biti: • ortogonalna rotacija – u geometrijskom smislu predstavlja rotaciju koordinatnih osa za izvestan ugao, pri čemu njihov međusobni odnos ostaje nepromenjen, što znači da su ose i dalje međusobom ortogonalne tj. pod uglom od 90ํํ stepeni • kosa rotacija – fleksibilniji i realističniji metod jer faktorske ose ne moraju biti ortogonalne i ne pretpostavlja se da su teorijski važne osnovne dimenzije, nekorelirane jedna sa drugom
Metode ortogonalne rotacije Cilj svih metoda je da se simplifikuju kolone i redovi faktorske matrice da bi se olakšala interpretacija. Postoje tri glavna ortogonalna pristupa: • QUARTIMAX – cilj je da se simplifikuju redovi faktorske matrice tj. ovaj metod se fokusira na rotiranje inicijalnog faktora, tako da je opterećenje varijable visoko na jednom faktoru, i što je moguće niže na svim ostalim faktorima • VARIMAX – varijansu opterećenja računamo za svaku kolonu posebno, pa se dobija veći broj zajedničkih faktora • EQUIMAX – kompromis između predhodna dva pristupa, nije široko prihvaćen i ne koristi se često
Kriterijumi za značajnost faktorskh opterećenja • Faktorska opterećenja su korelacija svake varijable i faktora koje indiciraju stepen korespondentnosti između varijabli i faktora, gde veća opterećenja čine varijablu reprezentom faktora. • obezbeđenje praktične značajnosti – što je veća apsolutna veličina faktorskog opterećenja, to je važnije to opterećenje u interpretaciji faktorske matrice • procenjivanje statističke značajnosti – test statističke značajnosti koeficijenta korelacije se direktno primenjuje na elemente matrice faktorskog opterećenja
Sumiranjem kriterijuma za značajnost faktorskih opterećenja, zaključujemo: Što je uzorak veći manje je opterećenje koje će se smatrati značajnim; Što je veći broj varijabli koje se analiziraju, manje je opterećenje koje će se smatrati značajnim; Što je veći broj faktora, veća je veličina opterećenja na kasnijim faktorima, koja će se smatrati značajnim za interpretaciju. Interpretiranje faktorske matrice – procedura • Ispitati faktorsku matricu opterećenja • Identifikovati najviše opterećenje za svaku varijablu • Poceniti komunalitete varijabli • Označiti faktore
VI FAZA – Validacija faktorske analize • Uključuje procenu stepena uopštljivosti rezultata za populaciju i potencijalni uticaj individualnih slučajeva na opšte rezultate • Faktorska stabilnost kao aspekt uopštljivosti je zavisna od veličine uzorka i broja slučajeva po varijabli • Detekcija uticajnih opservacija
VII FAZA – Dodatne upotrebe rezultata faktorske analize • Ako je cilj indentifikovati podesne varijable za narednu primenu na druge ststističke tehnike, onda će se koristiti neki oblik redukcije podataka. Opcije uključuju: • Selekciju surogat varijabli za narednu analizu – istraživač ima opciju ispitivanja faktorske matrice i selekciju varijable sa najvišim faktorskim opterećenjem na svakom faktoru, koja deluje kao surogat varijabla koja je predstavnik tog faktora • Kreiranje sumiranih skala – formiraju se kombinovanjem nekoliko individualnih varijabli u jednu kompozitnu meru • Izračunavanje faktorskih skorova – kompozitne mere svakog faktora izračunate za svaki subjekt. Faktorski skor se izračunava na osnovu faktorskih opterećenja svih varijabli na faktoru
Sumirana skala pruža dve specifične koristi: • omogućava da se u izvesnoj meri savlada greška merenja (redukuje grešku merenja putem korišćenja višestrukih indikatora (varijabli)) • njena sposobnost da predstavlja više aspekata koncepta u jednoj meri • Četiri pitanja koja su osnovna za konstruisanje bilo koje sumirane skale su: • Konceptualana definicija • Dimenzionalnost • Pouzdanost • Valjanost
Odabir među tri opcije redukcije podataka vrši se poredjenjem njihovih prednosti i mana: Prednosti surogat varijable – jednaostavna za upravljanje i interpretiranje, a nedostatak je da je sklona grešci merenja Prednost faktorskih skorava – predstavljaju kompozit svih varijabli koje vrše opterećenje na faktoru, a nedostatak je da varijable imaju izvestan stepen uticaja u izračunavanju faktorskih skorova, i otežavaju interpretaciju. Prednost sumirane skale – kompozitna mera koja redukuje grešku merenja, a nedostatk je da uključuje samo varijable koje vrše visoko opterećenje na faktoru, a isključuje one koji imaju mali uticaj. Zaključak je da ako se podaci koriste samo u orginalnom uzorku ili ako se ortogonalnost mora održati, faktorski skorovi su pogodni, a ako se želi uopštljivost onda su podesnije sumirane skale i surogat varijable.
Zaključak – faktorska analiza • korisna i moćna multivarijaciona statistička tehnika koja služi za efektivno ekstrahovanje informacija iz velikih baza podataka • ukazuje na interesantne odnose koji ne bi možda bili očigledni iz ispitivanja samo sirovih podataka ili čak korelacione matrice • ima sposobnost da identifikuje setove srodnih varijabli i time nudi istraživaču moćan alat u ostvarenju boljeg razumevanja strukture podataka
Tri ograničenja faktorske analize su: • postoji kontraverza oko toga koja tehnika je najbolja, • subjektivni aspekti faktorske analize i • problem pouzdanosti je realan zbog toga što analiza započinje sa setom nesavršenih podataka.
Primer. Utvrđivanje osnovnih karakteristika proizvoda ‚‚kafa‚‚ primenom faktorske analize • podaci prikupljeni metodom ispitivanja na uzorku studenta prve godine Ekonomskog fakulteta • Instrument istraživanja-upitnik (50 ispitanika-nekoliko reči vezanih za proizvod kafa) • 281 ispitanik u obradu ušlo 248 upitnika, 33 upitnika nisu dobro popunjena • na skali od 1 do 7 ispitanici su davali odgovore, pri čemu je jedan označavalo “uopšte se ne slažem sa navedenom izjavom”, a 7 “izrazito se slažem sa navedenom izjavom”
15 VARIJABLI OPUST – kafa je dobra za opuštanje, UKUS – važno je da kafa ima dobar ukus, NESPA – kada popijem kafu, ne spava mi se, DOBOS – dobro se osećam dok pijem kafu, NEZIV – ne mogu živeti bez kafe, MIRIS – važno je da kafa ima dobar miris, ODMOR – kafa je važna za odmor, KONCEN – kafu pijem kad želim biti koncentrisan/a na učenje, BUDJEN – kafa je važna za razbuđivanje, PAUZA – kafa znači pauzu, UZITAK – kafa mi pruža užitak, POCDAN – kafa je važna za početak dana, MIRPRIM – miris kafe je primamljiv, OSVEZ – kafa je osveženje, BITELT – kafa mi je bitan element u životu.
- osnov za sprovođenje faktorske analize je korelaciona matrica koja sadrži jednostavne linearne korelacije svakog para varijabli. • preduslov za FA je povezanost između izvornih varijabli
matrica faktorske strukture – sadrži faktorska opterećenja koja predočavaju koeficijente korelacije između izdvojenih faktora i varijabli
FAKTOR 1 - „OPUŠTANJE“ OPUST – kafa je dobra za opuštanje, UKUS – važno je da kafa ima dobar ukus, DOBOS – dobro se osećam dok pijem kafu, ODMOR – kafa je važna za odmor PAUZA – kafa znači pauzu MIRPRIM – miris kafe je primamljiv FAKTOR 2 - „KONCENTRACIJA“ NESPA – kada popijem kafu, ne spava mi se, KONCEN – kafu pijem kad želim biti koncentrisan/a na učenje BUDJEN – kafa je važna za razbuđivanje POCDAN – kafa je važna za početak dana, FAKTOR 3 -„ZAVISNOST“ NEZIV – ne mogu živeti bez kafe, UZITAK – kafa mi pruža užitak, BITELT – kafa mi je bitan element u životu FAKTOR 4 -„OSVEŽENJE“ MIRIS – važno je da kafa ima dobar miris OSVEZ – kafa je osveženje