150 likes | 385 Views
DUOMENŲ GAVYBOS TECHN O LOGIJOS. Paskaita 6. Faktori ų analizė. Leonidas Sakalauskas VGTU ITK, VU MII t. -85 2109323, <sakal@ktl.mii.lt>. Faktorių tyrimo tikslas. Labai dažnai stebėjimų rezultatus įtakoja tam tikri, tačiau betarpiškai neišmatuojami veiksniai (faktoriai).
E N D
DUOMENŲ GAVYBOS TECHNOLOGIJOS Paskaita 6.Faktorių analizė Leonidas Sakalauskas VGTU ITK, VU MII t. -85 2109323, <sakal@ktl.mii.lt>
Faktorių tyrimo tikslas Labai dažnai stebėjimų rezultatus įtakoja tam tikri, tačiau betarpiškai neišmatuojami veiksniai (faktoriai). Faktorių analizės tikslas yra nustatyti minėtuosius faktorius, turinčius įtakos galutiniams rezultatams.
Faktorių analizės problemos Taikant faktorinę analizę susiduriama su tokiomis problemomis: • ne visada realiai egzistuoja latentiniai faktoriai ir ne visada patikimai galima juos išskirti • tiems patiems duomenims taikant skirtingus faktorinės analizės metodus, galima gauti keleta galimų faktorių rinkinių • išskirtieji faktoriai ne visada lengvai paaiškinami.
Faktorių tyrimo tikslas Ištyrus pagrindinius veiksnius, stebimi kintamieji suskirstomi į tam tikras grupes, atsižvelgiant į pastarųjų tarpusavio koreliacijas, ir manant, kad kiekvienos grupės kintamuosius vienija koks nors, tiesiogiai nestebimas veiksnys (faktorius), vadinamas latentiniu.
Faktorių tyrimas Paprastai faktorinė analizė gali padėti apsispręsti: • kiek latentinių faktorių pakaktų paaiškinti tiriamųjų kintamųjų priklausomybės struktūrą; • kokie veiksniai turi būti išskirti; • kaip gerai veiksniai paaiškina tiriamuosius duomenis ?
Faktorių tyrimo etapai Išskiriami tokie faktorių tyrimo pagrindiniai etapai: • duomenų patikrinimas, ar jie tinkami faktorinei analizei • faktorių išskyrimas, t. y., faktorių skaičiaus nustatymas ir skaičiavimo metodo parinkimas • faktorių sukimas ir interpretavimas • faktorių reikšmių įverčių skaičiavimas
Pagrindinių komponenčių analizė Vienas dažniausiai naudojamų faktorių tyrimo metodų yra Pagrindinių komponenčių analizė (Principal Component Analysis, PCA). Tarkime, kad stebime nkintamųjų X1, X2, …., Xn, kuriuos įtakoja paslėpti veiksniai (pagrindinės komponentės) F1, F2, …., Fm.
Pagrindinių komponenčių analizė Padaromos prielaidos: • kiekvieną kintamąjį Xi sąlygoja m bendrųjų latentinių faktorių F1, F2, …., Fm ir specifinis faktorius ei : • latentiniai faktoriai yra susiję tiesiškai su kintamaisiais Xi; • paslėptų veiksnių yra mažiau negu stebimų kintamųjų, t.y. m < k.
Robastinės duomenų analyzės problemos Tuomet faktorių analizės modelis užrašomas tokiu būdu: čia daugikliai vadinami faktorių svoriais.
Faktorių tyrimo duomenys Tarkime, duota daugiamatė imtis , , ,: čia n – požymių skaičius, N – objektų skaičius:
Koreliacijų matrica Faktorių modelio parametrai nustatomi pasinaudojus daugiamatės imties koreliacijų ir kovariacijų matricomis. Koreliacijų matricos elementai apskaičiuojami tokiu būdu, i,j=1,..,n:
Duomenų tinkamumas faktorių analizei Duomenų tinkamumui faktorinei analizei gali būti nustatytas pasinaudojus Bartleto kriterijum ir Kaizerio – Mejerio –Olkino koeficientu:
Kintamųjų bendrumai ir specifiškumai Stebimų kintamųjų dispersija ir kovariacijos išreiškiamos per faktorių svorius tokiu būdu: vadinamas kintamojo bendrumu, o specifiškumu
Pagrindinių komponenčių analizė PCA metode yra randamos stebimų kintamųjų X1, X2, …., Xn tiesines tarpusavyje nekoreliuojančios reikšmės F1, F2, …., Fm, vadinamos pagrindinėmis komponentėmis. Šios komponentės nustatomos pasinaudojus koreliacijų matricos m didžiausiųtikrinių reikšmių (eigen values). Faktorių svoriai nustatomi dauginant atitinkamų tikrinių vektorių komponentes iš tikrinės reikšmės šaknies.
Faktorių skaičiaus parinkimas Tikrinės reikšmės, žymimos DY1, DY2, ,,, DYm, atintinka pagrindinių komponenčių dispersijas. Tad kiekviena komponentė paaiškina visos kintamųjų dispersijos. Pastaraja savybe pasinaudojama, parenkant pagrindinių komponenčių skaičių m.