1 / 15

Paskaita 6. Faktori ų analizė

DUOMENŲ GAVYBOS TECHN O LOGIJOS. Paskaita 6. Faktori ų analizė. Leonidas Sakalauskas VGTU ITK, VU MII t. -85 2109323, <sakal@ktl.mii.lt>. Faktorių tyrimo tikslas. Labai dažnai stebėjimų rezultatus įtakoja tam tikri, tačiau betarpiškai neišmatuojami veiksniai (faktoriai).

cai
Download Presentation

Paskaita 6. Faktori ų analizė

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. DUOMENŲ GAVYBOS TECHNOLOGIJOS Paskaita 6.Faktorių analizė Leonidas Sakalauskas VGTU ITK, VU MII t. -85 2109323, <sakal@ktl.mii.lt>

  2. Faktorių tyrimo tikslas Labai dažnai stebėjimų rezultatus įtakoja tam tikri, tačiau betarpiškai neišmatuojami veiksniai (faktoriai). Faktorių analizės tikslas yra nustatyti minėtuosius faktorius, turinčius įtakos galutiniams rezultatams.

  3. Faktorių analizės problemos Taikant faktorinę analizę susiduriama su tokiomis problemomis: • ne visada realiai egzistuoja latentiniai faktoriai ir ne visada patikimai galima juos išskirti • tiems patiems duomenims taikant skirtingus faktorinės analizės metodus, galima gauti keleta galimų faktorių rinkinių • išskirtieji faktoriai ne visada lengvai paaiškinami.

  4. Faktorių tyrimo tikslas Ištyrus pagrindinius veiksnius, stebimi kintamieji suskirstomi į tam tikras grupes, atsižvelgiant į pastarųjų tarpusavio koreliacijas, ir manant, kad kiekvienos grupės kintamuosius vienija koks nors, tiesiogiai nestebimas veiksnys (faktorius), vadinamas latentiniu.

  5. Faktorių tyrimas Paprastai faktorinė analizė gali padėti apsispręsti: • kiek latentinių faktorių pakaktų paaiškinti tiriamųjų kintamųjų priklausomybės struktūrą; • kokie veiksniai turi būti išskirti; • kaip gerai veiksniai paaiškina tiriamuosius duomenis ?

  6. Faktorių tyrimo etapai Išskiriami tokie faktorių tyrimo pagrindiniai etapai: • duomenų patikrinimas, ar jie tinkami faktorinei analizei • faktorių išskyrimas, t. y., faktorių skaičiaus nustatymas ir skaičiavimo metodo parinkimas • faktorių sukimas ir interpretavimas • faktorių reikšmių įverčių skaičiavimas

  7. Pagrindinių komponenčių analizė Vienas dažniausiai naudojamų faktorių tyrimo metodų yra Pagrindinių komponenčių analizė (Principal Component Analysis, PCA). Tarkime, kad stebime nkintamųjų X1, X2, …., Xn, kuriuos įtakoja paslėpti veiksniai (pagrindinės komponentės) F1, F2, …., Fm.

  8. Pagrindinių komponenčių analizė Padaromos prielaidos: • kiekvieną kintamąjį Xi sąlygoja m bendrųjų latentinių faktorių F1, F2, …., Fm ir specifinis faktorius ei : • latentiniai faktoriai yra susiję tiesiškai su kintamaisiais Xi; • paslėptų veiksnių yra mažiau negu stebimų kintamųjų, t.y. m < k.

  9. Robastinės duomenų analyzės problemos Tuomet faktorių analizės modelis užrašomas tokiu būdu: čia daugikliai vadinami faktorių svoriais.

  10. Faktorių tyrimo duomenys Tarkime, duota daugiamatė imtis , , ,: čia n – požymių skaičius, N – objektų skaičius:

  11. Koreliacijų matrica Faktorių modelio parametrai nustatomi pasinaudojus daugiamatės imties koreliacijų ir kovariacijų matricomis. Koreliacijų matricos elementai apskaičiuojami tokiu būdu, i,j=1,..,n:

  12. Duomenų tinkamumas faktorių analizei Duomenų tinkamumui faktorinei analizei gali būti nustatytas pasinaudojus Bartleto kriterijum ir Kaizerio – Mejerio –Olkino koeficientu:

  13. Kintamųjų bendrumai ir specifiškumai Stebimų kintamųjų dispersija ir kovariacijos išreiškiamos per faktorių svorius tokiu būdu: vadinamas kintamojo bendrumu, o specifiškumu

  14. Pagrindinių komponenčių analizė PCA metode yra randamos stebimų kintamųjų X1, X2, …., Xn tiesines tarpusavyje nekoreliuojančios reikšmės F1, F2, …., Fm, vadinamos pagrindinėmis komponentėmis. Šios komponentės nustatomos pasinaudojus koreliacijų matricos m didžiausiųtikrinių reikšmių (eigen values). Faktorių svoriai nustatomi dauginant atitinkamų tikrinių vektorių komponentes iš tikrinės reikšmės šaknies.

  15. Faktorių skaičiaus parinkimas Tikrinės reikšmės, žymimos DY1, DY2, ,,, DYm, atintinka pagrindinių komponenčių dispersijas. Tad kiekviena komponentė paaiškina visos kintamųjų dispersijos. Pastaraja savybe pasinaudojama, parenkant pagrindinių komponenčių skaičių m.

More Related