1 / 21

Analiz ă factoriala

Analiz ă factoriala. Aspecte tehnice şi interpretarea geometrică. Opera ţionalizare unui concept. DIV1. Viaţa de după moarte. DIV4. Rai. Credin ţe r eligio ase creştine esenţiale. DIV6. Judecata de Apoi. Credin ţe r eligio ase. DIV8. Puterea rugăciunii. DIV5. Horoscop. DIV3. Ghicit .

webb
Download Presentation

Analiz ă factoriala

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Analiză factoriala Aspecte tehnice şi interpretarea geometrică

  2. Operaţionalizare unui concept DIV1. Viaţa de după moarte DIV4. Rai Credinţe religioase creştine esenţiale DIV6. Judecata de Apoi Credinţe religioase DIV8. Puterea rugăciunii DIV5. Horoscop DIV3. Ghicit Credinţe religioase magice DIV7. Vrăjitorie DIV2. Telepatie

  3. Analiza factorială – diagrama DIV1. Viaţa de după moarte DIV4. Rai Credinţe religioase creştine esenţiale DIV6. Judecata de Apoi DIV8. Puterea rugăciunii DIV5. Horoscop DIV3. Ghicit Credinţe religioase magice DIV7. Vrăjitorie DIV2. Telepatie

  4. Variabilele latente: ce urmărim? • Prin urmare ce urmărim la o variabilă latentă?: • 1. Cât de bine a avut loc substituţia: cât de corelată este variabilă latentă cu variabilele manifeste (observate). • 2. Cât din variabilitatea norului de puncte surprinde variabila latentă Adică suntem interesaţi de varianţa şi corelaţia variabilelor 1 2

  5. Forma algebrică a ecuaţiilor: ce interpretăm • X1= b11*F1 + b12*F2 +b13*F3 + … + b1n*Fn + d1*U1 h12 =Σb1k2 • X2= b21*F1 + b22*F2 +b23*F3 + … + b2n*Fn + d2*U1 h22 =Σb2k2 • X3= b31*F1 + b32*F2 +b33*F3 + … + b3n*Fn + d3*U1 h32 =Σb3k2 • … • Xm= bm1*F1 + bm2*F2 +bm3*F3 +… + bmn*Fn + dm*U1 hm2 =Σbmk2 λ12 = Σbk12 λ22 = Σbk22 λ32 = Σbk32 λm2 = Σbkm2 undeλ12 >λ22 > λ32 >…>λm2 • Atunci când realizăm analiza vom interpreta: • 1. hi2 –comunalităţile (cantitatea de varianţă extrasă dintr-o variabilă de către factori) • 2. λi2 – valorile proprii (varianţa pe care o sintetizează un factor) • 3. bij – saturaţiile (coeficienţii de regresie în care variabilele latente sunt variabile indepenente, iar variabilele manifeste sunt variabilele dependente). Ele sunt raportate în tabelul numit pattern matrix sau factor matrix • Interpretarea factorilor se face în funcţie de corelaţiile dintre factori şi variabilele manifeste şi se raportează într-un tabel structure matrix. • Dacă rotaţia este ortogonală atunci structure matrix coincide cu pattern matrix • Dacă rotaţia este oblică atrunci structure matrix este diferită de pattern matrix.

  6. Analiza factorială: algoritmul de calcul • 1. Calculăm matricea de corelaţie între variabile. • 2. Supunem matricea la o descompunere în valori proprii (DVP): (1) obţine o serie de vectori proprii = variabile latente şi (2) valori proprii asociate = varianţele acestor variabile latente. • Algoritmul DVP este un algoritm iterativ şi urmăreşte să extragă pe rând variabilele latente astfel încât să maximize varianţa acestora. • După ce a extras o variabilă latentă, va încerca să surprindă variabilitatea rămasă. • Aceste variabile latente sunt perpendiculare = necorelate între ele • 3. Pentru că algoritmul DVP extrage variabile latente perpendiculare, vom roti variabilele latente astfel încât să obţinem o adecvare maximă a variabilelor la date: • Rotirea poate fi la rândul ei perpendiculara, sau • Rotirea poate fi oblică

  7. O distincţie centrală: componente / factori • Algoritmul DVP porneşte de la matricea de corelaţie, însă o poate face în două moduri. Variabilitatea fiecărei variabile poate fi compusă din: • A. Variabiliatea comună (suprinsă de factor) + variabilitate unică • B. Variabilitate comună (surprinsă de factor) + variabilitate eroare (indicată de fidelitate) + variabilitate unică • Variabilitate eroare • Putem presupune că fiecare variabilă este măsurată cu o anumită eroare, prin urmare variabilitatea acesteia nu este adevărata variabilitate. Varianţa măsurată = Varianţa reală + Varianţă eroare • Varianţa reală este măsurată cu ajutorul fidelităţii (reliabilităţii). • Atunci când extragem variabilele latente putem încercăm ca în loc de varianţa măsurată să folosim varianţa “reală”, iar pe diagonalele matricii de corelaţie să punem în loc de σx să avem αCrombah • În cazul • A. Spunem că se extrag COMPONENTELE PRINCIPALE, care sunt simple combinaţii liniare a variabilelor manifeste • B. Spunem că sunt extraşi FACTORII LATENŢI

  8. Extragerea componentelor principale • Deschideţi baza de date BOP 2000 mai. Pentru a extrage componentele principale în SPSS, selectaţiData Reduction | Factor… din meniul Analyze.

  9. Selectarea variabilelor 1.Mutaţi variablele div1- div11în secţiunea Variables. 2. Click pe butonul Descriptives…pentru a obţine statistici de evaluare a adecvării modelului la date .

  10. Statistici de evaluare a adecvarea analizei factoriale 1.MarcaţiUnivariate descriptivespentru a afla câte cazuri valide au fost introduse în analiză. 2.Selectaţi Initial solutionpentru a obţine statisticile necesare pentru a determina câte componente principale să păstraţi. 6.Click butonul Continue. 5.MarcaţiAnti-image, o altă statstică necesară evaluării adecvării modelului. 3.MarcaţiCoefficientspentru a obţine matricea e corelaţie, necesară pentru a evalua în ce măsură analiza factorială este adecvată pentru aceste variable. 4. Selectaţi KMO and Bartlett’s test of sphericitypentru a obţine statistici necesare evaluării adecvării analizei factoriale pentru aceste variable.

  11. Metoda de extragere Click pe Extraction…pentru a selecta modelul Metoda de extragerese referă la metoda matematică şi la asumpţiile pe care le facem relativ la modelcând calculăm factoriisau componentele.

  12. Metoda de extragere 3.Click butonul Continue . 1. Pentru început retinem metoda implicită Principal components. 2. Scree plot este o reprezentare grafică care ne ajută să selectăm numărul adecvat de componente principale. Metoda componentelor principale porneşte de la asumpţia că (a) varianţa unei variabile se descompune în varianţa comună şi varianţa unică şi (b) ca nu avem erori de măsurare

  13. Rotaţia soluţiei iniţiale 3.Click butonul Continue 1. Selectăm metoda de rotaţie. Pentru început selectăm o metodă ortogonală: Varimax 1. Selectăm metoda de rotaţie. Pentru început selectăm o metodă ortogonală: Varimax 2. Solicităm reprezentarea grafică a relaţiei dintre componentele extrase şi variabilele introduse în analiză

  14. Încheiere solicitare output 1.Click OK

  15. Scale demăsurare • Variabilele sunt ordinale. Nivelul solicitat de măsurare este intervale sau rapoarte. Pentru că scalele ordinale folosesc proprietatea ordinalităşii numerelor (nu şi cea a caridinalităţii) unii analişti le consideră numerice şi prin urmare se consideră că se satisface cerinţa acestei metode. • Totuşi simulările au arătat că atunci când se foloseşte corelaţia Pearsons pentru variabile ordinale (şi cu dihotomice) analiza factorială NU poate extrage corect componentele principale sau factorii latenţi! • Metoda este însă suficeint de acurată dacă se folosesc corelaţii adecvate pentru aceste scale de măsură: • Dihotomice: r tetracorhic • Ordinale: τb Cea mai eficentă formă de corelaţie pentru variabilele ordinale este corelaţia policorhică o generaliza a corelaţiei tetracorhice şi care porneşte de la asumpţia că variabila ordinală este o variabilă continuă şi îi adaugă cozi marginale. Această corelaţie nu este implementată încă în SPSS • O altă soluţie este să se realizeze o analiză de omogenitate care este o descompunere în componente principale nonliniară

  16. Cerinţe legate de mărimea eşantionului şi numărul variabilelor 1. Numărul de cazuri valide pentru acest set de variable este1219. Pentru a realiza o analiza a componentelorprincipale este bine pentru validitatea interpretării să avem pentr 100 cazuri. 2. Raportul dintre numărul de cazuri şi variabilear trebui să fie 5 to 1 (unii analişti merg la 2 la 1). Noi avem 1219 cazuri şi 12 variabile. Raportul este 101 la 1. Este foarte bun.

  17. Adecvarea analizei factoriale: existenţa unor corelaţii subtanţiale Analiza componentelor principale necesită ca unele corelaţii între variabilele incluse în analiză să fie mai mari de 0.30. Pentru acest set de variabile există 8 corelaţii mai mari de 0.30. Corelaţiile care îndeplinesc cerinţa sunt subliniate cu galben.

  18. Adecvarea analizei factoriale: corelaţii parţiale şi adecvarea eşantionării 2. Pe diagonală sunt raportaţi Măsuri Kaiser-Meyer-Olkin ale adecvării eşationului . Ele raportează corelaţiile unei variabile la coeficieţii săi parţiali, iar cerinţa este ca este valori să fie mai mari ca 0.50 pentru fiecare variabilă. Toate Măsurile de adecvare a eşationului depăşesc 0.05. SPSS raportează atât covariaţia anti-imagine, cât şi corelaţia anti-imagine. Corelaţiile anti-imagine indică coeficienţi de corelaţie parţiali (corelaţia dintre două variabile, când sunt ţinuţi constante celelalte variabile) 1. În afara diagonalei Dacă corelaţiile parţiale sunt mici atunci între factorii unici există corelaţie mică Noi dorim ca ele să fie cât mai mici pentru ca să există posibilitatea factorilor comuni.

  19. Adecvarea analizei factoriale: corelaţii parţiale şi adecvarea eşantionării 1. O măsură globală de adecvare a eşantionării este KMO = 0.761 pentru acest set de variabile. El este mai mare de 0.50 prin urmare continu[m analiza. 2. Testul de sfericitate Bartlett verifică cu ajutorulu unui test χîn ce măsură există o diferenţă între matricea de corelaţie propriu-zisă şi o matrice de corelaţie în care corelaţiile ar fi 0 şi varianţele 1 (matricea identitate). În cazul nostru diferenţa este semnificativă p < 0.001.

  20. Numărul de factori care trebuie extraşi: criteriul valorilor proprii mai mari ca 1 Aceste componente principale explică din totalul varianţei (11) doar 5.95, adică 54.148. Un alt criteriu pentru selectarea numărului de componente principale este să trecem pragul de 70.0% în explicarea varianţei. Acest criteriu tinde să supraestimeze CP. Criteriul valorilor proprii mai mari ca 1 indică că am putea avea 3 componente. Acest criteriu tinde să supraestimeze numărul componentelor princiale necesare pentru a reproduce datele. Acesta este criteriu implicit în SPSS.

  21. Numărul de factori care trebuie extraşi: graficul Scree Plot

More Related