1 / 77

Analyse Factorielle Exploratoire

Analyse Factorielle Exploratoire. Michel Tenenhaus. 1. Les données de Kendall. Tableau des corrélations. One of the questions of interest here is how the variables cluster, in the sense that some of the qualities may be correlated or

baka
Download Presentation

Analyse Factorielle Exploratoire

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Analyse Factorielle Exploratoire Michel Tenenhaus

  2. 1. Les données de Kendall

  3. Tableau des corrélations One of the questions of interest here is how the variables cluster, in the sense that some of the qualities may be correlated or confused in the judge’s mind. (There was no purpose in clustering the candidates - only one was to be chosen).

  4. 2. Classification Ascendante Hiérarchique des variables * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * Dendrogram using Complete Linkage (Méthode des voisins les plus éloignés) Rescaled Distance Cluster Combine C A S E 0 5 10 15 20 25 Label Num +---------+---------+---------+---------+---------+ X6 6 òûòòòòòòòø X12 12 ò÷ùòø X8 8 òûòøóó X11 11 ò÷ùòòòòò÷ùòòòòòòòòòòòòòòòòòòòø X5 5 òòò÷óó X10 10 òòòòòûòòòòò÷ùòòòòòø X13 13 òòòòò÷óó X2 2 òòòòòòòòòòòòòòòòòòòòòòòòòòòòòòò÷ùòòòòòòòòòòòø X4 4 òòòòòòòòòòòûòòòòòòòòòòòòòøóó X14 14 òòòòòòòòòòò÷ùòòòòòòòòòòò÷ó X7 7 òòòòòòòòòòòòòòòòòòòòòòòòò÷ó X9 9 òòòòòòòòòòòûòòòòòòòøó X15 15 òòòòòòòòòòò÷ùòòòòòòòòòòòòòòòòòòòòòòòòòòòøó X1 1 òòòòòòòòòòòòòòòòòòò÷ùò÷ X3 3 òòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòò÷

  5. Interprétation des blocs Bloc 1 : Qualités humaines favorables au poste (Appearance), Self-confidence, Lucidity, Salesmanship, Drive, Ambition, Grasp, Potential Bloc 2 : Qualités de franchise et de communication Likeability, Honesty, Keenness to join Bloc 3 : Expérience Form of letter of application, Experience, Suitability Bloc 4 : Diplôme Academic ability

  6. 3. Uni-dimensionabilité d’un bloc de variables Question : Un bloc de variables Xj est-il essentiellement unidimensionnel ? Réponse : • 1) La première valeur propre 1 de l’analyse en • composante principale du bloc est supérieure à 1, • les autres sont inférieures à 1. • Chaque variable est plus corrélée à la première • composante principale qu’aux autres composantes • principales. • Chaque variable Xj a une corrélation supérieure • à 0.5, en valeur absolue, avec la première composante.

  7. Application : ACP de chaque bloc Bloc 1 Bloc 1 unidimensionnel

  8. Application Bloc 2 Bloc 3

  9. Fiabilité de l’instrument de mesureMesure globale de l’homogénéité d’un bloc de variables positivement corrélées entre elles :L’Alpha de Cronbach Question : Comment mesurer globalement la fiabilité de l’instrument de mesure ? C’est à dire le niveau d’homogénéité d’un bloc de variables xipositivement corrélées entre elles ? Réponse : Utilisation du Alpha de Cronbach

  10. où : Le modèle avec les eiet indépendants.

  11. Définition du  de Cronbach Formule de calcul du  de Cronbach •  1, et = 1 lorsque toutes les corrélations entre les xi sont égales à 1 et toutes les variances des xisont égales.

  12.  de Cronbach pour items centrés-réduits On a la décomposition suivante : Si les variables sont centrées-réduites on obtient : Un bloc de variables positivement corrélées entre elles est homogène si la corrélation moyenne est grande.

  13. de Cronbach pour items centrées-réduites Le rapport devient : Un bloc est considéré comme homogène si : -   0.6 pour des recherches exploratoires -   0.7 pour des recherches confirmatoires

  14. Application :  de Cronbach de chaque bloc Bloc 1 Les corrélations sont toutes positives.

  15. Bloc 1 R E L I A B I L I T Y A N A L Y S I S - S C A L E (A L P H A) Item-total Statistics Scale Scale Corrected Mean Variance Item- Squared Alpha if Item if Item Total Multiple if Item Deleted Deleted Correlation Correlation Deleted X2 41.2708 364.1591 .5052 .4435 .9599 X5 41.4167 327.0142 .8356 .7957 .9435 X6 42.0417 300.9344 .8633 .8823 .9404 X8 43.5625 289.2726 .8883 .8530 .9391 X10 43.0417 312.5940 .8122 .7783 .9438 X11 42.3750 305.6011 .8937 .8493 .9384 X12 42.1042 303.3293 .8834 .8853 .9390 X13 42.6667 301.1206 .8570 .8345 .9409 Reliability Coefficients 8 items Alpha = .9503 Standardized item alpha = .9489 Scale = Somme des variables

  16. Bloc 2 Item-total Statistics Scale Scale Corrected Mean Variance Item- Squared Alpha if Item if Item Total Multiple if Item Deleted Deleted Correlation Correlation Deleted X4 13.6042 19.5208 .7823 .6127 .6185 X7 11.7083 25.1472 .5986 .4166 .8125 X14 14.1875 23.4747 .6312 .4695 .7820 Reliability Coefficients 3 items Alpha = .8153 Standardized item alpha = .8138

  17. Bloc 3 Item-total Statistics Scale Scale Corrected Mean Variance Item- Squared Alpha if Item if Item Total Multiple if Item Deleted Deleted Correlation Correlation Deleted X1 10.1875 36.9641 .6165 .3824 .8184 X9 11.9583 28.3812 .7043 .5107 .7287 X15 10.2292 27.7974 .7318 .5405 .6981 Reliability Coefficients 3 items Alpha = .8223 Standardized item alpha = .8237

  18. 5. ACP des données de Kendall

  19. ACP des données de Kendall Les corrélations inférieures à 0.5 en valeur absolue ne sont pas montrées.

  20. ACP + « Rotation Varimax » Seules sont montrées les corrélations maximum en valeur absolue sur chaque ligne.

  21. 6. Analyse Factorielle orthogonale 6.1. Les données p variables aléatoires X1,…, Xp, en général centrées-réduites. 6.2. Le modèle X1 = 11Y1 + … + 1mYm + e1 . . . Xi = i1Y1 + … + imYm + ei . . . Xp = p1Y1 + … + pmYm + ep où : Yj = facteurs communs centrés-réduits ei = facteurs spécifiques centrés et de variance i Les facteurs Y1,…, Ym, e1,…, em sont tous non corrélés entre eux.

  22. 6.3. Analyse Factorielle (Option analyse en composantes principales) Les données p variables X1,…, Xpcentrées-réduites. Estimation des facteurs Y1, …, Ym Les m premières composantes principales réduites. Choix de m Nombre de valeurs propres supérieures à 1.

  23. Application Kendall

  24. Calcul des saturations (loadings) ij Les loadings ijsont les coefficients de régression des Yj dans la régression de Xi sur les facteurs Y1,…, Ym. Les facteurs étant orthogonaux (= non corrélés) on a : ij = Cor(Xi, Yj) Calcul des communautés (communalities) hi2

  25. Application Kendall Matrice des corrélations entre les variables et les facteurs

  26. hi2 = communauté Var(ei) = spécificité Calcul des spécificités i Qualité de la décomposition Variance expliquée par Y1 ( = 1) Variance expliquée par Ym ( = m) Variance totale Variance résiduelle

  27. Communauté Variance expliquée Application Kendall avec m = 4

  28. 6.4. Décomposition de R en AF orthogonale Modèle :Xi = i1Y1 + … + imYm + ei Formules de décomposition :

  29. Formule générale R =  + 

  30. 6.5. Les objectifs de l’AF orthogonale L’analyse factorielle orthogonale consiste à rechercher une décomposition de la matrice des corrélations R de la forme : R =  +  Les ij sont les saturations et les i les spécificités. Méthodes usuelles d’extraction des saturations : - Analyse en composantes principales - Méthodes des facteurs principaux - Méthodes des moindres carrés - Méthodes des moindres carrés pondérés - Maximum de vraisemblance

  31. Application Kendall R =

  32. m = 4

  33. 6.6. Les méthodes de rotation Formule de décomposition (p = 3, m = 2) :

  34. cos * -sin cos sin * Les méthodes de rotation Matrice de rotation d’un angle  : Y Y´ y´ A y * T X x  Matrice de rotation T : T´T = T T´= I x´ x´ = Proj(A) sur l’axe X´ y´ = Proj(A) sur l’axe Y´ X´

  35. Indétermination de la décomposition I Nouvelle matrice des saturations après rotation :

  36. Les méthodes de rotation VARIMAX et QUARTIMAX Objectifs : (1) Pour chaque colonne de  les |ij| sont proches de 0 ou 1 : ==> Facteurs bien typés. C’est l’objectif de VARIMAX. (2) Sur chaque ligne de  il y a un |ij| proche 1 et tous les autres proches de 0 : ==> Typologie des variables. C’est l’objectif de QUARTIMAX.

  37. R2(Xj;Y1,Y2)  = Exemple avec les blocs 2 et 3 Seulement dans l’option ACP

  38. Exemple avec les blocs 2 et 3

  39. =  = T Utilisation de la rotation Varimax * ( TT = I ) 

  40. Utilisation de la rotation varimax

  41. Exemple Kendall completApplication (ACP + Varimax)

  42. Application (ACP + Varimax)Présentation améliorée Corrélations inférieures à 0.4 en valeur absolue non montrées

  43. 6.7. Estimation des facteurs communs(AF orthogonale) On recherche une variable (ou score) aussi proche que possible de Yj. La régression de Yj sur X1,…, Xp donne :

  44. Application (ACP + Varimax) Coefficients appliqués aux variables centrées-réduites

  45. Estimation des facteurs

  46. 7. Test de sphéricité de Bartlett Test : H0 : R = Identité (aucune corrélation entre les X) On rejette H0 au risque  de se tromper si

  47. Application

  48. Xi =  i1Y1 + … +  imYm + ei ==> Cor(Xi, Xk / Y1, …, Ym) = Cor(ei, ek) = 0 8. Kaiser-Meyer-Olkin Measureof Sampling Adequacy La corrélation partielle Xi = i0 + i1Y1 + … + imYm + i Xk = k0 + k1Y1 + … + kmYm + k ==> Cor(Xi, Xk / Y1, …, Ym) = Cor(i, k) Pour un modèle factoriel : Les facteurs spécifiques sont non corrélés entre eux. « Anti-image correlation » -aik : Si le modèle factoriel est vrai les aik = cor(Xi, Xk/ Autres X) sont faibles en valeur absolue.

More Related