1 / 40

Liaison entre variables qualitatives

Liaison entre variables qualitatives. Introduction. Rappel Variables qualitatives Exemple sexe (homme, femme) secteur d’études (lettres, sciences) Etudier la relation entre les deux Se base sur les effectifs. Données brutes. variables. individus. Effectifs observés. Tri croisé

sevilen
Download Presentation

Liaison entre variables qualitatives

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Liaison entre variables qualitatives

  2. Introduction Rappel Variables qualitatives Exemple sexe (homme, femme) secteur d’études (lettres, sciences) Etudier la relation entre les deux Se base sur les effectifs

  3. Données brutes variables individus

  4. Effectifs observés • Tri croisé • on répartit les effectifs en fonction des combinaisons de modalités modalités variable 2 modalités variable 1 Source : Université de Provence, 2002-2003

  5. Tri croisé • Fréquences marginales • totaux des lignes et des colonnes (marges)

  6. Expression en pourcentages

  7. Effectifs attendus • Dans le cas de l'hypothèse nulle, c'est-à-dire si les proportions étaient les • mêmes pour chaque groupe.

  8. Effectifs attendus

  9. Effectifs attendus

  10. Comparaison Attendus Observés

  11. Ecarts Attendus Observés

  12. Ecarts carrés Ecarts

  13. Ecarts carrés relatifs b Attendus Ecarts carrés a a/b

  14. 2 • Chi-deux Somme 2 = 2157,4

  15. Formule • Distribution du chi2 avec un degré de liberté ddl = (R - 1)(C - 1) • R nombre de lignes • C nombre de colonne

  16. Distribution du χ2 pour 1, 2, 3, 5 ou 10 degrés de libertés

  17. La surface sous la courbe donne la probabilité de rejet de l'hypothèse nulle à tort. Elle correspond à la probabilité d'obtenir une valeur de χ2 au moins aussi grande que la probabilité critique par le seul fait du hasard. χ2 de 10.10

  18. Test d’hypothèse • Statistique inférentielle • Le 2permet de tester l’hypothèse d’indépendance des variables : • les données observées résultent simplement de fluctuations dues au hasard • On peut mesurer la probabilité p de se tromper en rejetant l’indépendance

  19. Tableur Pratiquement aucune chance de se tromper en rejetant l’indépendance : il y a bien un effet significatif

  20. Tableur 30% de chances de se tromper en rejetant l’indépendance : pas d’effet significatif

  21. Seuils de rejet • Seuils de rejet • p < 0,05 en sciences humaines • p < 0,01 si l’on veut être très strict

  22. Attention • Ne jamais employer le test de chi-deux si certains des effectifs attendus sont  5.

  23. Problème • 2 dépend de l’effectif • difficile d’apprécier la valeur du 2 dans l’absolu • on peut normaliser le coefficient pour le rendre indépendant de la taille

  24. Coefficient  • Phi • varie entre 0 et +1 • analogue au coefficient de corrélation des variables quantitatives 2 =  = 2157,4 0,30

  25. Application linguistique • Force d’association entre mots • Deux mots sont associés s’ils apparaissent souvent ensemble dans des pages Web • Ex. : • Chirac + Jospin • Chirac + Corona • etc.

  26. Exemple • Google (réglé sur tout le Web) • On va chercher • A = Nombre d’occurrences Chirac • B = Nombre d’occurrences Jospin • C = nombre de cooccurrences Chirac Jospin • N = Nombre total de pages

  27. A B C N

  28. Formule directe • Une formule un peu compliquée, mais qui évite les calculs intermédiaires :

  29. Classement • Par  décroissant :

  30. Analyse/Tableau croisé

  31. Carte d’analyse factorielle

  32. Test: chi2

  33. Graphe de relation Pour définir ce graphe il faut passer par le tableau de bord/vues/Nouvelles vues

  34. Arbre de décomposition Pour définir cet arbre il faut passer par le tableau de bord/vues/Nouvelles vues/

  35. Corrélation Traitements et analyses/Analyser/Corrélations

  36. Analyse factoriel multiple • Une extension de l’analyse factoriel simple à plusieurs variables qualitatives (fermées unique ou multiple)

  37. Tableau de Burt Les éléments matriciels diagonaux du tableau de Burt correspondent à des tris à plats sur chaque variable Dans Sphinx:Traitement et analyse/Approfondir

  38. Projection sur les plans factoriels Remarques: Les deux premiers axes fournissent le premier plan factoriel où un maximum d'information sont représentées graphique: déterminer à partir des valeurs propres

More Related