270 likes | 508 Views
Statistiques. Séance 10 N. Yamaguchi. Résumé de la séance précédente. Les ANOVA À 1 facteur à n niveaux À 1 facteur à mesures répétées À 2 facteurs (+ notion d’interaction) Les corrélations Test paramétrique: Pearson Test non paramétrique: Spearman. Rappel : corrélation de Spearman.
E N D
Statistiques Séance 10 N. Yamaguchi
Résumé de la séance précédente • Les ANOVA • À 1 facteur à n niveaux • À 1 facteur à mesures répétées • À 2 facteurs (+ notion d’interaction) • Les corrélations • Test paramétrique: Pearson • Test non paramétrique: Spearman
Rappel : corrélation de Spearman • Prend en compte les rangs • Exercice sur Spearman
Le Khi (Chi) 2 Ou χ2
Pourquoi faire? • Comparer des distributions ou des formes de distributions • Etude des fréquences ou des effectifs impliquant des variables nominales. Pas de variables continues! • Exemple du début : la BU.
Comparaison d’une distr observée et d’une distr théorique • Une seule variable nominale • On analyse une seule distribution. • Question : est-elle homogène (= semblable à la distribution théorique) • H0: oui. Répartition homogène des effectifs.
Exemple (1) cf I. Lehiste • Perception du contexte d’une phrase par 30 auditeurs. • Tableau pour la phrase lue isolément • Comparaison avec la distrib théorique: répartition homogène des effectifs. • Note: variable nominale à 4 modalités (les rentrer comme une variable continue ds Statview) • H0?
Procédure • Données: comme une variable continue • Pas d’étiquettes! • Pas besoin de rentrer la distribution théorique • Analyse: • Analyse univariée > Khi 2 (désselectionner test-t) > rentrer la distrib théorique!!! • Menu Analyse > test-t > Editer analyse > Khi 2
Résultats • Valeur du Khi 2 à comparer avec p. • Hypothèse nulle non rejetée • Conclusion? • Mais…
Exemple (2ème partie) • Même phrase lue à l’initiale. Distribution aléatoire? • Données: on rajoute une colonne • Procédure : même chose. On peut assigner une autre variable! • Résultats • Conclusion
Un autre cas du Chi 2 • Comparaison de 2 distributions indépendantes • Voir si les 2 distributions sont homogènes. (répartition de fréquences) • Hypothèse nulle: il n’y a pas de relation entre les fréquences des lignes et les fréquences des colonnes
Exemple • Étude sur l’efficacité d’une méthode d’enseignement des langues: labo vs méthode traditionnelle Tableau de contingence
Calcul du Chi 2 • Tableau de contingence: la colonne ds laquelle un sujet se trouve (= réussite vs échec) est contingente (= dépend de) la ligne ds laquelle le sujet se trouve (= exp vs méthode trad) • H0: il n’y a pas de relation entre ligne et colonne
Calcul du Chi 2 (suite) • Calcul de la fréquence attendue si H0 est vraie, pour chaque cellule du tableau:
Calcul du Chi 2 (suite) • Résultat global par rapport à toutes les cellules. • Procédure: • Données • Tableau de contigence > tableau résumé et Chi 2 des cellules
Résultats • Tableau résumé • DDL : (C-1)(R-1) • Valeur Chi 2 et p • Résultats? H0? • Chi 2 des cellules • Décomposition du Chi 2 global selon les cellules (contribution des cellules)
Exercice • Étude de Butler sur la poésie de Sylvia Plath: distribution des longueurs de mots dans 2 de ses recueils
Exercice • Quelle est H0? • Quels sont les résultats?
Rappel! Quel test utiliser? • Il faut connaître: • Le type de distribution: test paramétrique ou non paramétrique? • Le nombre de variables et le nombre de leurs modalités • Le type de données: fréquences, mesures? • Ce qu’on veut étudier!
1. Tester les différences entre groupes Groupes indépendants : ce ne sont pas les mêmes sujets! • Paramétrique • 1 variable nominale à 2 modalités; mesures : test-t indépendant • (test-t univarié: moyenne théorique) • 1 variable nominale à 3 ou + modalités, mesures: ANOVA à 1 facteur à n niveaux
1. Tester les différences entre groupes • Paramétriques (suite): • 2 variables nominales: ANOVA à 2 facteurs • Non paramétriques: • 1 variable nominale à 2 modalités; mesures: test U de Mann-Whitney • 1 variable nominale à 3 ou + modalités, mesures: test des rangs de Kruskal-Wallis
2. Tester les différences entre variables Mêmes sujets, mais conditions différentes • Paramétriques: • 1 variable continue (mesures), 1 variable indépendante (à 2 modalités = 2 conditions): test-t apparié • 1 variable continue (mesures), 1 variable indépendante (à 3 ou + modalités = 3 ou + conditions): ANOVA à mesures répétées
2. Tester les différences entre variables • Non paramétriques: • Mesures, 1 variable indépendante (à 2 modalités = 2 conditions): test des rangs de Wilcoxon • Fréquences / effectifs, 1 variable indépendante aux modalités dichotomiques: Chi 2
2. Tester les différences entre variables • Non paramétriques (suite) • 1 variable continue (mesures), 1 variable indépendante (à 3 ou + modalités = 3 ou + conditions): test de Friedman
3. Tester les relations entre variables • Paramétriques: corrélation de Pearson • Non paramétriques: corrélation des rangs de Spearman ou Chi 2 (fréquences / effectifs et variable à modalités catégorielles)