1.13k likes | 1.95k Views
Tests non paramétriques. Contre paramétriques. Tests libres. Certains tests statistiques ne sont valables que sous certaines conditions concernant la forme de la distribution des variables: le test de Student suppose par exemple des lois normales. L’anova également.
E N D
Tests non paramétriques Contre paramétriques
Tests libres • Certains tests statistiques ne sont valables que sous certaines conditions concernant la forme de la distribution des variables: le test de Student suppose par exemple des lois normales. L’anova également. • D’autres tests au contraire sont valables indépendamment de toute distribution. C’est le cas du test du khi², des signes, ou du coefficient de Spearman. On les nomme tests « libres » ou « indépendants de toute distribution » (distribution-free tests). Université de Metz | Licence de psychologie
Tests paramétriques • Certains tests ont pour but de démontrer une inégalité sur des paramètres (moyenne en général): anova, comparaisons de moyenne, test du coefficient de corrélation, test de Levene (variances)… Ce sont des tests paramétriques. • D’autres testent des hypothèses plus générales: égalité de lois, indépendance de variables nominales: tests du khi², tests de Kolmogorov-Smirnov, du tau de Kendall… Ce sont des tests non-paramétriques. Université de Metz | Licence de psychologie
Choix de tests • Habituellement, les tests paramétriques sont plus puissants — on les choisira de préférence — que les tests non paramétriques. • De même les tests non libres sont généralement plus efficaces que les tests libres. • Cependant, ils sont aussi plus contraignants, car il faut vérifier les conditions d’application, plus nombreuses. On choisira généralement un test libre ou non paramétrique lorsque • les conditions d’utilisation des autres tests ne sont pas vérifiées • il est impossible de vérifier ces conditions. Université de Metz | Licence de psychologie
Plan • Les parieurs — test des signes • Baisse d’attention & Alzheimer — Wilcoxon (indépendant) ou Mann-Whitney • Les Japonais — Kruskal-Wallis ou test des médianes • Cigarette et anxiété — Wilcoxon (apparié) • Luttons contre la timidité — Friedman • La porte! — test binomial • Les étudiants trichent-ils? — runs test (test des séquences) • Le QI des dépressifs — Kolmogorov-Smirnov à un échantillon • Opinions racistes — réactions extrêmes de Moses • Effet de la cocaïne sur les compétences réelles et imaginées — tests de Kolmogorov-Smirnov pour deux échantillons et de Wald-Wolfowitz. • Episodes stressants et dépression — test de Jonckheere-Terpstra • Ne pas jeter sur la voie publique — Mc Nemar • Ne pas jeter sur la voie publique II — Homogénéité marginale • Utilisabilité — test Q de Cochran Université de Metz | Licence de psychologie
1. Les parieurs Test des signes
Expérience Des joueurs parient à la machine à sous certaines sommes d’argent. Pour chacun des parieurs, on relève la somme moyenne par pari sur 10 paris, et cela dans deux situations: d’une part dans la situation témoin (sans observateur), et d’autre part lorsque 2 témoins les regardent (situation test). Les groupes sont appariés pour le genre et contrebalancés pour l’ordre des deux situations. La question est: les individus parient-ils plus lorsqu’ils sont observés? Université de Metz | Licence de psychologie
Student • Le plus évident serait d’utiliser un test de comparaison de moyennes pour échantillons appariés, afin de déterminer si la différence D=Xtest-Xtémoin est nulle en moyenneou non. • Il s’agit alors d’un test de Student, utilisé sur la variable D. Notre échantillon est de taille 20, ce qui est faible. • Avant de commencer le test de Student, on représente les données observées pour vérifier au moins graphiquement la normalité. Université de Metz | Licence de psychologie
Donc • Il n’est pas légitime ici d’utiliser le test prévu, parce que l’échantillon est petit et que la variable D n’est probablement pas normale. • On se rabat donc sur un test non paramétrique: le test des signes. Quelques remarques s’imposent. Université de Metz | Licence de psychologie
Remarques • Nous voulions tester la différence moyenne entre les paris avec et sans observateurs, mais nous allons tester une autre hypothèse. Avec Student, on vérifie que les paris témoin (par exemple) sont inférieurs en moyenne aux paris test. Avec le test des signes, on testera que les paris témoins sont en général inférieurs aux paris test. • Nous utilisons un test peu puissant. En fait, on perd énormément d’information, puisqu’on ne conserve que le signe de D. Si D suivait une loi normale, ou si on avait un gros échantillon, un test de comparaison de moyennes serait de loin préférable. Université de Metz | Licence de psychologie
Résultats • On calcule par ordinateur les résultats pour le test des signes, qui permet d’opposer l’hypothèse nulle que la première valeur (test) est aussi souvent supérieure qu’inférieure à la seconde (témoin). • Dans les résultats qui suivent, on a utilisé la différence témoin-test, si bien qu’une différence négative indique des paris plus élevés dans la situation test. Université de Metz | Licence de psychologie
statistiques descriptives résultats du test des signes Université de Metz | Licence de psychologie
Conclusion • Le test des signes fonctionne. On peut donc conclure H1 (effet de la présence d’observateurs) contre H0 (pas d’effet). Cela au risque de 0.1%. Il resterait à étudier, bien entendu, le lien entre les observateurs et les parieurs. Mais ça n’est pas un problème purement statistique. • Le test des signes permet de comparer deux variables (i.e. deux échantillons appariés). Université de Metz | Licence de psychologie
Berardi, A. et al. Sustained Attention in Mild Dementia of the Alzheimer Type. A paraître. Attention soutenue Test U de Mann-Whitney Test de Wilcoxon pour échantillons indépendants
Principe • On dispose d’un groupe témoin (n=10) et de patients de type Alzheimer (n=10), appariés pour l’âge et le genre. • On relève par une variable X numérique la baisse de l’attention au cours d’une séance d’exercices cognitifs (reconnaissance d’une lettre apparaissant à l’écran). • On veut montrer — entre autres — que la baisse de l’attention est plus rapide chez les patients (donc X est plus élevé). • Les distributions de X ne semblent pas normales, et les variances diffèrent énormément. Il nous faut une alternative au test de comparaison de moyennes. Université de Metz | Licence de psychologie
Principe • On utilisera donc le test U de Mann-Whitney ou Test de Wilcoxon pour deux échantillons indépendants. • Ce test permet de confronter les hypothèses H0(les deux variables sont du même ordre de grandeur) et H1(l’une des deux variables a tendance à dépasser l’autre). • On observe sur l’échantillon la somme des rangs: la somme la plus élevée correspond aux valeurs les plus grandes. Ici, le groupe Alzheimer est numéroté 2, le groupe témoin est codé 1. Université de Metz | Licence de psychologie
Le test le test U de Mann-Whitney utilise les rangs. le test U de Mann-Whitney est identique au test des sommes des rangs de Wilcoxon. Université de Metz | Licence de psychologie
Conclusion • On peut donc conclure au risque de 2% que les patients Alzheimer présentent globalement une baisse plus marquée de l’attention soutenue (de manière rigoureuse: X est stochastiquement supérieure pour les patients Alzheimer. Université de Metz | Licence de psychologie
Kowner, R. (2002). Japanese body image: Structure and esteem scores in a cross-cultural perspective. International Journal of Psychology, 37. Estime corporelle Test H de Kruskal-Wallis Test des médianes
L’étude • On relève dans différents pays un score d’estime corporelle par une variable quantitative X. • On souhaite savoir si le pays P a un effet sur la variable X. Il est donc tout naturel de s’orienter vers une analyse de variance simple. On vérifie dans un premier temps les conditions d’application. Université de Metz | Licence de psychologie
Conditions d’application Conditions d’application non vérifiées Université de Metz | Licence de psychologie
L’étude • Une solution est de transformer les données. Ici, c’est difficile parce que les distributions sont franchement asymétriques, et d’asymétries opposées. • Nous abandonnons l’idée d’une anova, et utilisons à la place un équivalent de l’anova simple qui utilise non les valeurs mais les rangs: L’analyse de variance à un critère de classification de Kruskal-Wallis (ou H de Kruskal-Wallis). • Nous pouvons aussi penser au test des médianes. Université de Metz | Licence de psychologie
Le test des médianes • Le test des médianes calcule la médiane commune des groupes, disons m, puis transforme la variable dépendante en une variable dichotomique (supérieure ou inférieure à m). Il ne reste plus qu’à effectuer un test du khi² sur ces nouvelles données. • Ce test a l’inconvénient d’être très peu puissant. On le réservera plutôt aux cas où l’on ne peut pas utiliser le test de Kruskal-Wallis (trop d’ex æquo), à moins qu’on ne cherche précisément une différence sur les médianes, ce que détecte ce test. Université de Metz | Licence de psychologie
le tableau de contingence est propice au test du khi² d’indépendance les données sont censurées (dichotomisées) le khi² est significatif au risque de 2.5%, mais pas au risque de 2% Université de Metz | Licence de psychologie
Kruskal-Wallis Le test de Kruskal-Wallis utilise les rangs La variable de décision suit une loi du khi² sous l’hypothèse nulle Université de Metz | Licence de psychologie
Résultats • On peut donc conclure — mais seulement au risque de 2,5% — que les différents pays ne donnent pas les mêmes valeurs de X globalement. Il semblerait que les Japonais aient une estime corporelle inférieure à celle des Canadiens et des Israéliens en général. • Il faudrait faire des tests supplémentaires pour décider si la différence particulière Japon-Canada par exemple est significative ou non. Par exemple, une fera une série de tests de Wilcoxon… en faisant attention au risque. Université de Metz | Licence de psychologie
Juliano, L.M. & Brandon, T.H. (2002). Effect of nicotine dose, instructional set, and outcome expectancies on the subjective effect of smoking in the presence of a stressor. Journal of Abnormal Psychology, 111. Tabac et anxiété Test de Wilcoxon pour échantillons appariés
L’idée • On compare l’anxiété chez des fumeurs ayant à leur disposition des cigarettes (groupe test) et des placebo (cigarettes sans nicotine: groupe témoin). Ils ne sont pas informés de l’absence éventuelle de nicotine. • On utilise un plan répété pour des raisons d’efficacité et parce que les différences inter-individuelles d’anxiété sont importantes par rapport à l’effet attendu de la nicotine. L’échantillon est contrebalancé pour l’ordre. • Pour étudier l’effet de la nicotine, le plus logique est d’utiliser un test de Student pour échantillons pairés. Cependant, la variable différence D=Xnicotine-Xplaceboest bimodale. Université de Metz | Licence de psychologie
Le test • On utilisera alors un test de Wilcoxon pour échantillons appariés, pour opposer l’hypothèse nulle que la nicotine n’a pas d’effet (i.e. le score X d’anxiété est globalement le même dans le deux cas) contre l’hypothèse inverse. Université de Metz | Licence de psychologie
Les données vont dans le sens voulu. La nicotine semble plus efficace. Le test de Wilcoxon se base sur les rangs de la différence Université de Metz | Licence de psychologie
Thérapie comportementale Test de Friedman W de Kendall
Idée • Pour lutter contre la timidité, plusieurs thérapies ont été testées, mais la plus prometteuse est la thérapie comportementale. On mesure, sur quelques patients qui suivent la thérapie, une grandeur X de la gravité des symptômes liées à la timidité. X est relevée 5 fois au cours de la thérapie (intervalles: 8 jours). • On souhaite montrer un effet de la thérapie — en réalité, il faudrait comparer avec un groupe témoin mais nous supposerons que sans thérapie il n’y a pas d’amélioration. Pour cela, on pourrait envisager une anova pour plans répétés, mais les conditions d’application ne sont pas vérifiées. Université de Metz | Licence de psychologie
Idée • On utilisera alors un équivalent de l’anova pour plans répétés, et qui utilise les rangs de la variable pour chaque sujet: le test de Friedman. • Malheureusement, cette méthode ne permet pas — ici c’est sans importance — de montrer un éventuel effet du facteur sujet. Université de Metz | Licence de psychologie
L’ordre est conforme à ce qu’on attend d’une thérapie efficace Université de Metz | Licence de psychologie
La variable de décision suit une loi du khi² sous H0. Université de Metz | Licence de psychologie
Complément • Le coefficient qui sert au test de Friedman a été normalisé: c’est alors le W de Kendall. L’intérêt du W de Kendall est qu’il se lit comme un coefficient de corrélation (il est toujours compris entre 0 et 1). • On peut donc l’interpréter indépendamment de la taille de l’échantillon. Université de Metz | Licence de psychologie
Le W de Kendall (ou coefficient de concordance de Kendall). Il montre ici un accord moyen. Il est plus utile lorsque les différentes valeurs sont données par des juges. le khi² est celui de Friedman Université de Metz | Licence de psychologie
Conclusion • Il y a donc un effet du temps sur la gravité des symptômes. Les rangs vont dans le sens voulu. On conclut à un effet positif de la thérapie. Attention: il faudrait normalement absolument comparer ces résultats à ceux d’un groupe témoin, ne serait-ce qu’à cause du phénomène de régression vers la moyenne. Université de Metz | Licence de psychologie
La porte Test binomial
Principe • Pour des raisons de sécurité, il peut être important de savoir si les gens auront tendance à pousser ou à tirer la porte. • On relève sur un échantillon qui pousse et qui tire la porte. On veut tester l’hypothèse que la distribution pousser/tirer n’est pas uniforme (50%-50%). • On pourrait pour cela utiliser un test du khi² de conformité, mais la variable de décision ne suit pas une vraie loi du khi²: il s’agit d’une approximation. On préfèrera alors un test exact. Université de Metz | Licence de psychologie
Test binomial • On utilisera ici le test binomial. • Ce test n’est valable que dans le cas d’une unique variable dichotomique dont on veut tester la distribution. Université de Metz | Licence de psychologie
les données vont dans le sens voulu (hypothèse alternative) soit 0.3% en bilatéral, donc 0.15% unilatéral proportion théorique Université de Metz | Licence de psychologie
Les étudiants trichent-ils? test des suites en séquences « runs test procedure »
Données • On dispose d’un paquet de copies, qui est encore classé dans l’ordre où les étudiants étaient assis. • On aimerait savoir, comme dans le cas courant d’un échantillon pseudo-aléatoire, si les étudiants ont répondu indépendamment l’un de l’autre ou si l’on trouve au contraire trop de suites de réponses identiques qui se suivent. • Pour le savoir, on raisonne sur les « séquences ». Prenons par exemple la réponse à l’une des questions, qui était le calcul d’un écart type. Une bonne partie des étudiants s’est trompée, soit en calculant l’écart type corrigé, soit en oubliant de prendre la racine carrée… Université de Metz | Licence de psychologie
Données • Nous disposons de nombreuses valeurs différentes de la réponse. • Par rapport à la médiane (ici 4), certaines valeurs sont trop faibles (strictement), ce qu’on notera « - » et d’autres trop grandes (ou égales à la médiane), ce qu’on notera « + ». On compte alors le nombre de séquences, qui devrait être ni trop petit (les voisins copient) ni trop élevé (les voisins font le contraire l’un de l’autre). • Le test des séquences (runs test) permet de vérifier que le nombre de séquences est raisonnable. Université de Metz | Licence de psychologie
séquence 2 séquence 7 séquence 1 Université de Metz | Licence de psychologie
Séquences • Nous avons ici 7 séquences. Est-ce trop? trop peu? Le test des séquences y répond. • Ce que nous testons ici par rapport à la médiane peut aussi être testé par rapport à n’importe quelle valeur (notamment la bonne réponse 8). Il ne faut pas, bien entendu, tester un trop grand nombre de valeurs distinctes, car cela fausserait la signification. • Nous testons ici avec le runs test la médiane et la bonne réponse. Université de Metz | Licence de psychologie
la médiane et 4 16 valeurs sont inférieures à la médiane et 27 supérieures On a 6 séquences sur une suite de 43 valeurs. Les étudiants ont triché On attendait plus de séquences (z<0) Université de Metz | Licence de psychologie