340 likes | 516 Views
Tests NON paramétriques. UE 45.2 CHV. Pierre MORETTO, Université Paul Sabatier, Toulouse III. Tests non paramétriques. Les étapes. Conditions d’utilisation Test sur les fréquences (Khi²) Comparaisons d’échantillon: Données Non appariées (Mann & Withney) Données appariées
E N D
Tests NON paramétriques UE 45.2 CHV Pierre MORETTO, Université Paul Sabatier, Toulouse III.
Tests non paramétriques Les étapes • Conditions d’utilisation • Test sur les fréquences (Khi²) • Comparaisons d’échantillon: • Données Non appariées • (Mann & Withney) • Données appariées • (Wilcoxon)
Condition d’utilisation • Les données sont dîtes non paramétriques lorsque: • Les valeurs sont nominales, ordinales, d’intervalle ou de rapport (Cf CH I) • Le nombre de sujets est insuffisant pour vérifier la normalité de la distribution • La distribution n’est pas normale (Gaussienne) • Dans ces cas, les tests non paramétriques sont de rigueur
Condition d’utilisation et utilités • Khi² non paramétrique: compare 2 ou plus séries de données nominales arrangées en catégories pondérées par leurs fréquences d’apparition. • Le U de Mann et Withney détermine la signification de la différence entre 2 variables ordinales non appariées • Le test « W » de Wilcoxon : idem à U mais pour variables appariées
Le Khi² (²) non paramétrique Compare 2 ou plus séries de données nominales arrangées en catégories pondérées par leurs fréquences d’apparition. Cas 1: Comparer distribution de contingences d’1 variable nominale (types de chaussure)
Le Khi² (²) non paramétrique Exemple: • Les chaussures de marque « X » sont classées de A à E suivant leur niveau de technicité et leur coût de production. • Pour optimiser le gain, X sait qu’il doit vendre 10% de A, 30% de B, 35 de C, 20% de D et 5% de F • Sur 141 chaussures, un magasin M vend finalement A(30), B(57), C(32), D(15) et E(7). • Le magasin optimise-t-il son engagement vis-à-vis de la marque X ?
Le Khi² (²) non paramétrique • Ce premier exemple illustre l’application du test à une série de fréquences observées dans des groupes (variable nominale). • Il s’agit ici de comparer les volumes de vente attendus à ceux observés d’où ce premier tableau:
² non paramétrique • L’indice ² est calculé sur la base de la différence entre Obs et Théo: • Appliqué à nos valeurs:
² non paramétrique • Détermination du Khi² théorique • Lecture au risque et ddl=catégories-1 • Nb: ici 5 catégories de A à E
² non paramétrique • Décision finale: • ² calculé est de 35 • ² théorique est de 13.28 • ² calculé >² théorique au risque considéré donc la différence est significative au risque . • La magasin sera enjoint de revoir la promotion des chaussures pour corriger ses ventes.
² non paramétrique Compare 2 ou plus séries de données nominales arrangées en catégories pondérées par leurs fréquences d’apparition. Cas 2: Comparer distribution de contingences sur 2 variables nominales (type d’entraînement et niveaux d’habilété)
Le Khi² (²) non paramétrique • Exemple: • 2 groupes de nageurs apprennent le Crawl grâce à des méthodes différentes (A et B). • A la fin d’entraînements menés sur 5 semaines, l’observateur classe les sujets en « Bons », « Moyens » et « Mauvais »
² non paramétrique • Comment comparer ces 2 méthodes d’apprentissage du crawl ? • 1) Considérer le classement niveau d’habileté toutes méthodes confondues • 2) En déduire une fréquence d’apparition théorique 36/107 « bons » Soit 34%
² non paramétrique • Répété pour chaque niveaux d’habileté • Déduire un nombre de sujets théorique indépendant de l’entraînement pour chaque groupe: • Ex: Théoriquement « Bons » en méthode A: 0.34*55=18.5
² non paramétrique • Déterminer un effectif théorique pour chaque groupe
² non paramétrique • Nous avons donc un effectif observé et un théorique • Le test du ² va permettre de comparer ces 2 effectifs
² non paramétrique • L’indice est calculé sur la base de la différence entre Obs et Théo: • Appliqué à nos valeurs:
² non paramétrique • Détermination du Khi² théorique • Lecture au risque et ddl=(ligne-1)*(colonne-1) • Nb: ligne et colonne du tableau
² non paramétrique • Décision finale: • ² calculé est de 2.35 • ² théorique est de 4.61 • ² calculé <² théorique au risque considéré donc la différence n’est pas significative au risque . • La méthode d’apprentissage n’a pas d’effet sur la maîtrise finale de l’habileté et les méthodes A et B se valent.
Tests non paramétriques Les étapes • Conditions d’utilisation • Test sur les fréquences (Khi²) • Comparaisons d’échantillon: • Données Non appariées (Mann & Withney) • Données appariées (Wilcoxon)
Test « U » de Mann et Withney Compare 2 séries de variables ordinales ou réelles non appariées et non gaussiennes.
Mann et Withney • Soit 2 échantillons x et y de nx et ny variables ordinales, • Le test de Mann & Withney va comparer les rangs des 2 séries de variables
Mann et Withney • Détermination des rangs
Mann et Withney • Classement et calcul de l’indice « U »
Mann & Withney • Hypothèse Ho correspondant à une alternance des valeurs x et y implique que Uo=Nx.Ny/2
Détermination du « u » Théorique • À la colonne n1 et ligne n2-n1
Mann & Withney • Hypothèse Ho correspondant à une alternance des valeurs x et y implique que Uo=Nx.Ny/2 • Le plus petit des 2 « U » est comparé à la valeur théorique au risque
Mann & Withney • Règle de décision: Si, au risque alpha, U (plus petit des Ux/y et Uy/x) < Uthéorique alors les populations diffèrent significativement. • Donc ici: 8>3 (ou 1) et la différence n’est pas significative au risque de 5% (1%)
Test « W » de Wilcoxon Compare 2 séries appariées de variables ordinales ou réelles non gaussiennes.
Wilcoxon • Le début du test est identique à Mann & Withney • Classement et calcul de l’indice « W »
Wilcoxon vers Mann & Withney • Hypothèse Wo correspondant à une alternance des valeurs x et y implique que Wo=nx.(N+1)/2 • A ce niveau, il existe une équivalence entre « W » de Wilcoxon et « U » de Mann et Withney. • Retour sur la règle de décision du « U »
Wilcoxon vers Mann & Withney • Règle de décision: Si, au risque alpha, U (plus petit des Ux/y et Uy/x) < Uthéorique alors les populations diffèrent significativement. • Donc ici: 8>3 (ou 1) et la différence n’est pas significative au risque de 5% (1%)
Merci de votre attention Les cours sont en ligne sur le site du STAPS L3_UE45.2.