190 likes | 468 Views
Comparaison de moyennes. Dans l’exemple précédent, on a comparé la moyenne d’un groupe à la moyenne de l’amphi. On peut souhaiter comparer les moyennes de deux groupes entre eux : Exemple : licence APA : X APA = 12, nombre d’étudiant N APA =25
E N D
Comparaison de moyennes • Dans l’exemple précédent, on a comparé la moyenne d’un groupe à la moyenne de l’amphi. • On peut souhaiter comparer les moyennes de deux groupes entre eux : • Exemple : • licence APA : XAPA = 12, nombre d’étudiant NAPA=25 • Licence MS : XMS = 11, nombre d’étudiant NMS=36 • Au niveau national : APA = 0.8 , MS = 1.1 La différence est-elle significative ?
Première difficulté • APA = moyenne nationale des APA • MS = moyenne nationale des MS Problème : on ne connaît pas les moyennes nationales • On ne peut donc pas comparer • XAPA à APA • XMS à MS
Solution Solution : • On suppose que les moyennes nationales sont les mêmes • APA= MS • On connaît donc la différence des moyennes : • APA– MS = 0 • Ensuite, on compare XAPA – XMS à APA – MS
Conclusion • On compare donc XAPA – XMS avec la distribution des différence des moyennes d’échantillonnage (DDEX) • Moyenne : DDEX = XAPA – XAPA = 0 • Écart type : • Puis on conclut avec la loi normale :
Exemple • On compare donc 12 – 11 avec la distribution des différence des moyennes d’échantillonnage (DDEX) • Moyenne : DDEX = APA– MS = 0 • Écart type : • Puis on conclut avec la loi normale : P = 0,006% On rejette H0
Deuxième problème (petit air de déjà vu) Généralement, on connaît ni APA ni MS • On remplace APA par sAPA et MS par sMS • Si NAPA et NMS sont grands (>30) : pas de problème, APAet MSsont presque égaux à sAPAet à sMS • Si N est petit (N<30 ) : sAPA et sMS sont des sous estimations de APA et MS • Donc le Z obtenu serait trop grand (par rapport à celui qu’on obtiendrait si on connaissait APA et MS) Dans ce cas, on remplace Z par le T de Student
Variances combinées Problème : le T de Student s’utilise si les variances sont égales APA=MS On triche : si elles sont « raisonnablement » proches APAMS alors on les remplace par la variance commune, qui est la moyenne pondéré de (sAPA)² et (sMS)²
Bilan que l’on résume en
Exemple • Groupe B : • 8, 10, 14, 9, 10 • Moyenne : 10,2 • Écart type : 2,04 • Groupe A : • 10, 12, 13, 9, 12 • Moyenne : 11,2 • Écart type : 1,47 • T observé=0,89 DDL=5+5-2 T théorique = 2,30 • La différence n’est pas significative
Égalité des variances • Une des conditions pour utiliser T est l’égalité des variances sAPAsMS • On va chercher à savoir si les variances sont significativement différente ou non. • Comment le détermine-t-on ? Grace au F de Fisher.
F de Fisher : comme d’hab • H0 : les variances sont égales • On calcule le F observé • On calcule le F théorique (lecture sur une table) • Si FObs > FTh, la différence est significative, on rejette H0 • Si FObs < FTh, la différence n’est pas significative, on ne rejette pas H0
F observé • On divise la plus grande variance par la plus petite ou
F théorique • On lit F sur une table. La table est fonction des DDL des deux variances. • Le DDL d’une variance est le nombre de personne du groupe moins 1
F théorique • On lit F sur une table. La table est fonction du DDL de sAPA et du DDL de sMS • Le DDL de sAPA est le nombre de personne du groupe moins 1 • Le DDL de sMS est le nombre de personne du groupe moins 1
Exemple • Groupe B : • 8, 10, 14, 9, 10 • Moyenne : 10,2 • Variance : 4,16 • DDL=4 • Groupe A : • 10, 12, 13, 9 • Moyenne : 11 • Variance : 2,5 • DDL=3
Pourquoi lit-on sur la table 2,5% ? • Formellement, si on teste l’égalité des variances s1 et s2 au risque 5%, on doit : • vérifier que s1/s2 n’est pas trop grand (pas dans le top 2,5%) • vérifier que s1/s2 n’est pas trop petit (pas dans le down 2,5%) • Or, on triche : au lieu de tester s1/s2, • on teste s1/s2 si s1 est plus grand que s2 • on teste s2/s1 si s2 est plus grand que s1 • Donc, on économise le test avec les 2,5% les plus bas. • Il faut simplement faire le test avec le top 2,5% pour être sur que les variances ne sont pas différentes au risque 5%