530 likes | 778 Views
ANOVA : introduction. Définition. L’ ANOVA est l’analyse des variances. La comparaison des variances nous dira si les moyennes sont significativement différentes. Problème. On cherche a détecter d’un phénomène particulier : Flûtiste exceptionnelle ou moyenne Groupe de TD super bon
E N D
Définition • L’ ANOVA est l’analyse des variances. La comparaison des variances nous dira si les moyennes sont significativement différentes
Problème • On cherche a détecter d’un phénomène particulier : • Flûtiste exceptionnelle ou moyenne • Groupe de TD super bon • Caillou dans la mer
Flûtiste Cécile seule Silence Les autres sans Cécile Cécile avec les autres
Quiz : je mélange… Ultra facile : Silence Trop facile : Cécile seule Ben… Heu…
Pourquoi ? Ici, la variance est de 0,5 La variance ici est nulle C’est une grosse différence. Elle EST significative Ici, la variance ici est 17,43 Ici, la variance est de 17,93 Entre 17,43 et 17,93 la différence N’EST PAS significative
Intuitivement • Vinter (Variance Inter) est la variance que l’on cherche à détecter. • Vintra (Variance Intra) est le « bruit », la variabilité du au hasard (variabilité biologique)
Intuitivement On détecte la flûte ou son absence Vintra = 0 Vinter = 0,5 On détecte l’orchestre mais la flûte seule est impossible à entendre Vintra = 17,43 Vinter = 0,5
Formulation du problème • On dispose de plusieurs groupes de donnée (ici, des bandes sonores). On cherche à détecter quelque chose (ici, la flûte) • Pour le savoir, on calcule Vintra et Vinter • Vintra mesure la variabilité biologique (ici, le bruit) • Vinter mesure ce que l’on cherche vraiment (ici, la flûte) • Si Vinter est grand devant Vintra, on a détecté quelque chose. • Si Vinter est petit devant Vintra, la variabilité biologique est trop forte, elle empêche toute détection.
La flûte Vintra = 0 Vinter = 0,5 On détecte la présence d’une flûte dans le groupe 2 Vintra = 17,43 Vinter = 0,5 On ne détecte pas la présence de la flûte dans le groupe 2
Autre approche : Mini QCM La note de l’élève 2 groupe 1 (Yvon) est 19. Pourquoi ?
Étude de la note d’Yvon • La moyenne générale est de 12. • Yvon a +7 par rapport à la moyenne générale • La moyenne de groupe 1 est de 15 • Yvon a +4 par rapport à la moyenne du groupe 1 • Le groupe 1 a +3 par rapport à la moyenne générale
Étude de la note d’Yvon • On peut donc « expliquer » la note d’Yvon comme 19 = 12 + 3 + 4 Particularité d’Yvon (sa variabilité biologique : Yvon est plutôt bon) Note d’Yvon Moyenne générale (contrôle facile) Effet du groupe 1 (super prof)
Étude de la note de Justin • Justin, élève 4 groupe 1 à 14 • On peut donc « expliquer » la note de Justin : 14 = 12 + 3 - 1 Note de Justin Particularité de Justin Moyenne générale (contrôle facile) Effet du groupe 1 (super prof)
Étude de la note de Gaston • Gaston, élève 7 groupe 3 à 13 • On peut donc « expliquer » la note de Gaston : 13 = 12 - 3 + 4 Note de Gaston Particularité de Gaston Moyenne générale (contrôle facile) Effet du groupe 3 (prof pas terrible)
Formalisation • On peut donc « expliquer » la note d’Yvon comme 19 = 12 + 3 + 4 Variabilité personnelle, à l’intérieur du groupe Note Moyenne générale Variabilité entre les groupes
Que cherche-t-on ? • La variabilité personnelle dépend de nombreux facteurs • On ne peut pas l’expliquer. • C’est la variabilité entre groupes qui nous intéresse ici • Si les groupes ont des moyennes significativement différentes, on pourra ensuite examiner des causes éventuelles : différences entre les profs, meilleur matériel, meilleur emploi du temps…
H0 • Hypothèse H0 : il n’y a pas de différence entre les groupes. Ils ont même moyenne et même variance • On ne s’intéresse pas au groupe mais aux populations qu’ils représentent : on travaille avec
Calcul de Vintra • Notations • k est le nombre de groupe (ici, k=3) • n est le nombre d’élève dans chaque groupe (n=9) • N est le nombre total d’élève (N=27) • i2 est la variance du groupe i (12=1,5) • Xi est la moyenne du groupe i (X1=15) • X est la moyenne générale (X=12)
Calcul de Vintra • La variance d’un groupe représente son hétérogénéité ou sa variabilité biologique interne. • Vintra est la variabilité biologique interne de tous les groupe (le « bruit » global). Pour l’évaluer, on prend simplement la moyenne des variances des groupes :
Les clones sont parmi nous… • Si on travaillait sur des « clones » (aucune différence entre les individus d’un groupe), il n’y aurait aucune variance à l’intérieur des groupes :
Calcul de Vinter • La moyenne d’un groupe est une mesure du niveau moyen du groupe. • Vinter est la variabilité entre les groupes. Pour l’évaluer, on prend simplement la variance des moyennes multipliés par l’effectif :
Des clones partout Les profs et les élèves sont des clones : Pas de variabilité du tout Les profs sont des clones : Variabilité à l’intérieur des groupes, mais pas entre les groupes Les élèves sont des clones : Variabilité entre les groupes, mais pas à l’intérieur Situation réelle : Variabilité à l’intérieur des groupes et également entre les groupes
Retour au problème • Y a-t-il des différences entre les groupes ?
Retour au problème • Y a-t-il des différences entre les groupes ? Vinter = 0 La réponse est trivialement non !
Retour au problème • Y a-t-il des différences entre les groupes ? Vinter = 0 La réponse est trivialement non car Vinter=0 indique l’égalité entre les moyennes des groupes Les profs et les élèves sont des clones : Pas de variabilité du tout Les profs sont des clones : Variabilité à l’intérieur des groupes, mais pas entre les groupes
Retour au problème • Y a-t-il des différences entre les groupes ?
Retour au problème • Y a-t-il des différences entre les groupes ? Vinter = 16 Vintra = 0 La réponse est oui car on détecte une différence entre les moyennes sans que des variations internes (bruit) gênent cette détection…
Retour au problème • Y a-t-il des différences entre les groupes ? Vinter = 16 Vintra = 0 La réponse est oui car on détecte une différence entre les moyennes sans que des variations internes (bruit) gênent cette détection… Les élèves sont des clones : Variabilité entre les groupes, mais pas à l’intérieur Pas de bruit Détection possible
Retour au problème • Y a-t-il des différences entre les groupes ?
Retour au problème • Y a-t-il des différences entre les groupes ? Vinter = 16 Vintra = 22,4 La réponse est moins nette. Peut-être qu’une différence existe mais le bruit nous empêche de la détecter. On ne rejette pas H0
Retour au problème • Y a-t-il des différences entre les groupes ? Vinter = 16 Vintra = 22,4 La réponse est moins nette. Peut-être qu’une différence existe mais le bruit nous empêche de la détecter. On ne rejette pas H0 Situation réelle : Variabilité à l’intérieur des groupes et également entre les groupes Trop de bruit Détection impossible
Comment conclure ? • Si Vinter=16 et Vintra=0 : on rejette H0 • Si Vinter=0 et Vintra=22,4 : on rejette H0 • Entre les deux, si Vinter=18 et Vintra=7 ? On utilise le test pour comparer les variances : le F de Fisher
F de Fisher : comme d’hab • On calcule le F observé • On calcule la probabilité de F • Autre méthode : lecture du F théorique sur une table • Si FObs > FTh, la différence est significative, on rejette H0 • Si FObs < FTh, la différence n’est pas significative, on ne rejette pas H0
Calcul du F observé • Puis la probabilité d’obtenir un tel F si SEULEMENT la variabilité biologique est en jeu est : • Loi.F(Fobs,DDL dessous,DDL dessus)
V inter est une variance Son DDL est de le nombre de groupe moins 1 DDL inter=k-1 Vintra est la moyenne des variances Son DDL est la somme des DDL de chacun des groupes Chaque groupe a un DDL de n-1 DDL intra = n-1 + n-1 + … + n-1 = N-k Calcul des DDL
Exemple • DDL inter = k-1 = 3-1 = 2 • DDL intra = N-k = 27 – 3 = 24
Lecture du F théorique • Cette fois-ci, on lit le F sur la table 5% (parce ce que on doit tester Vinter/Vintra, mais pas Vintra/Vinter • FTh=3,40 FObs étant plus grand que FTh, on peut rejeter H0 : il existe une différence significative entre les moyennes
Risque 5% • On veut savoir si Vinter/Vintra est grand • On teste donc au risque 5% • Pour la comparaison des variances, on voulait savoir si V1/V2 était grand OU si V2/V1 était grand. • On devait donc tester V1/V2 au risque 2,5% et V2/V1 au risque 2,5% • Grâce a une astuce, on avait qu’un seul des deux tests à faire, mais ca ne changeait rien au seuil
Vintra : Groupes de taille variable • Rappel : pour les groupes de même taille : • Vintra = moyenne des variances = • Pour des groupes de taille variable : • Vintra = moyenne des variances PONDEREE par les DDL : • Si les k groupes ont la même taille n, les formules coïncident
Vinter : Groupes de taille variable • Rappel : pour les groupes de même taille : • Vinter = n x variances des moyennes = • Pour des groupes de taille variable : • Vinter = variances des moyennes PONDEREE par les tailles : • Si les groupes ont la même taille n, les formules coïncident
Conclusion • L’hypothèse « toutes les moyennes sont les mêmes » est rejetée. • toutes les moyennes ne sont pas les mêmes • MAIS on ne sait pas ou sont les différences
Conclusion • Les moyennes sont 10,2 ; 15,2 et 17,6 • On sait qu’il existe au moins une différence significative. • Entre 10,2 et 15,2 ? • Entre 10,6 et 17,6 ? • Entre 15,2 et 17,6 ?