1 / 52

ANOVA : introduction

ANOVA : introduction. Définition. L’ ANOVA est l’analyse des variances. La comparaison des variances nous dira si les moyennes sont significativement différentes. Problème. On cherche a détecter d’un phénomène particulier : Flûtiste exceptionnelle ou moyenne Groupe de TD super bon

onella
Download Presentation

ANOVA : introduction

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. ANOVA : introduction

  2. Définition • L’ ANOVA est l’analyse des variances. La comparaison des variances nous dira si les moyennes sont significativement différentes

  3. Problème • On cherche a détecter d’un phénomène particulier : • Flûtiste exceptionnelle ou moyenne • Groupe de TD super bon • Caillou dans la mer

  4. Flûtiste Cécile seule Silence Les autres sans Cécile Cécile avec les autres

  5. Quiz : je mélange…

  6. Quiz : je mélange… Ultra facile : Silence Trop facile : Cécile seule Ben… Heu…

  7. Pourquoi ? Ici, la variance est de 0,5 La variance ici est nulle C’est une grosse différence. Elle EST significative Ici, la variance ici est 17,43 Ici, la variance est de 17,93 Entre 17,43 et 17,93 la différence N’EST PAS significative

  8. Intuitivement • Vinter (Variance Inter) est la variance que l’on cherche à détecter. • Vintra (Variance Intra) est le « bruit », la variabilité du au hasard (variabilité biologique)

  9. Intuitivement On détecte la flûte ou son absence Vintra = 0 Vinter = 0,5 On détecte l’orchestre mais la flûte seule est impossible à entendre Vintra = 17,43 Vinter = 0,5

  10. Formulation du problème • On dispose de plusieurs groupes de donnée (ici, des bandes sonores). On cherche à détecter quelque chose (ici, la flûte) • Pour le savoir, on calcule Vintra et Vinter • Vintra mesure la variabilité biologique (ici, le bruit) • Vinter mesure ce que l’on cherche vraiment (ici, la flûte) • Si Vinter est grand devant Vintra, on a détecté quelque chose. • Si Vinter est petit devant Vintra, la variabilité biologique est trop forte, elle empêche toute détection.

  11. La flûte Vintra = 0 Vinter = 0,5 On détecte la présence d’une flûte dans le groupe 2 Vintra = 17,43 Vinter = 0,5 On ne détecte pas la présence de la flûte dans le groupe 2

  12. Décomposition en facteurs

  13. Autre approche : Mini QCM La note de l’élève 2 groupe 1 (Yvon) est 19. Pourquoi ?

  14. Étude de la note d’Yvon • La moyenne générale est de 12. • Yvon a +7 par rapport à la moyenne générale • La moyenne de groupe 1 est de 15 • Yvon a +4 par rapport à la moyenne du groupe 1 • Le groupe 1 a +3 par rapport à la moyenne générale

  15. Étude de la note d’Yvon • On peut donc « expliquer » la note d’Yvon comme 19 = 12 + 3 + 4 Particularité d’Yvon (sa variabilité biologique : Yvon est plutôt bon) Note d’Yvon Moyenne générale (contrôle facile) Effet du groupe 1 (super prof)

  16. Étude de la note de Justin • Justin, élève 4 groupe 1 à 14 • On peut donc « expliquer » la note de Justin : 14 = 12 + 3 - 1 Note de Justin Particularité de Justin Moyenne générale (contrôle facile) Effet du groupe 1 (super prof)

  17. Étude de la note de Gaston • Gaston, élève 7 groupe 3 à 13 • On peut donc « expliquer » la note de Gaston : 13 = 12 - 3 + 4 Note de Gaston Particularité de Gaston Moyenne générale (contrôle facile) Effet du groupe 3 (prof pas terrible)

  18. Formalisation • On peut donc « expliquer » la note d’Yvon comme 19 = 12 + 3 + 4 Variabilité personnelle, à l’intérieur du groupe Note Moyenne générale Variabilité entre les groupes

  19. Que cherche-t-on ? • La variabilité personnelle dépend de nombreux facteurs • On ne peut pas l’expliquer. • C’est la variabilité entre groupes qui nous intéresse ici • Si les groupes ont des moyennes significativement différentes, on pourra ensuite examiner des causes éventuelles : différences entre les profs, meilleur matériel, meilleur emploi du temps…

  20. Formellement

  21. H0 • Hypothèse H0 : il n’y a pas de différence entre les groupes. Ils ont même moyenne et même variance • On ne s’intéresse pas au groupe mais aux populations qu’ils représentent : on travaille avec 

  22. Calcul de Vintra • Notations • k est le nombre de groupe (ici, k=3) • n est le nombre d’élève dans chaque groupe (n=9) • N est le nombre total d’élève (N=27) • i2 est la variance du groupe i (12=1,5) • Xi est la moyenne du groupe i (X1=15) • X est la moyenne générale (X=12)

  23. Calcul de Vintra • La variance d’un groupe représente son hétérogénéité ou sa variabilité biologique interne. • Vintra est la variabilité biologique interne de tous les groupe (le « bruit » global). Pour l’évaluer, on prend simplement la moyenne des variances des groupes :

  24. Les clones sont parmi nous… • Si on travaillait sur des « clones » (aucune différence entre les individus d’un groupe), il n’y aurait aucune variance à l’intérieur des groupes :

  25. Calcul de Vinter • La moyenne d’un groupe est une mesure du niveau moyen du groupe. • Vinter est la variabilité entre les groupes. Pour l’évaluer, on prend simplement la variance des moyennes multipliés par l’effectif :

  26. Calcul pratique (réveil !!!)

  27. Des clones partout Les profs et les élèves sont des clones : Pas de variabilité du tout Les profs sont des clones : Variabilité à l’intérieur des groupes, mais pas entre les groupes Les élèves sont des clones : Variabilité entre les groupes, mais pas à l’intérieur Situation réelle : Variabilité à l’intérieur des groupes et également entre les groupes

  28. Retour au problème • Y a-t-il des différences entre les groupes ?

  29. Retour au problème • Y a-t-il des différences entre les groupes ? Vinter = 0 La réponse est trivialement non !

  30. Retour au problème • Y a-t-il des différences entre les groupes ? Vinter = 0 La réponse est trivialement non car Vinter=0 indique l’égalité entre les moyennes des groupes Les profs et les élèves sont des clones : Pas de variabilité du tout Les profs sont des clones : Variabilité à l’intérieur des groupes, mais pas entre les groupes

  31. Retour au problème • Y a-t-il des différences entre les groupes ?

  32. Retour au problème • Y a-t-il des différences entre les groupes ? Vinter = 16 Vintra = 0 La réponse est oui car on détecte une différence entre les moyennes sans que des variations internes (bruit) gênent cette détection…

  33. Retour au problème • Y a-t-il des différences entre les groupes ? Vinter = 16 Vintra = 0 La réponse est oui car on détecte une différence entre les moyennes sans que des variations internes (bruit) gênent cette détection… Les élèves sont des clones : Variabilité entre les groupes, mais pas à l’intérieur Pas de bruit Détection possible

  34. Retour au problème • Y a-t-il des différences entre les groupes ?

  35. Retour au problème • Y a-t-il des différences entre les groupes ? Vinter = 16 Vintra = 22,4 La réponse est moins nette. Peut-être qu’une différence existe mais le bruit nous empêche de la détecter. On ne rejette pas H0

  36. Retour au problème • Y a-t-il des différences entre les groupes ? Vinter = 16 Vintra = 22,4 La réponse est moins nette. Peut-être qu’une différence existe mais le bruit nous empêche de la détecter. On ne rejette pas H0 Situation réelle : Variabilité à l’intérieur des groupes et également entre les groupes Trop de bruit Détection impossible

  37. Comment conclure ? • Si Vinter=16 et Vintra=0 : on rejette H0 • Si Vinter=0 et Vintra=22,4 : on rejette H0 • Entre les deux, si Vinter=18 et Vintra=7 ? On utilise le test pour comparer les variances : le F de Fisher

  38. F de Fisher

  39. F de Fisher : comme d’hab • On calcule le F observé • On calcule la probabilité de F • Autre méthode : lecture du F théorique sur une table • Si FObs > FTh, la différence est significative, on rejette H0 • Si FObs < FTh, la différence n’est pas significative, on ne rejette pas H0

  40. Calcul du F observé • Puis la probabilité d’obtenir un tel F si SEULEMENT la variabilité biologique est en jeu est : • Loi.F(Fobs,DDL dessous,DDL dessus)

  41. V inter est une variance Son DDL est de le nombre de groupe moins 1 DDL inter=k-1 Vintra est la moyenne des variances Son DDL est la somme des DDL de chacun des groupes Chaque groupe a un DDL de n-1 DDL intra = n-1 + n-1 + … + n-1 = N-k Calcul des DDL

  42. Exemple • DDL inter = k-1 = 3-1 = 2 • DDL intra = N-k = 27 – 3 = 24

  43. Lecture du F théorique • Cette fois-ci, on lit le F sur la table 5% (parce ce que on doit tester Vinter/Vintra, mais pas Vintra/Vinter • FTh=3,40 FObs étant plus grand que FTh, on peut rejeter H0 : il existe une différence significative entre les moyennes

  44. Risque 5% • On veut savoir si Vinter/Vintra est grand • On teste donc au risque 5% • Pour la comparaison des variances, on voulait savoir si V1/V2 était grand OU si V2/V1 était grand. • On devait donc tester V1/V2 au risque 2,5% et V2/V1 au risque 2,5% • Grâce a une astuce, on avait qu’un seul des deux tests à faire, mais ca ne changeait rien au seuil

  45. Groupes de taille variable

  46. Vintra : Groupes de taille variable • Rappel : pour les groupes de même taille : • Vintra = moyenne des variances = • Pour des groupes de taille variable : • Vintra = moyenne des variances PONDEREE par les DDL : • Si les k groupes ont la même taille n, les formules coïncident

  47. Vinter : Groupes de taille variable • Rappel : pour les groupes de même taille : • Vinter = n x variances des moyennes = • Pour des groupes de taille variable : • Vinter = variances des moyennes PONDEREE par les tailles : • Si les groupes ont la même taille n, les formules coïncident

  48. Exemple : mini QCM

  49. Conclusion • L’hypothèse « toutes les moyennes sont les mêmes » est rejetée. • toutes les moyennes ne sont pas les mêmes • MAIS on ne sait pas ou sont les différences

  50. Conclusion • Les moyennes sont 10,2 ; 15,2 et 17,6 • On sait qu’il existe au moins une différence significative. • Entre 10,2 et 15,2 ? • Entre 10,6 et 17,6 ? • Entre 15,2 et 17,6 ?

More Related