1 / 15

Comparaison de plusieurs moyennes Analyse de variance

Comparaison de plusieurs moyennes Analyse de variance. FRT C5. Question posée. Etude de la relation entre Une variable qualitative à plus de 2 classes Une variable quantitative X résumée par sa moyenne et sa variance. Question posée. Etude de la relation entre

brygid
Download Presentation

Comparaison de plusieurs moyennes Analyse de variance

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Comparaison de plusieurs moyennesAnalyse de variance FRT C5

  2. Question posée • Etude de la relation entre • Une variable qualitative à plus de 2 classes • Une variable quantitative X résumée par sa moyenne et sa variance

  3. Question posée • Etude de la relation entre • Une variable qualitative à plus de 2 classes • Une variable quantitative X résumée par sa moyenne et sa variance • La variable qualitative qui distingue les populations est le facteur étudié; il peut être aléatoire ou fixe • Comparaison du poids moyen de plusieurs portées de souris : facteur « portée » est aléatoire • Comparaison d’un dosage biologique chez 3 groupes de malades traités par 3 traitements différents : facteur traitement est fixe • Même problème mais 1 groupe recevant un placebo

  4. Hypothèses • H0 : 1 = 2 = ……. = k • H1 : il existe au moins une différence entre les k moyennes (2 moyennes parmi k sont ≠) • On fera l’hypothèse que la variance est la même ² dans les k populations • Exemple : k=3, même variance ² • Sous H1, 1,2,3 sont différentes • en regroupant, la moyenne générale est et la variance totale T²

  5. Représentation graphique ² T² X 2 ● 1 ●  ● 3● H1 : les moyennes sont différentes La variance totale T²estplus grande que la variance ² de chaque population et d’autant plus grande que les moyennes sont + dispersées

  6. Hypothèses • H0 : 1 = 2 = ……. = k • H1 : il existe au moins une différence entre les k moyennes • On fera l’hypothèse que la variance est la même ² dans les k populations • Exemple : k=3, même variance ² • Sous H1, 1,2,3 sont différentes • en regroupant la moyenne générale est et la variance totale T² • Si H0 est vraie, T² = ²

  7. Représentation graphique ² T² T² ² 2 ● 1 ●  ● 1● 2 ● 3●  ● 3● H0 : moyennes et variances étant égales dans les 3 populations, T² = ² H1 : les moyennes sont différentes La variance totale T²estplus grande que la variance ² de chaque population et d’autant plus grande que les moyennes sont + dispersées

  8. Principe • On peut comparer les moyennes de X dans les différentes populations en comparant la var ² de X à « l’intérieur » de chacune des populations à la var T² • On transforme le problème initial en une comparaison de variance = analyse de variance

  9. Principe • On peut comparer les moyennes de X dans les différentes populations en comparant la var ² de X à « l’intérieur » de chacune des populations à la var T² • On transforme le problème initial en une comparaison de variance = analyse de variance • L’ampleur de la dispersion totale de T² dépend : • De la dispersion au sein de chacune des k populations comparées, mesurée par ² • De la dispersion entre ces populations

  10. Principe de l’ANOVA • Décomposer la dispersion (=variabilité) totale en 2 parties permettant de distinguer : • variabilité intra population et • variabilité inter population • Puis comparer ces 2 parties

  11. Principe de l’ANOVA • Décomposer la dispersion (=variabilité) totale en 2 parties permettant de distinguer : • On s’intéresse à la somme des carrés des écarts qui est le numérateur de la variance • Une réécriture de la SCET permet de faire apparaître • SCET =  (xij – mj)² +  nj(mj – m)² = SCER + SCEA ij ij intra groupe inter groupes *résiduelle : ce qui reste une fois le facteur d’intérêt pris en compte résiduelle* ou intraclasses à (n-k) ddl due au facteur A ou interclasses à (k-1) ddl

  12. Principe de l’ANOVA • Les variances sont donc : • SCER et SCEA et sR²est une n – k k – 1 estimation de ² • Hypothèses : • H0 : A² = R² = ² • H1 : A² > R² • Test : sA² SCEA/(k-1) suit une loi de Fisher sR² SCER/(n-k) à (k-1) et (n-k) ddl notée F = k-1 n-k

  13. Quand faire une ANOVA • Quand la question posée est celle d’une comparaison globale de plusieurs moyennes • 3 molécules anti-virales, mesure de la charge virale à S4 • Il n’y a pas d’a priori sur la supériorité de l’une ou les autres • Comparaison des 3 : • Non rejet d’H0 : on ne peut pas conclure à une différence • Si H0 est rejetée, il est légitime de rechercher où se situe la différence par comparaisons 2 à 2

  14. Erreurs à éviter X X =  m2 m1   1● 2 ● 3●  m3  Les fluctuations d’échantillonnage rendent compte d’une différence non significative entre les 3 moyennes Il ne serait pas correct de comparer d’emblée 2 à 2, et notamment m2 et m3 qui sont les plus éloignées de 

More Related