Analyse de la variance : ANOVA à un facteur

Analyse de la variance : ANOVA à un facteur Sir Ronald Fischer 1890-1962

Thèmes • Le modèle linéaire général • Les postulats de base • La logique de l’analyse de la variance • Exemples • Les tests post-hocs • La taille d’effet

Xij = µ + j + eij Xij - la valeur observée pour le sujet i du groupe j µ - la grande moyenne j - l’influence du traitement sur le groupe j (j = µj - µ) eij- l’erreur ou les résidus - selon les postulats - sont distribués de manière normale avec une moyenne de µ = 0 et un écart-type de . Le modèle général linéaire Exemple: la taille moyenne des hommes est 68” et la taille moyenne des femmes est 65” La taille d’un homme sera donc: 66.5 + 1.5 + e et la taille d’une femme: 66.5 - 1.5 + e

Répartition des variances xij = µ + j + eij avec µ : j : eij : Donc:

Les sommes des carrés

Les postulats de base 1. Le modèle général s’applique aux données 2. Les valeurs sont distribuées normalement dans la population 3. Les échantillons ont des variances homogènes 4. Les échantillons sont indépendants

La logique de l’ANOVA

La logique de l’ANOVA (suite) • Les variances des différents échantillons sont donc égales et elles sont égales à la variance de la population p. • 1 = 2 = ... = ij = p avec • 1 = s1 = • Nous pouvons donc estimer la variance de la population à partir de la moyenne des variances des échantillons ou bien:

Selon le théorème des limites centrales: la distribution d’échantillonnage a une moyenne de µ et une variance de 2 /n si l’hypothèse nulle est vraie il suit donc que: pour l’estimé de p2 il faut multiplier par n

Exemple Afin de tester l’hypothèse que la consommation de caféine facilite l’apprentissage trois groupes d’étudiants se préparent à un examen: le groupe 1 boit une tasse, le groupe 2 boit 2 tasses et le groupe 3 boit 3 tasses de café. Voici leurs scores à l’examen:

Exemple suite

Sommes des carrés moyens Intra-groupe: Inter-groupe:

Calcul de F Valeur critique pour 2,12 df et a = .05 -> 3.89

Exemple 2

Suite

Sommes des carrés moyens Intra-groupe: Inter-groupe:

Calcul de F Valeur critique pour 2,12 df et a = .05 -> 3.89

Tableau ANOVA

Résumé • La variance intra-groupe (la somme moyenne des écarts carrés entre chaque observation et la moyenne du groupe) est un estimé de la variance de la population. • Quand l’hypothèse nulle est vraie - et seulement dans ce cas - la variance inter-groupe (la somme moyenne des écarts carrés entre chaque moyenne de groupe et la grande moyenne) est, selon le théorème des limites centrales, aussi un estimé de la variance de la population • Quand il y a un effet de traitement, donc quand l’hypothèse nulle est fausse, la variance inter-groupe est plus large que la variance intra-groupe • L’analyse de la variance consiste à calculer le rapport entre la variance inter-groupe et la variance intra-groupe et de comparer le résultat avec une distribution d’échantillonnage connue: la distribution F.

Les tests post-hocs

Erreurs • Erreur (ou ) par comparaison - le niveau  choisi pour une seule comparaison de moyennes • Erreur par famille - le nombre moyen des erreurs faites par famille de comparaisons • ’  1- (1-)c C’ Exemple: ’ = .01 et C = 5  = .049 ou approx. .05

Contraste • Définition: Une comparaison de J moyennes telle que la différence entre deux des J moyennes ou la différence entre une moyenne et la moyenne de deux autres moyennes • c11c22cjjcjj

Excursion - Orthogonalité • Une comparaison est orthogonale si:  (c1jc2j)/nj= 0 • Exemple: jth moyenne 1 2 3 4 • C 1: 1 -1 0 0 • C2: 1 0 -1 0 • C3: 0 0 1 -1 • 1 vs 2:  c1jc2j =(1)(1) + (-1)(0) + (0)(-1) + (0)(0) = 1 • 1 vs 3:  c1jc2j =(1)(0) + (-1)(0) + (0)(1) + (0)(-1) = 0

Tukey’s-HSD(John Tukey, 1915-2000)

La taille d’effet

Taille de l’effet • La corrélation entre la VI et la VD (r) • Le pourcentage de la variance de la VD expliqué par la VI (r2) • La différence entre deux moyennes en unités d’écart-type (d)

Taille d’effet: eta2 et omega2

Les tailles

Puissance • La probabilité de trouver un effet de taille x dans un échantillon de taille N en utilisant un test statistique avec un a donné. Fcrit = 2.58

Les erreurs

Taille d’effet et beta

Variance et beta

Calcul de puissance

http://members.aol.com/johnp71/javastat.html#Power

Analyse de la variance : ANOVA à un facteur