490 likes | 1.07k Views
ANALYSE DE VARIANCE. M2 Sciences des Procédés - Sciences des Aliments. ANALYSE DE VARIANCE. Exemple.
E N D
ANALYSE DE VARIANCE M2 Sciences des Procédés - Sciences des Aliments
ANALYSE DE VARIANCE Exemple Des forestiers ont réalisé des plantations d’arbres en 3 endroits. Plusieurs années plus tard ils souhaitent savoir si la hauteur des arbres est identique dans les trois forêts. Dans chaque forêt on tire un échantillon d’arbre et on mesure la hauteur de chaque arbre. L’analyse de variance(ANOVA) consiste à chercher si la variabilité des observations peut être en partie expliquée par les différences entre variantes d’un facteur (ici fôret)
OBJECTIF DE l’ANOVA Analyser des données qui dépendent de plusieurs types d’effets agissant simultanément, afin de quantifier ces effets = expliquer une variable quantitative par une ou des variables qualitatives (facteurs) En amont de l’ANOVA : plan expérimental (nombre d’expériences pour chaque niveau ou modalité, facteurs)
notes pour le caractère fibreux viande A B C 3 5 6 3 3 10 8 5 7 5 13 11 7 11 8 Exemple Etude sur l’appréciation sensorielle de la texture de 3 viandes. Seul le caractère fibreux est considéré, noté sur une échelle de 15 points. 15 dégustateurs différents ont noté chacun une viande
Hypothèses : • les sont indépendants • suit une loi Modèle de l’analyse de la variance à 1 facteur : Exemple de la viande : texture fibreuse d’une viande caractère fibreux de la viande i caractère fibreux potentiel due à l’ensemble des autres causes qui déterminent la note fibreuse où est la variable à expliquer ……………… est l’effet du ième niveau du facteur …..... est l’effet moyen général ………………. est la variable aléatoire résiduelle ………
Exemple de la viande : • -3 0 3 • -3 0 3 • -3 0 3 • -3 0 3 • -3 0 3 • 3 10 13 • 5 8 11 • 6 5 7 • 3 7 11 • 3 5 8 • 7 7 7 • 7 7 7 • 7 7 7 • 7 7 7 • 7 7 7 • -1 3 3 • 1 1 1 • 2 -2 -3 • -1 0 1 • -1 -2 -2 + = + B Y M W écarts inter-colonnes écarts intra-colonnes données globales moyenne générale + + = Décomposition de l’élément :
En élevant au carré et en sommant, pour toutes les observations : Somme des carrés des écarts totaux Somme des carrés des écarts inter-niveaux Somme des carrés des écarts intra-niveaux = + SCETotale = SCEInter + SCEIntra Exemple de la viande : SCETotale = 140 SCEInter = 90 SCEIntra = 50 Décomposition de la variabilité
On souhaite tester les hypothèses : H0 : "Il n’y a pas d’effet produit " càd les moyennes pour les différents produits (niveaux du facteur) sont égales contre H1 : "Il y a un effet produit" càd deux moyennes au moins sont différentes Il s’agit donc de comparer la variabilité inter-niveaux à la variabilité intra-niveaux du facteur
On définit le carré moyen inter-groupes : et le carré moyen intra-groupes : I nombre de niveaux
Pour tester H0 contre H1, on évalue la quantité : Si l’hypothèse H0 est vraie, la valeur F est faible, sinon, en s’éloignant de cette hypothèse, le rapport F augmente à partir de quelle valeur observée de F rejette-t-on H0? Si les résidus du modèle de l’analyse de la variance suivent une loi normale, et si H0 est vraie, on sait que F est l’observation d’une variable qui suit la loi de Fisher ayant (I-1) ddl au numérateur et (n-I) ddl au dénominateur : notée F(I-1, n-I) H0 est rejetée si Fobs > F (I-1, n-I)pour un niveau de significativité donné α, c’est-à-dire si p-value < α (cf. table de Fisher)
Tables de la loi de Fisher : pour α = 5 %, Fα,2,12= 3,88 pour α = 1 %, Fα,2,12= 6,93 p-value = p(Fα,1, 2 > Fobs) Exemple de la viande : Tableau d’analyse de la variance H0 rejetée = il existe un effet type de viande significatif concernant le caractère fibreux
Dispositif complet sans répétition Supposons maintenant que 5 juges aient évalué une série de 3 échantillons : notes pour le caractère fibreux
III.2 – Dispositif complet sans répétition Hypothèses : • les sont indépendants • suit une loi Modèle de l’analyse de la variance à 2 facteurs sans interaction : Exemple de la viande : texture fibreuse d’une viande caractère fibreux de la viande i effet lié au juge j caractère fibreux potentiel due à l’ensemble des autres causes qui déterminent la note fibreuse où est la variable à expliquer ……………… est l’effet du ième niveau du facteur A ..... est l’effet du jème niveau du facteur B .... est l’effet moyen général ………………. est la variable aléatoire résiduelle ………
III.2 – Dispositif complet sans répétition Equation de la décomposition de la variance : SCET = SCEA + SCEB + SCER soit :
On teste chaque facteur Tableau d’analyse de la variance 1er test : Fobs = 13,2 >> Fα,2,8 = 4,5 avec α = 5 % H0 rejetée avec un risque de 5 % = il existe un effet produit significatif concernant le caractère fibreux 2ème test : Fobs = 1,7 < Fα,4,8 = 3,8 avec α = 5 % H0 non rejetée = il n’existe pas d’effet juge significatif
Dispositif complet avec répétitions Comparaison de 3 types de sondes pédologiques pour 2 natures de sol
III.3 – Dispositif complet avec répétitions Hypothèses : • les sont indépendants • suit une loi Modèle de l’analyse de la variance à 2 facteurs avec interaction : où est la variable à expliquer est l’effet du ième niveau du facteur A est l’effet du jème niveau du facteur B est l’interaction des niveaux i et j des 2 facteurs est l’effet moyen général est la variable aléatoire résiduelle
Avec répétition Effet moyen PAS D’INTERACTION A2 A1 B3 B1 B2 D’INTERACTION Effet moyen A2 A1 B3 B1 B2
Source de variation SCE ddl Effet principal de A SCEA I-1 Effet principal de B SCEB J-1 Interaction A x B SCEAB (I-1)(J-1) Résiduelle SCER IJK-IJ Totale SCET n-1 Equation de la décomposition de la variance : SCET = SCEA + SCEB + SCEAB +SCER soit : 3 tests d’hypothèse
Tableau d’analyse de la variance Source de variation SCE ddl CM F p-value Type de sol 181,5 1 181,5 29,04 < 0,01 Type de sonde 49,0 2 24,5 3,92 0,039 Sol x sonde 3,0 2 1,5 0,24 0,789 Résiduelle 112,5 18 6,2 Totale 346,0 23
Pas d’effet d’interaction Réponse Sol 1 Sol 2 Sonde 2 3 1 Effet sol >> effet sonde Effets sol et sonde significatifs pour α = 5 %
Tests de comparaisons multiples Si rejet de l’hypothèse testée : effet du facteur Le rejet signifie: il existe au moins 1 niveau différent des autres Le ou lesquels? Il existe des méthodes complémentaires : - test LSD (Least Significance Difference) de Fischer (ppds) • test de Scheffe • test de Dunnett • test de Duncan • …
Exemple : test LSD Tests de comparaisons multiples Pour chaque comparaison de 2 moyennes, on calcule une valeur seuil r (range), fonction du carré moyen résiduel de l’ANOVA Si , alors la différence est déclarée significative, au niveau de signification α ddl de la source de variation résiduelle