1 / 25

ANALYSE DE VARIANCE

ANALYSE DE VARIANCE. M2 Sciences des Procédés - Sciences des Aliments. ANALYSE DE VARIANCE. Exemple.

kris
Download Presentation

ANALYSE DE VARIANCE

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. ANALYSE DE VARIANCE M2 Sciences des Procédés - Sciences des Aliments

  2. ANALYSE DE VARIANCE Exemple Des forestiers ont réalisé des plantations d’arbres en 3 endroits. Plusieurs années plus tard ils souhaitent savoir si la hauteur des arbres est identique dans les trois forêts. Dans chaque forêt on tire un échantillon d’arbre et on mesure la hauteur de chaque arbre. L’analyse de variance(ANOVA) consiste à chercher si la variabilité des observations peut être en partie expliquée par les différences entre variantes d’un facteur (ici fôret)

  3. OBJECTIF DE l’ANOVA Analyser des données qui dépendent de plusieurs types d’effets agissant simultanément, afin de quantifier ces effets = expliquer une variable quantitative par une ou des variables qualitatives (facteurs)  En amont de l’ANOVA : plan expérimental (nombre d’expériences pour chaque niveau ou modalité, facteurs)

  4. Analyse de la variance à 1 facteur

  5. notes pour le caractère fibreux viande A B C 3 5 6 3 3 10 8 5 7 5 13 11 7 11 8 Exemple Etude sur l’appréciation sensorielle de la texture de 3 viandes. Seul le caractère fibreux est considéré, noté sur une échelle de 15 points. 15 dégustateurs différents ont noté chacun une viande

  6. Hypothèses : • les sont indépendants • suit une loi Modèle de l’analyse de la variance à 1 facteur : Exemple de la viande : texture fibreuse d’une viande caractère fibreux de la viande i caractère fibreux potentiel due à l’ensemble des autres causes qui déterminent la note fibreuse où est la variable à expliquer ……………… est l’effet du ième niveau du facteur …..... est l’effet moyen général ………………. est la variable aléatoire résiduelle ………

  7. Exemple de la viande : • -3 0 3 • -3 0 3 • -3 0 3 • -3 0 3 • -3 0 3 • 3 10 13 • 5 8 11 • 6 5 7 • 3 7 11 • 3 5 8 • 7 7 7 • 7 7 7 • 7 7 7 • 7 7 7 • 7 7 7 • -1 3 3 • 1 1 1 • 2 -2 -3 • -1 0 1 • -1 -2 -2 + = + B Y M W écarts inter-colonnes écarts intra-colonnes données globales moyenne générale + + = Décomposition de l’élément :

  8. En élevant au carré et en sommant, pour toutes les observations : Somme des carrés des écarts totaux Somme des carrés des écarts inter-niveaux Somme des carrés des écarts intra-niveaux = + SCETotale = SCEInter + SCEIntra Exemple de la viande : SCETotale = 140 SCEInter = 90 SCEIntra = 50 Décomposition de la variabilité

  9. On souhaite tester les hypothèses : H0 : "Il n’y a pas d’effet produit " càd les moyennes pour les différents produits (niveaux du facteur) sont égales contre H1 : "Il y a un effet produit" càd deux moyennes au moins sont différentes  Il s’agit donc de comparer la variabilité inter-niveaux à la variabilité intra-niveaux du facteur

  10. On définit le carré moyen inter-groupes : et le carré moyen intra-groupes : I nombre de niveaux

  11. Pour tester H0 contre H1, on évalue la quantité : Si l’hypothèse H0 est vraie, la valeur F est faible, sinon, en s’éloignant de cette hypothèse, le rapport F augmente  à partir de quelle valeur observée de F rejette-t-on H0?  Si les résidus du modèle de l’analyse de la variance suivent une loi normale, et si H0 est vraie, on sait que F est l’observation d’une variable qui suit la loi de Fisher ayant (I-1) ddl au numérateur et (n-I) ddl au dénominateur : notée F(I-1, n-I) H0 est rejetée si Fobs > F (I-1, n-I)pour un niveau de significativité donné α, c’est-à-dire si p-value < α (cf. table de Fisher)

  12.  Tables de la loi de Fisher : pour α = 5 %, Fα,2,12= 3,88 pour α = 1 %, Fα,2,12= 6,93 p-value = p(Fα,1, 2 > Fobs) Exemple de la viande : Tableau d’analyse de la variance  H0 rejetée = il existe un effet type de viande significatif concernant le caractère fibreux

  13. Analyse de la variance à 2 facteurs

  14. Dispositif complet sans répétition Supposons maintenant que 5 juges aient évalué une série de 3 échantillons : notes pour le caractère fibreux

  15. III.2 – Dispositif complet sans répétition Hypothèses : • les sont indépendants • suit une loi Modèle de l’analyse de la variance à 2 facteurs sans interaction : Exemple de la viande : texture fibreuse d’une viande caractère fibreux de la viande i effet lié au juge j caractère fibreux potentiel due à l’ensemble des autres causes qui déterminent la note fibreuse où est la variable à expliquer ……………… est l’effet du ième niveau du facteur A ..... est l’effet du jème niveau du facteur B .... est l’effet moyen général ………………. est la variable aléatoire résiduelle ………

  16. III.2 – Dispositif complet sans répétition Equation de la décomposition de la variance : SCET = SCEA + SCEB + SCER soit :

  17. On teste chaque facteur Tableau d’analyse de la variance 1er test : Fobs = 13,2 >> Fα,2,8 = 4,5 avec α = 5 % H0 rejetée avec un risque de 5 % = il existe un effet produit significatif concernant le caractère fibreux 2ème test : Fobs = 1,7 < Fα,4,8 = 3,8 avec α = 5 %  H0 non rejetée = il n’existe pas d’effet juge significatif

  18. Dispositif complet avec répétitions Comparaison de 3 types de sondes pédologiques pour 2 natures de sol

  19. III.3 – Dispositif complet avec répétitions Hypothèses : • les sont indépendants • suit une loi Modèle de l’analyse de la variance à 2 facteurs avec interaction : où est la variable à expliquer est l’effet du ième niveau du facteur A est l’effet du jème niveau du facteur B est l’interaction des niveaux i et j des 2 facteurs est l’effet moyen général est la variable aléatoire résiduelle

  20. Avec répétition Effet moyen PAS D’INTERACTION A2 A1 B3 B1 B2 D’INTERACTION Effet moyen A2 A1 B3 B1 B2

  21. Source de variation SCE ddl Effet principal de A SCEA I-1 Effet principal de B SCEB J-1 Interaction A x B SCEAB (I-1)(J-1) Résiduelle SCER IJK-IJ Totale SCET n-1 Equation de la décomposition de la variance : SCET = SCEA + SCEB + SCEAB +SCER soit : 3 tests d’hypothèse

  22. Tableau d’analyse de la variance Source de variation SCE ddl CM F p-value Type de sol 181,5 1 181,5 29,04 < 0,01 Type de sonde 49,0 2 24,5 3,92 0,039 Sol x sonde 3,0 2 1,5 0,24 0,789 Résiduelle 112,5 18 6,2 Totale 346,0 23

  23.  Pas d’effet d’interaction Réponse Sol 1 Sol 2 Sonde 2 3 1  Effet sol >> effet sonde  Effets sol et sonde significatifs pour α = 5 %

  24. Tests de comparaisons multiples Si rejet de l’hypothèse testée : effet du facteur Le rejet signifie: il existe au moins 1 niveau différent des autres Le ou lesquels? Il existe des méthodes complémentaires : - test LSD (Least Significance Difference) de Fischer (ppds) • test de Scheffe • test de Dunnett • test de Duncan • …

  25. Exemple : test LSD Tests de comparaisons multiples Pour chaque comparaison de 2 moyennes, on calcule une valeur seuil r (range), fonction du carré moyen résiduel de l’ANOVA Si , alors la différence est déclarée significative, au niveau de signification α ddl de la source de variation résiduelle

More Related