380 likes | 636 Views
L’Analyse de Covariance. Modèle complet Le modèle d’ANCOVA Le modèle de la régression commune. L’Analyse de Covariance. Modèles linéaires simples. Taille. Masse. Taille. L’Analyse de Covariance. Utilisation de l’ANCOVA.
E N D
L’Analyse de Covariance Modèle complet Le modèle d’ANCOVA Le modèle de la régression commune
L’Analyse de Covariance Modèles linéaires simples
Taille Masse Taille L’Analyse de Covariance Utilisation de l’ANCOVA • Afin de comparer une relation entre une variable dépendante (Y) et une variable indépendante (X1) pour différents niveaux d’une variable discrète (X2) • ex: la relation entre le poids (Y) et la taille (X1) pour différents groupes taxonomiques (oiseaux et mammifères, X2)
Y Modèles qualitativement similaires Y Modèles qualitativement différents X1 L’Analyse de Covariance Utilisation de l’ANCOVA • Lorsque l’on fait ces comparaisons, on suppose que les modèles sont qualitativement similaires pour tous les niveaux de la variable discrète... • …autrement ce serait comme comparer des pommes et des oranges!
Le modèle de la régression: toutes les régressions simples sont décrites par 2 paramètres: l’ordonnée à l’origine (a) et la pente (b) ei Yi DY a (ordonnée à l’origine) Xi Observées DX X Prédites b = DY/DX (pente) L’Analyse de Covariance Le modèle de la régression simple
L’Analyse de Covariance Y Y même a, différents b a & b diffèrent X1 X1 Y Y même a, mêmeb a diffèrent mêmeb X1 X1
Modèle d’ordre supérieur F Modèle réduit Terme inclus (p < .05) Terme exclus (p > .05) L’Analyse de Covariance Ajustement au modèle • Commencer par un modèle d’ordre supérieur en incluant le plus de termes possible. • Ajuster un modèle réduit • Tester la signification du terme exclus
m Niveau 1 de la variable X2 Niveau 2 de la variable X2 L’Analyse de Covariance Le modèle complet • Le modèle complet • bi est la pente de la régression de Y sur X1 estimée pour le niveau i de la variable discrète X2 • ai est la différence entre les moyennes de la variable discrète X2 pour chaque niveau i et la moyenne générale.
m Niveau 1 de la variable X2 Niveau 2 de la variable X2 L’Analyse de Covariance Le modèle complet • Pour le modèle complet contenant 2 variables indépendantes, on a 3 hypothèses nulles: hypothèses nulles
L’Analyse de Covariance Le modèle complet Y Y Y
Les résidus sont indépendants et distribués normalement La variance des résidus est égale pour toutes les valeurs de X et indépendantes des valeurs de la variable discontinue (homoscedasticité) pas d’erreur sur les variables indépendantes L’Analyse de Covariance Conditions d’application Le modèle complet
Y X1 H02 acceptée H02 rejetéee ANCOVA Régressions séparées Niveau 1 de la variable X2 Niveau 2 de la variable X2 L’Analyse de Covariance Le modèle complet • Ajuster le modèle complet, tester la différence entre les pentes • Si H02 est rejetée, faire des régressions séparées pour chaque niveau de la variable catégorique • Si H02 est acceptée, ajuster le modèle d’ ANCOVA.
L’Analyse de Covariance Exemple Le modèle complet Mâles • Q1: la pente de la régression de LFKL sur LAGE est la même pour les deux sexes? age, sexe et longueur de l’esturgeon Femelles
L’Analyse de Covariance Exemple Le modèle complet Dep Var: LFKL N: 92 Multiple R: 0.835 Squared multiple R: 0.697 Analysis of Variance Source Sum-of-Squares df Mean-Square F-ratio P LAGE 0.143 1 0.143 176.650 0.000 SEX$ 0.000 1 0.000 0.504 0.479 SEX$*LAGE 0.000 1 0.000 0.337 0.563 Error 0.071 88 0.001 Conclusion 1: la pente est la même pour les deux sexes (accepter H02 ) p(SEX$*LAGE) > 0.05 Q2: l’ordonnée à l’origine est-elle la même?
Sources de variation ddl SCE 1 Modèle linéaire simple (var continue A) (n-2) Hors régression (p-1) Effet facteur B/A (différence des ordonnées à l’origine) Interaction A et B (p-1) (non parallélisme des droites) Résidus autour des droites (n-2p) Totale (n-1) L’Analyse de Covariance Décomposition de la variation Le modèle complet
m L’Analyse de Covariance Le modèle additif • Le modèle: • b est la pente de la régression de Y sur X1regroupée pour tous les niveaux de la variable catégorique X2. • ai est la différence entre la moyenne pour chaque niveau i et la moyenne générale
Pour une ANCOVA avec 2 variables indépendantes, deux hypothèses nulles: m Niveau 1 de la variable X2 Niveau 2 de la variable X2 L’Analyse de Covariance Le modèle additif hypothèses nulles
L’Analyse de Covariance Le modèle additif Y Y Y
les résidus sont indépendants et distribués normalement la variance des résidus est égale pour toutes les valeurs de X et indépendantes des valeurs de la variable catégorique (homoscedasticité) les pentes des régressions de Y sur X sont les mêmes pour tous les niveaux de la variable catégorique (ce n’est pas une condition d’application du modèle complet!!) L’Analyse de Covariance Conditions d’application du modèle additif Le modèle additif
Y • Ajuster le modèle d’ANCOVA, tester: • Si H01 est rejetée, séparer les régressions pour chaque niveau de la variable discontinue • Si H01 est acceptée, ajuster une régression commune. X1 H01 acceptée H01 rejetée Régression commune Régressions séparées Niveau 1 de la variable X2 Niveau 2 de la variable X2 L’Analyse de Covariance Procédure Le modèle additif
Dep Var: LFKL N: 92 Multiple R: 0.834 Squared multiple R: 0.696 Analysis of Variance Source Sum-of-Squares df Mean-Square F-ratio P SEX$ 0.001 1 0.001 1.851 0.177 LAGE 0.143 1 0.143 178.163 0.000 Error 0.072 89 0.001 L’Analyse de Covariance Exemple Le modèle additif Conclusion 2: Ordonnée à l’origine est la même pour les deux sexes. H01 est acceptée. p(SEX$ > .05), le meilleur modèle est la régression commune. la réduction du R2 est négligeable (.697 to .696).
Le modèle: • b est la pente de la régression de Y sur X1 , regroupée pour tous les niveaux de la variable discrète X2. • est la moyenne groupée de X1. m a Niveau 1 de la variable X2 Niveau 2 de la variable X2 L’Analyse de Covariance Le modèle à droites confondues
On a deux hypothèses nulles pour la régression commune: m a Niveau 1 de la variable X2 Niveau 2 de la variable X2 L’Analyse de Covariance Le modèle à droites confondues hypothèses nulles
L’Analyse de Covariance Le modèle à droites confondues Exemple Dep Var: LFKL N: 92 Multiple R: 0.830 Squared multiple R: 0.690 Adjusted squared multiple R: 0.686 Standard error of estimate: 0.029 Effect Coefficient Std Error Std Coef Tolerance t P(2 Tail) CONSTANT 1.211 0.031 0.0 . 39.191 0.000 LAGE 0.336 0.024 0.830 1.000 14.144 0.000
Les résidus sont indépendants et distribués normalement la variance des résidus est égale pour toutes les valeurs de X et indépendantes des valeurs de la variable discrète (homoscédasticité) L’Analyse de Covariance Conditions d’application du modèle à droites confondues Le modèle à droites confondues
Aller du modèle complexe au modèle simple Donc choisir a priori les variables explicatives L’Analyse de Covariance Conclusion