660 likes | 849 Views
Analyse de la variance à effets mixtes. Michel Tenenhaus. Exemple 4 (Milliken & Johnson) Rythmes cardiaques. Rythme cardiaque pour trois groupes de traitements et quatre instants de mesure. - Facteurs fixes : Traitement, Temps - Facteur aléatoire : Sujet(Traitement). Extrait des données.
E N D
Analyse de la variance à effets mixtes Michel Tenenhaus
Exemple 4 (Milliken & Johnson)Rythmes cardiaques Rythme cardiaque pour trois groupes de traitements et quatre instants de mesure - Facteurs fixes : Traitement, Temps - Facteur aléatoire : Sujet(Traitement)
Extrait des données
Modèle 1 Yijk = + i + j + ij + sk(i) + ijk Produit Temps Sujet (Produit) Résidu Produit * Temps Effets fixes Effets aléatoires Les modèles avec : - sk(i) ~ N(0, s2) s2 = Variance inter-sujets - ijk ~ N(0, 2) 2 = Variance intra-sujets Les aléas sont indépendants. Les variances peuvent dépendre du traitement. La variance intra-sujets peut dépendre du traitement et du temps.
Yijk = + i + j + ij + ijk Produit Temps Résidu Produit * Temps Modèle 2 avec : - i.k = (i1k, i2k, i3k, i4k ) ~ N(0, ) - Les i.k sont indépendants entre eux. La matrice de covariance peut dépendre du traitement. L’utilisateur doit choisir le type de la matrice .
Modèle 3 Yijk = + i + j + ij + sk(i) + ijk Produit Temps Sujet (Produit) Résidu Produit * Temps avec : - sk(i) ~ N(0, s2) - ijk ~ AR(1) (*) (*) ijk = i(j-1)k+ aijk , où les aijk suivent une loi N(0, a2) et sont indépendants entre eux.
Yijk = + i + j + ij + sk(i) + ijk Produit Sujet (Produit) Résidu Temps Produit * Temps - sk(i) ~ N(0, s2) - ijk ~ N(0, 2) avec : + indépendance Étude du modèle 1 Dans le modèle 1, les corrélations entre les mesures sont positives.
Yijk = + i + j + ij + sk(i) + ijk Produit Sujet (Produit) Résidu Temps Produit * Temps Le modèle 1 est un modèle 2 avec de type « compound symmetry » et covariance positive est de type « Compound Symmetry » avec covariance positive.
Formulaire Modèle : y = X + Zu + avec : u ~ N(0, G), ~ N(0, R), et Cov(u, ) = 0 Il est préférable qu’un facteur aléatoire ait au moins 5 modalités. Sinon, passer en fixe. - Var(y) = V = ZGZ´ + R - y ~ N(X, V) Estimation : (Utiliser Method = REML) 1) Les matrices G et R sont estimées par maximum de vraisemblance restreint.
Formulaire (suite) Modèle : y = X + Zu + avec : u ~ N(0, G), ~ N(0, R), et Cov(u, ) Test : H0 : K + Mu = 0 (Inférerence : Large / étroite) Statistique utilisée :
Calcul de par la méthode de Satterthwaite (Méthode par défaut de SPSS) • - Permet de retrouver les résultats du GLM • pour le test d’un contraste. • Le ddl du dénominateur ne dépend pas du nom • de l’effet aléatoire. • - Permet de généraliser l’approche de Satterthwaite • aux modèles mixtes.
Yijk = + i + j + ij + sk(i) + ijk Produit Sujet (Produit) Résidu Temps Produit * Temps Etude du modèle 1 Utilisation de SPSS
Résultats Modèle 1 (Proc Mixed de SAS) Estimated V Matrix for sujet(produit) 1 1 Row Col1 Col2 Col3 Col4 1 33.0789 25.8016 25.8016 25.8016 2 25.8016 33.0789 25.8016 25.8016 3 25.8016 25.8016 33.0789 25.8016 4 25.8016 25.8016 25.8016 33.0789 Estimated V Correlation Matrix for sujet(produit) 1 1 Row Col1 Col2 Col3 Col4 1 1.0000 0.7800 0.7800 0.7800 2 0.7800 1.0000 0.7800 0.7800 3 0.7800 0.7800 1.0000 0.7800 4 0.7800 0.7800 0.7800 1.0000
Résultats Modèle 1 (SAS) Solution for Random Effects Std Err Effect sujet produit Estimate Pred DF t Value Pr > |t| sujet(produit) 1 1 2.5397 2.1708 63 1.17 0.2464 sujet(produit) 2 1 5.8091 2.1708 63 2.68 0.0095 sujet(produit) 3 1 0.9049 2.1708 63 0.42 0.6782 sujet(produit) 4 1 0.4379 2.1708 63 0.20 0.8408 sujet(produit) 5 1 -3.9993 2.1708 63 -1.84 0.0701 sujet(produit) 6 1 3.0067 2.1708 63 1.39 0.1709 sujet(produit) 7 1 -5.1669 2.1708 63 -2.38 0.0203 sujet(produit) 8 1 -3.5322 2.1708 63 -1.63 0.1087 sujet(produit) 1 2 2.3061 2.1708 63 1.06 0.2921 sujet(produit) 2 2 1.8391 2.1708 63 0.85 0.4001 sujet(produit) 3 2 -7.0352 2.1708 63 -3.24 0.0019 sujet(produit) 4 2 1.6055 2.1708 63 0.74 0.4623 sujet(produit) 5 2 -0.2627 2.1708 63 -0.12 0.9041 sujet(produit) 6 2 1.3720 2.1708 63 0.63 0.5296 sujet(produit) 7 2 -0.2627 2.1708 63 -0.12 0.9041 sujet(produit) 8 2 0.4379 2.1708 63 0.20 0.8408 sujet(produit) 1 3 0.0292 2.1708 63 0.01 0.9893 sujet(produit) 2 3 -4.6415 2.1708 63 -2.14 0.0364 sujet(produit) 3 3 14.2747 2.1708 63 6.58 <.0001 sujet(produit) 4 3 5.1669 2.1708 63 2.38 0.0203 sujet(produit) 5 3 -1.1385 2.1708 63 -0.52 0.6018 sujet(produit) 6 3 -8.1445 2.1708 63 -3.75 0.0004 sujet(produit) 7 3 -1.6055 2.1708 63 -0.74 0.4623 sujet(produit) 8 3 -3.9409 2.1708 63 -1.82 0.0742 = 0 = 0 = 0
T1 T2 T3 T4 Comparaison des moyennes Modèle : Estimation de11 - 31 : Test : H0 :
Comparaison entre AX23 et Contrôle en T1 Syntaxe SPSS MIXED rythme BY sujet_diff produit temps /CRITERIA = CIN(95) MXITER(100) MXSTEP(5) SCORING(1) SINGULAR(0.000000000001) HCONVERGE(0, ABSOLUTE) LCONVERGE(0, ABSOLUTE) PCONVERGE(0.000001, ABSOLUTE) /FIXED = produit temps produit*temps | SSTYPE(3) /METHOD = REML /TEST = 'mu11 vs mu31' produit 1 0 -1 produit*temps 1 0 0 0 0 0 0 0 -1 0 0 0 /PRINT = SOLUTION TESTCOV /RANDOM sujet_diff | COVTYPE(VC) . Résultats
Comparaison de deux modèles imbriqués • Modèle M1 • Modèle M0 : cas particulier de M1 • Les paramètres de M0 ne sont pas sur leurs frontières de définition. • Test LRT (Likelihood Ratio Test) : où = Nb de paramètres de M1 - Nb de paramètres de M0. Utiliser plutôt « Method = ML »
Test d’un effet aléatoire Test sur le modèle à un effet aléatoire : H0 : s2 = 0 Statistique utilisée : G2 = [-2Log L(Modèle sans effet)] - [-2Log L(Modèle à un effet)] Calcul du niveau de signification : NS = 0.5Prob(2(0) G2) + 0.5Prob(2(1) G2) (2(0) = 0 avec la probabilité 1) La correction réduit le niveau de signification du test LRT usuel.
Application Avec effet sujet Sans effet sujet G2 = [-2Log L(Modèle sans effet)] - [-2Log L(Modèle à un effet)] = 595.511 – 515.437 = 80.074 NS = 0.5Prob(2(0) G2) + 0.5Prob(2(1) G2) = 0.5*Prob(2(1) 80) = 0.000
On exprime le vecteur des moyennes en fonction de polynômes orthogonaux : Quadratique Constante Linéaire Recherche d’une tendance polynomiale Q0, Q1, Q2, Q3 forment une base orthonormée. Cubique
Tests : H0 : 1 = 2 = 3 = 4 <==> H0 : 1 = 2 = 3 = 0 H0 : Tendance linéaire <==> H0 : 1 0, 2 = 3 = 0 H0 : Tendance quadratique <==> H0 : 2 0, 3 = 0 Contrastes orthogonaux : Construction des contrastes orthogonaux On exprime le vecteur des moyennes en fonction des polynômes orthogonaux :
Recherche de tendances Tendances : - AX23 : Quadratique - BWW9 : Linéaire - Contrôle : Constante
Recherche de tendance quadratique pour AX23 Modèle : Tests :
Recherche de tendance quadratique pour AX23 Code SPSS : MIXED rythme BY sujet_diff produit temps /CRITERIA = CIN(95) MXITER(100) MXSTEP(5) SCORING(1) SINGULAR(0.000000000001) HCONVERGE(0, ABSOLUTE) LCONVERGE(0, ABSOLUTE) PCONVERGE(0.000001, ABSOLUTE) /FIXED = produit temps produit*temps | SSTYPE(3) /METHOD = REML /TEST = 'ax23,contraste qua.' temps 1 -1 -1 1 produit*temps 1 -1 -1 1 0 0 0 0 0 0 0 0 /TEST = 'ax23,contraste cub.' temps 1 -3 3 -1 produit*temps 1 -3 3 -1 0 0 0 0 0 0 0 0 /RANDOM sujet_diff | COVTYPE(VC) . Résultats : ==> Validation de la tendance quadratique
Yijk = + i + j + ij + ijk Produit Temps Résidu Produit * Temps Étude du modèle 2 avec des i.k = (i1k, i2k, i3k, i4k ) ~ N(0, ) ou N(0, i) et indépendants entre eux Il faut préciser le type de la matrice de covariance .
Estimated R Correlation Matrix for sujet(produit) 1 1 Row Col1 Col2 Col3 Col4 1 1.0000 0.8280 0.8255 0.6445 2 0.8280 1.0000 0.8373 0.7223 3 0.8255 0.8373 1.0000 0.8346 4 0.6445 0.7223 0.8346 1.0000
de type AR(1) (Auto-régressif d’ordre 1) Estimated R Correlation Matrix for sujet(produit) 1 1 Row Col1 Col2 Col3 Col4 1 1.0000 0.8207 0.6735 0.5527 2 0.8207 1.0000 0.8207 0.6735 3 0.6735 0.8207 1.0000 0.8207 4 0.5527 0.6735 0.8207 1.0000
Modèle 3 Yijk = + i + j + ij + sk(i) + ijk Produit Temps Sujet (Produit) Résidu Produit * Temps avec sk(i)~ N(0, s2) et ijk~ AR(1). Syntaxe SPSS MIXED rythme BY produit temps sujet_diff /CRITERIA = CIN(95) MXITER(100) MXSTEP(5) SCORING(1) SINGULAR(0.000000000001) HCONVERGE(0, ABSOLUTE) LCONVERGE(0, ABSOLUTE) PCONVERGE(0.000001, ABSOLUTE) /FIXED = produit temps produit*temps | SSTYPE(3) /METHOD = REML /PRINT = SOLUTION TESTCOV /RANDOM sujet_diff | COVTYPE(VC) /REPEATED = temps | SUBJECT(sujet_diff) COVTYPE(AR1) .
Estimated R Correlation Matrix for sujet(produit) 1 1 Row Col1 Col2 Col3 Col4 1 1.0000 0.5017 0.2517 0.1263 2 0.5017 1.0000 0.5017 0.2517 3 0.2517 0.5017 1.0000 0.5017 4 0.1263 0.2517 0.5017 1.0000
Choix du type de matrice Critère d’Akaike AIC = - 2 (Res) Log likelihood + 2d où d = nombre de paramètres du modèle définissant (Covariance parameters) Critère de Schwartz (BIC) BIC = - 2 (Res) Log likelihood + dLog(n) - For REML, the value of n is chosen to be total number of cases minus number fixed effect parameters and d is number of covariance parameters. - For ML, the value of n is total number of cases and d is number of fixed effect parameters plus number of covariance parameters. On recherche minimisant le BIC.
Calcul des critères d’Akaike et de Schwarz pour le modèle 3 Critère d’Akaike d =Nombre de paramètres de = 3 AIC = - 2 (Res) Log likelihood + 2d = 482.7 + 6 = 488.7 Critère de Schwarz (BIC) n = 96 – 12 = 84 et d = 3 BIC = - 2 (Res) Log likelihood + dLog(n) = 482.693 + 3Log(84) = 495.985