1 / 66

Analyse de la variance à effets mixtes

Analyse de la variance à effets mixtes. Michel Tenenhaus. Exemple 4 (Milliken & Johnson) Rythmes cardiaques. Rythme cardiaque pour trois groupes de traitements et quatre instants de mesure. - Facteurs fixes : Traitement, Temps - Facteur aléatoire : Sujet(Traitement). Extrait des données.

Download Presentation

Analyse de la variance à effets mixtes

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Analyse de la variance à effets mixtes Michel Tenenhaus

  2. Exemple 4 (Milliken & Johnson)Rythmes cardiaques Rythme cardiaque pour trois groupes de traitements et quatre instants de mesure - Facteurs fixes : Traitement, Temps - Facteur aléatoire : Sujet(Traitement)

  3. Extrait des données

  4. Moyennes des rythmes cardiaquespar produit et par instant

  5. Modèle 1 Yijk =  + i + j + ij + sk(i) + ijk Produit Temps Sujet (Produit) Résidu Produit * Temps Effets fixes Effets aléatoires Les modèles avec : - sk(i) ~ N(0, s2) s2 = Variance inter-sujets - ijk ~ N(0, 2) 2 = Variance intra-sujets Les aléas sont indépendants. Les variances peuvent dépendre du traitement. La variance intra-sujets peut dépendre du traitement et du temps.

  6. Yijk =  + i + j + ij + ijk Produit Temps Résidu Produit * Temps Modèle 2 avec : - i.k = (i1k, i2k, i3k, i4k ) ~ N(0, ) - Les i.k sont indépendants entre eux. La matrice de covariance  peut dépendre du traitement. L’utilisateur doit choisir le type de la matrice .

  7. Quelques types de matrice 

  8. Quelques types de matrice  (suite) etc...

  9. Modèle 3 Yijk =  + i + j + ij + sk(i) + ijk Produit Temps Sujet (Produit) Résidu Produit * Temps avec : - sk(i) ~ N(0, s2) - ijk ~ AR(1) (*) (*) ijk =  i(j-1)k+ aijk , où les aijk suivent une loi N(0, a2) et sont indépendants entre eux.

  10. Yijk =  + i + j + ij + sk(i) + ijk Produit Sujet (Produit) Résidu Temps Produit * Temps - sk(i) ~ N(0, s2) - ijk ~ N(0, 2) avec : + indépendance Étude du modèle 1 Dans le modèle 1, les corrélations entre les mesures sont positives.

  11. Yijk =  + i + j + ij + sk(i) + ijk Produit Sujet (Produit) Résidu Temps Produit * Temps Le modèle 1 est un modèle 2 avec  de type « compound symmetry » et covariance positive est de type « Compound Symmetry » avec covariance positive.

  12. Formulaire Modèle : y = X + Zu +  avec : u ~ N(0, G),  ~ N(0, R), et Cov(u, ) = 0 Il est préférable qu’un facteur aléatoire ait au moins 5 modalités. Sinon, passer en fixe. - Var(y) = V = ZGZ´ + R - y ~ N(X, V) Estimation : (Utiliser Method = REML) 1) Les matrices G et R sont estimées par maximum de vraisemblance restreint.

  13. Formulaire (suite) Modèle : y = X + Zu +  avec : u ~ N(0, G),  ~ N(0, R), et Cov(u, ) Test : H0 : K + Mu = 0 (Inférerence : Large / étroite) Statistique utilisée :

  14. Calcul de  par la méthode de Satterthwaite (Méthode par défaut de SPSS) • - Permet de retrouver les résultats du GLM • pour le test d’un contraste. • Le ddl du dénominateur ne dépend pas du nom • de l’effet aléatoire. • - Permet de généraliser l’approche de Satterthwaite • aux modèles mixtes.

  15. Yijk =  + i + j + ij + sk(i) + ijk Produit Sujet (Produit) Résidu Temps Produit * Temps Etude du modèle 1 Utilisation de SPSS

  16. Résultats Modèle 1

  17. Résultats Modèle 1 (suite)

  18. Résultats Modèle 1 (suite)

  19. Résultats Modèle 1 (Proc Mixed de SAS) Estimated V Matrix for sujet(produit) 1 1 Row Col1 Col2 Col3 Col4 1 33.0789 25.8016 25.8016 25.8016 2 25.8016 33.0789 25.8016 25.8016 3 25.8016 25.8016 33.0789 25.8016 4 25.8016 25.8016 25.8016 33.0789 Estimated V Correlation Matrix for sujet(produit) 1 1 Row Col1 Col2 Col3 Col4 1 1.0000 0.7800 0.7800 0.7800 2 0.7800 1.0000 0.7800 0.7800 3 0.7800 0.7800 1.0000 0.7800 4 0.7800 0.7800 0.7800 1.0000

  20. Résultats Modèle 1 (suite)

  21. Résultats Modèle 1 (SAS) Solution for Random Effects Std Err Effect sujet produit Estimate Pred DF t Value Pr > |t| sujet(produit) 1 1 2.5397 2.1708 63 1.17 0.2464 sujet(produit) 2 1 5.8091 2.1708 63 2.68 0.0095 sujet(produit) 3 1 0.9049 2.1708 63 0.42 0.6782 sujet(produit) 4 1 0.4379 2.1708 63 0.20 0.8408 sujet(produit) 5 1 -3.9993 2.1708 63 -1.84 0.0701 sujet(produit) 6 1 3.0067 2.1708 63 1.39 0.1709 sujet(produit) 7 1 -5.1669 2.1708 63 -2.38 0.0203 sujet(produit) 8 1 -3.5322 2.1708 63 -1.63 0.1087 sujet(produit) 1 2 2.3061 2.1708 63 1.06 0.2921 sujet(produit) 2 2 1.8391 2.1708 63 0.85 0.4001 sujet(produit) 3 2 -7.0352 2.1708 63 -3.24 0.0019 sujet(produit) 4 2 1.6055 2.1708 63 0.74 0.4623 sujet(produit) 5 2 -0.2627 2.1708 63 -0.12 0.9041 sujet(produit) 6 2 1.3720 2.1708 63 0.63 0.5296 sujet(produit) 7 2 -0.2627 2.1708 63 -0.12 0.9041 sujet(produit) 8 2 0.4379 2.1708 63 0.20 0.8408 sujet(produit) 1 3 0.0292 2.1708 63 0.01 0.9893 sujet(produit) 2 3 -4.6415 2.1708 63 -2.14 0.0364 sujet(produit) 3 3 14.2747 2.1708 63 6.58 <.0001 sujet(produit) 4 3 5.1669 2.1708 63 2.38 0.0203 sujet(produit) 5 3 -1.1385 2.1708 63 -0.52 0.6018 sujet(produit) 6 3 -8.1445 2.1708 63 -3.75 0.0004 sujet(produit) 7 3 -1.6055 2.1708 63 -0.74 0.4623 sujet(produit) 8 3 -3.9409 2.1708 63 -1.82 0.0742  = 0  = 0  = 0

  22. Résultats Modèle 1 (suite)

  23. T1 T2 T3 T4 Comparaison des moyennes Modèle : Estimation de11 - 31 : Test : H0 :

  24. Comparaison entre AX23 et Contrôle en T1 Syntaxe SPSS MIXED rythme BY sujet_diff produit temps /CRITERIA = CIN(95) MXITER(100) MXSTEP(5) SCORING(1) SINGULAR(0.000000000001) HCONVERGE(0, ABSOLUTE) LCONVERGE(0, ABSOLUTE) PCONVERGE(0.000001, ABSOLUTE) /FIXED = produit temps produit*temps | SSTYPE(3) /METHOD = REML /TEST = 'mu11 vs mu31' produit 1 0 -1 produit*temps 1 0 0 0 0 0 0 0 -1 0 0 0 /PRINT = SOLUTION TESTCOV /RANDOM sujet_diff | COVTYPE(VC) . Résultats

  25. Comparaison de deux modèles imbriqués • Modèle M1 • Modèle M0 : cas particulier de M1 • Les paramètres  de M0 ne sont pas sur leurs frontières de définition. • Test LRT (Likelihood Ratio Test) : où  = Nb de paramètres de M1 - Nb de paramètres de M0. Utiliser plutôt « Method = ML »

  26. Test d’un effet aléatoire Test sur le modèle à un effet aléatoire : H0 : s2 = 0 Statistique utilisée : G2 = [-2Log L(Modèle sans effet)] - [-2Log L(Modèle à un effet)] Calcul du niveau de signification : NS = 0.5Prob(2(0)  G2) + 0.5Prob(2(1)  G2) (2(0) = 0 avec la probabilité 1) La correction réduit le niveau de signification du test LRT usuel.

  27. Application Avec effet sujet Sans effet sujet G2 = [-2Log L(Modèle sans effet)] - [-2Log L(Modèle à un effet)] = 595.511 – 515.437 = 80.074 NS = 0.5Prob(2(0)  G2) + 0.5Prob(2(1)  G2) = 0.5*Prob(2(1)  80) = 0.000

  28. On exprime le vecteur des moyennes en fonction de polynômes orthogonaux : Quadratique Constante Linéaire Recherche d’une tendance polynomiale Q0, Q1, Q2, Q3 forment une base orthonormée. Cubique

  29. Tests : H0 : 1 = 2 = 3 = 4 <==> H0 : 1 = 2 = 3 = 0 H0 : Tendance linéaire <==> H0 : 1  0, 2 = 3 = 0 H0 : Tendance quadratique <==> H0 : 2  0, 3 = 0 Contrastes orthogonaux : Construction des contrastes orthogonaux On exprime le vecteur des moyennes  en fonction des polynômes orthogonaux :

  30. Recherche de tendances Tendances : - AX23 : Quadratique - BWW9 : Linéaire - Contrôle : Constante

  31. Recherche de tendance quadratique pour AX23 Modèle : Tests :

  32. Recherche de tendance quadratique pour AX23 Code SPSS : MIXED rythme BY sujet_diff produit temps /CRITERIA = CIN(95) MXITER(100) MXSTEP(5) SCORING(1) SINGULAR(0.000000000001) HCONVERGE(0, ABSOLUTE) LCONVERGE(0, ABSOLUTE) PCONVERGE(0.000001, ABSOLUTE) /FIXED = produit temps produit*temps | SSTYPE(3) /METHOD = REML /TEST = 'ax23,contraste qua.' temps 1 -1 -1 1 produit*temps 1 -1 -1 1 0 0 0 0 0 0 0 0 /TEST = 'ax23,contraste cub.' temps 1 -3 3 -1 produit*temps 1 -3 3 -1 0 0 0 0 0 0 0 0 /RANDOM sujet_diff | COVTYPE(VC) . Résultats : ==> Validation de la tendance quadratique

  33. Yijk =  + i + j + ij + ijk Produit Temps Résidu Produit * Temps Étude du modèle 2 avec des i.k = (i1k, i2k, i3k, i4k ) ~ N(0, ) ou N(0, i) et indépendants entre eux Il faut préciser le type de la matrice de covariance .

  34.  de type UN (UNSTRUCTURED)

  35. Résultats SPSS :  de type « UNSTRUCTURED »

  36. Estimated R Correlation Matrix for sujet(produit) 1 1 Row Col1 Col2 Col3 Col4 1 1.0000 0.8280 0.8255 0.6445 2 0.8280 1.0000 0.8373 0.7223 3 0.8255 0.8373 1.0000 0.8346 4 0.6445 0.7223 0.8346 1.0000

  37.  de type CS (COMPOUND SYMMETRY)

  38. Résultats SPSS :  de type « CS »

  39.  de type AR(1) (Auto-régressif d’ordre 1)

  40.  de type AR(1) (Auto-régressif d’ordre 1) Estimated R Correlation Matrix for sujet(produit) 1 1 Row Col1 Col2 Col3 Col4 1 1.0000 0.8207 0.6735 0.5527 2 0.8207 1.0000 0.8207 0.6735 3 0.6735 0.8207 1.0000 0.8207 4 0.5527 0.6735 0.8207 1.0000

  41.  de type CS hétérogène par temps

  42. Résultats SPSS

  43. Résultats SPSS

  44. Modèle 3 Yijk =  + i + j + ij + sk(i) + ijk Produit Temps Sujet (Produit) Résidu Produit * Temps avec sk(i)~ N(0, s2) et ijk~ AR(1). Syntaxe SPSS MIXED rythme BY produit temps sujet_diff /CRITERIA = CIN(95) MXITER(100) MXSTEP(5) SCORING(1) SINGULAR(0.000000000001) HCONVERGE(0, ABSOLUTE) LCONVERGE(0, ABSOLUTE) PCONVERGE(0.000001, ABSOLUTE) /FIXED = produit temps produit*temps | SSTYPE(3) /METHOD = REML /PRINT = SOLUTION TESTCOV /RANDOM sujet_diff | COVTYPE(VC) /REPEATED = temps | SUBJECT(sujet_diff) COVTYPE(AR1) .

  45. Estimated R Correlation Matrix for sujet(produit) 1 1 Row Col1 Col2 Col3 Col4 1 1.0000 0.5017 0.2517 0.1263 2 0.5017 1.0000 0.5017 0.2517 3 0.2517 0.5017 1.0000 0.5017 4 0.1263 0.2517 0.5017 1.0000

  46. Choix du type de matrice  Critère d’Akaike AIC = - 2 (Res) Log likelihood + 2d où d = nombre de paramètres du modèle définissant  (Covariance parameters) Critère de Schwartz (BIC) BIC = - 2 (Res) Log likelihood + dLog(n) - For REML, the value of n is chosen to be total number of cases minus number fixed effect parameters and d is number of covariance parameters. - For ML, the value of n is total number of cases and d is number of fixed effect parameters plus number of covariance parameters. On recherche  minimisant le BIC.

  47. Calcul des critères d’Akaike et de Schwarz pour le modèle 3 Critère d’Akaike d =Nombre de paramètres de  = 3 AIC = - 2 (Res) Log likelihood + 2d = 482.7 + 6 = 488.7 Critère de Schwarz (BIC) n = 96 – 12 = 84 et d = 3 BIC = - 2 (Res) Log likelihood + dLog(n) = 482.693 + 3Log(84) = 495.985

More Related