270 likes | 435 Views
Análisis de datos correlacionados. Gloria Icaza Alejandro Jara Universidad de Talca Universidad de Concepción Chile. Insertar logo UdeC. Octavo Congreso Latinoamericano de Sociedades de Estadística - CLATSE Montevideo Uruguay, Octubre 2008. Definición.
E N D
Análisis de datos correlacionados Gloria Icaza Alejandro Jara Universidad de Talca Universidad de Concepción Chile Insertar logo UdeC Octavo Congreso Latinoamericano de Sociedades de Estadística - CLATSE Montevideo Uruguay, Octubre 2008
Definición • Definimos datos correlacionados cuando las observaciones se agrupan naturalmente en grupos o conglomerados (clusters). • Por ejemplo: • Estudios longitudinales (múltiple observaciones en el tiempo en el mismo sujeto). • Estudios de familia (genética). • Estudios multicéntricos (pacientes de un mismo centro) • Estudios de caries (múltiples observaciones en un mismo sujeto). • Análisis espacial (autocorrelación espacial)
Programa • Modelos lineales mixtos • Modelos lineales generalizados mixtos • Modelos no lineales mixtos • Modelos bayesianos semiparamétricos
Algo de Historia • Fisher. 1918,1925 ANOVA, correlación intraclase. • Henderson. Estimation of variance and covariance components. Biometrics 1953. • Harville. 1974, 1976, 1977 • Laird & Ware. Random effects models for longitudinal data. Biometrics 1982. • ……
Modelos lineales y SAS *Normal, Poisson, Binomial, Gama, Normal inversa
Modelos de Efectos Mixtos: Ejemplo 1 • Investigadores de la Escuela de Odontología de la Universidad de Carolina del Norte, analizaron el crecimiento de 27 niños (16 hombres, 11 mujeres) desde los 8 hasta los 14 años. Biometrika, 1964. • Con rayos X midieron, cada dos años, la distancia entre la pituitaria y la fisura pterigomaxilar.
Modelos de Efectos Mixtos: Gráfico de tallarines (spaghetti plots)
Modelos de Efectos Mixtos: Ejemplo 1 • Preguntas: • ¿Cómo afecta la edad en el crecimiento? • ¿Hay diferencias por sexo? • ¿Es el crecimiento diferentes entre los dos sexos (hay interacción)?
¿Solución? • Software • Library nlme: Linear and Nonlinear Mixed Effects Models • Author:Jose Pinheiro, Douglas Bates, Saikat DebRoy, Deepayan Sarkar, the R Core team
N i j 1 1 n d i i = = i 2 , , . . . . . . , , ( ) N 0 ² ¾ » i j ; ¯ ¯ d d D E i i t + + s a n c a a ² = i j i j i j 0 1 Modelos de efectos mixtos: Ejemplo 1 • Modelo de regresión lineal simple Problema: no tomamos en cuenta la correlación dentro de los sujetos y la variabilidad entre los sujetos
Datos correlacionados • ¿Porqué hacer un diseño de datos correlacionados? • Aumentar la precisión haciendo comparaciones dentro del grupo. • Reducir la posibilidad de confusión haciendo comparaciones dentro del grupo. • Examinar comportamiento de sujetos en el tiempo. • No hay otra alternativa.
N i j 1 1 n d i i = = i 2 , , . . . . . . , , ( ) N 0 ² ¾ » i j ; ¯ ¯ d d D E i i t + + s a n c a a ² = i j i i i j i j 0 1 Modelos de efectos mixtos: Ejemplo 1 • Modelos de regresión lineal individuales
( ) ( ) ¯ b ¯ b d d D E i i t + + + + s a n c a a ² = i j i i i j i j 0 0 1 1 ¯ ¯ d d b b d d E E + + + + a a ² = i j i i i j i j 0 1 0 1 Modelos de efectos mixtos: Ejemplo 1 • Modelo lineal mixto
¯ ¯ b ¯ ¯ b d d E A A + + + + g g a e e i i i j 0 0 0 1 1 1 i j i j Modelos de efectos mixtos: Ejemplo 1 • Descripción del modelo
d i i ( ) b § N 0 ( j ) » b ¯ b ¯ b X X Z Z E i + + + ; y y ² = = i i i i i i i i i i Modelos de efectos mixtos • Modelo lineal general de efectos mixtos
d i i 2 j ( ) ( ) b ¯ b b X Z § N I N 0 + y ¾ » » i i i i i i ; ; ; Modelos de efectos mixtos • Modelo lineal general de efectos mixtos
Modelos de efectos mixtos: software • Máxima Verosimilitud: • R • STATA • SAS • Análisis Bayesiano: • BUGS • R
Comparación de modelos Akaike Information Criterion: -2 log L + 2 npar Bayesian Information Criterion: -2 log L + npar*log(nobs)
MV o MVR (ML or REML) • MV maximiza la verosimilitud, son sesgados • MVR maximiza la verosimilitud marginal, insesgados en diseños balanceados (idénticos a los estimadores de momentos en ANOVA simple) • Ambos métodos son asintóticamente equivalentes
Final • La variable respuesta Y se asume como una función de covariables X con coeficientes que regresión que pueden variar por sujeto. • La heterogeneidad entre los sujetos es de interés y se puede modelar explícitamente.
Final II • Estos métodos podrían ser analizados asumiendo respuesta multivariada • En la práctica se tienen datos no balanceados: • Número desigual de observaciones por sujeto • Mediciones no tomadas en un tiempo fijo • Por lo que los Modelos de efectos mixtos son más flexibles