1 / 43

Modelos de Estructura de Covarianza

Modelos de Estructura de Covarianza. Contenidos. ● Introducción histórica ● Teorías y modelos. Los modelos como aproximaciones ● Clasificación de las variables 1. E n función de los procedimientos por los que se obtienen sus valores 2.En función del papel que desempeñan en el modelo

zubeda
Download Presentation

Modelos de Estructura de Covarianza

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Modelos de Estructura de Covarianza

  2. Contenidos ● Introducción histórica ● Teorías y modelos. Los modelos como aproximaciones ● Clasificación de las variables 1. En función de los procedimientos por los que se obtienen sus valores 2.En función del papel que desempeñan en el modelo ● Variables latentes. Fiabilidad y validez. ● Representación gráfica de los modelos ● Representación algebraica de los modelos. ● Modelos de regresión simple, regresión múltiple, recursivo de ecuaciones estructurales, de medida o análisis factorial confirmatorio, recursivo completo de estructuras de covarianza ● Especificación, Identificación y ajuste del modelo. ● Estadísticos de bondad de ajuste y contrastes de significación ● Modelos recursivos y longitudinales. Donde la causalidad tiene más de una dirección y los datos se ha recogido en diferentes momentos. ● El programa AMOS instrumento para el estudio de los modelos

  3. En la Introducción histórica se suelen distinguir tres etapas • La primera, de los antecedentes remotos, comprende desde el trabajo de Wright, genetista que fue el primero en usarles en 1918, hasta los años sesenta. En este período merece la pena mencionar los trabajos de TUKEY (1954), LAZARSFELD (1955), SIMON (1957)y BLALOCK (1961, 1963), sobre análisis lineal, la correlación parcial y el análisis de caminos • La segunda, etapa de formalización, abarca la década de los sesenta y los primeros años de la década siguiente. Son importantes los trabajos de BLALOCK (1971), los de GOLDBERGER y DUNCAN (1973), DUNCAN (1975] y los de JÖRESKOG y SÖRBOM (1979). En estos trabajos el esfuerzo fundamental se hizo para formalizar rigurosamente las teorías presentadas. • La tercera, etapa de informatización, comienza en el año 1972 con la aparición del programa LISREL (Linear Structural Relationship) escrito por Karl G. Jöreskog y M. Van Thillo. El programa LISREL fue el primero que se comercializó para aplicar a modelos de estructuras de covarianza y en principio lo incorporó el SPSS, en las versiones LISREL 7 y 8. (JÖRESKOG y SÖRBOM; 1989). Pero posteriormente es AMOS el programa que sustenta SPSS, aunque en módulo aparte. Además del programa LISREL y AMOS han surgido varios programas para ordenador como COSAN, MILS, EQS, Mplus, SAS (Proc CALIS), etc. Gracias a estos programas se ahorran los cálculos engorrosos que antes era necesario realizar "a mano" para ajustar los modelos.

  4. ♦Las teorías pueden definirse siguiendo a MERTON, como "grupos de proposiciones lógicamente interconectadas, de las que pueden deducirse uniformidades empíricas". ♦Un modelo se define siguiendo a VOGHT, como una representación o descripción de algo (un fenómeno o un conjunto de relaciones) que ayuda a entenderlo o a estudiarlo. Por eso se puede decir que el modelo es una representación formal de la teoría. La teoría puede ser una aproximación de la realidad y el modelo derivado de ella trata de representar mediante convenios preestablecidos la teoría. Los modelos son solamente representaciones simplificadas y aproximadas de la realidad, por ello cuando se diseña un modelo se pretende esclarecer las relaciones que se dan en el mundo real.

  5. A pesar de su nombre, los modelos causales nunca sirven para probar que un fenómeno sea la causa de otro. Por el momento no hay técnica que sea capaz de probar los enunciados causales empíricamente. Lo que se puede hacer con ayuda del análisis de caminos, y de los sistemas de ecuaciones estructurales, es comprobar si las inferencias causales que un investigador formula son consistentes con los datos empíricos disponibles (BLALOCK)

  6. Cuando un investigador elabora un modelo y posteriormente se comprueba que el modelo no se ajusta a los datos, es necesario realizar una revisión del modelo o abandonarlo. Si, por el contrario, el modelo es consistente con los datos, esto no es una prueba suficiente de los efectos causales. La consistencia entre los datos y el modelo no implica necesariamente la consistencia entre el modelo y la realidad. Lo único que se puede afirmar es que los supuestos del investigador no son contradictorios y por lo tanto pueden ser válidos. El "ser válidos", no quiere decir que sean la única explicación del fenómeno objeto de estudio, ya que es posible que otros modelos también se adapten a los mismos datos

  7. La importancia de los modelos causales reside en que gracias a ellos se pueden rechazar los modelos no consistentes con los datos. El problema está en que el verdadero modelo es sólo uno de entre los muchos en los que pueden encajar los datos; por ello, para diseñar un modelo que se ajuste a la realidad es muy importante el conocimiento sustantivo que el investigador tenga del objeto de estudio.

  8. ¿Cómo se usan en la actualidad los modelos de estructura de covarianza?En general son una técnica más confirmatoriaque exploratoria y podemos enumerar tres formas de uso:

  9. 1. uso como técnica estrictamente confirmatoria • Se diseña el modelo y se estudia la bondad del ajuste pare determinar si las varianzas y covarianzas de los datos son consistentes con el modelo diseñado. • Sin perder de vista que pueden existir otros modelos diferentes al propuesto que también se ajustan a los datos disponibles.

  10. 2. Elección entre modelos alternativos • Se estudian los índices de ajuste de varios modelos diseñados y se elige el que presente mejores resultados. • Actualmente se dispone de múltiples índices de ajuste y es un campo que no para de desarrollarse. • Aunque es deseable en principio, en la realidad no suele ser fácil disponer de varios modelos alternativos.

  11. 3.Uso confirmatorio y exploratorio • Se comprueba si un modelo se ajusta a los datos y al encontrarle deficiente se le realizan los cambios sugeridos por los índices encontrados. • Este uso tiene el problema de que se encuentran modelos que ajustan bien a los datos con los que se trabaja, pero al usar otra muestra el modelo suele resultar deficiente.

  12. Los modelos como aproximaciones • Los modelos se usan en ciencia como abstracciones teóricas adecuadas para describir datos empíricos. Como tal los modelos son siempre aproximaciones. • 1. Los modelos son una aproximación a la teoría substantiva; ningún modelo contiene todos los conceptos teóricos que pasan por la cabeza del científico que construye el modelo, la construcción de un modelo puede ser una buena estrategia para un posterior desarrollo de la teoría; el intento de formular un modelo adecuado puede iluminar partes del conocimiento en los que la teoría es vaga o inconsistente • 2. Los modelos son una aproximación a los datos; no se espera que el modelo describa el conjunto de datos completamente y con todo detalle. Los modelos son de hecho una simplificación de nuestros datos. La idea central consiste en encontrar un modelo sencillo que describa bien la estructura de un conjunto dado de datos. Esto lo podemos visualizar con la ecuación siguiente: • Datos = Modelo + Error (1)

  13. Datos = Modelo + Error (1) El requerimiento más importante para un buen modelo es que el término de error sea pequeño. Si el término de error es grande, el modelo no será una buena descripción de los datos y deberíamos tratar de encontrar un modelo mejor. La mayoría de los modelos estadísticos proporcionan un test de significación para la "bondad de ajuste" del modelo, habitualmente un test Chi cuadrado. Un segundo requerimiento, muy importante, es que los parámetros estimados tengan sentido. Los modelos proporcionan una conexión entre la teoría y los datos, y el modelo de parámetros describe hipotéticas relaciones en los datos. Es necesario poder comprender el significado sustantivo de los parámetros estimados para poder comprobar nuestra teoría.

  14. Los modelos de estructura de covarianza son expresiones matemáticas de las relaciones subyacentes o procesos que dan origen a las varianzas y covarianzas observadas. Todos los modelos matemáticos, incluyendo los famosos y útiles como el modelo gravitatorio de Newton, son idealizaciones de la naturaleza, inventadas por la mente humana. Los modelos nunca proporcionan una representación exacta de la realidad. Si el modelo reflejara exactamente fenómenos reales sería tan difícil de comprender como lo es el mundo real y por lo tanto tendría poco valor práctico. Por ello se usan modelos que sean lo mas sencillos posibles que aproximen la realidad lo suficientemente bien para nuestros objetivos.

  15. CLASIFICACIÓN DE LAS VARIABLES DE UN MODELO 1. En función de los procedimientos por los que se obtienen sus valores 2. En función del papel que desempeñan en el modelo

  16. Clasificación de las variables según de los procedimientos por los que se obtienen sus valores • - variables observables, las que se pueden medir directamente. Se las suele representar con letras latinas (xi, yi,...). Son variables observables la edad, la profesión, etc.; • - variables latentes, sus valores no se pueden obtener directamente y se han de estimar mediante un conjunto de indicadores. Se las suele representar con letras griegas (i, i,...), leídas como (Ksii, Etai,...). Son variables latentes el estatus socioeconómico, la salud mental, etc.

  17. Variables latentes y variables observables • Las variables latentes, también llamadas constructos o factores, representan conceptos abstractos unidimensionales *, creados por la teoría, como inteligencia, paisaje, clase social, expectativas etc. Se miden utilizando indicadores. • * Los indicadores de las variables latentes no se pueden combinar arbitrariamente, por ejemplo combinar las edad, genero, u otras variables demográficas, para construir la variable latente “Status” no sería adecuado porque esta variable latente no daría lugar a un concepto subyacente medido mediante unos valores continuos. • A las variables menos abstractas como nivel educativo, edad etc, que pueden ser directamente medibles, se las denomina variables observables • A las variables observables se las suele representar dentro de rectángulos y a las latentes dentro de círculos

  18. Clasificación de las variables en función del papel que desempeñan en el modelo • - variables independientes o exógenas, llamadas así porque los fenómenos que las producen son independientes del modelo, exteriores a él. Se las representa por (i, xi ) leídas (Ksii , xi). El modelo NO intenta explicar estas variables. Las flechas rectas del modelo pueden empezar en ellas, pero no pueden acabar en ellas. • - variables dependientes o endógenas, son las que están determinadas por variables del modelo (i, yi), leídas (Etai, yi). Las flechas rectas del modelo pueden empezar y terminar en este tipo de variables, porque las variables endógenas pueden ser tanto la causa como la consecuencia de otras variables endógenas. El modelo intenta explicar estas variables y todas tienen un error. • - variables de los errores de medida de las variables del modelo Estas variables representan las fluctuaciones aleatorias debidas al error en la medida de las variables a la que están asociadas.

  19. Validez y fiabilidad • La medición de una variable es válida cuando mide lo que pretende medir. • Se suele clasificar en • Validez interna: exactitud en la interpretación de los conceptos que se pretende medir • Validez externa: posibilidad de generalización • La medición de una variable es fiable si al repetir la medición en circunstancias similares se obtiene el mismo resultado.

  20. La fiabilidad se puede estudiar mediante la aplicación del test-retest así como con el alfa (α) de Cronbach, test disponible en el programa SPSS. Los valores del alfa (α) de Cronbach varían entre 0 y 1. La regla que se suele usar es que para valores del alfa superiores a 0’7 el conjunto de indicadores es aceptable. Pero el valor de alfa puede ser bajo por la falta de homogeneidad de las varianzas entre los items y también puede dar bajo cuando el número de items que conforman la variable latente es pequeño. Pero que el alfa (α) de Cronbach sea aceptable no implica la unidimensionalidad del constructo ya que se parte de suponer que existe. Cronbach, L.J. (1951) Coefficient Alpha and the internal structre of Test. Psychometrica 16: 297-334. Artículo recomendado: “Efectos del error de medida aleatorio en modelos de ecuaciones estructurales con y sin variables latentes”. A. Oliver y otros. En: Psicologíca (1999)20, 41-55 Para el estudio de la validez dada su extensión recomendamos la publicación: Bollen, K.A. (1989) Structural Equations with Latent Variables. New York: Wiley

  21. Tipos de relaciones entre las variables • 1. Covariación. • Dos fenómenos covarían (están correlacionados), cuando al observar una mayor cantidad de uno de los fenómenos se observa una mayor cantidad del otro y a niveles bajos del primer fenómeno se dan niveles bajos del segundo. • Por ejemplo cociente intelectual y rendimiento escolar.

  22. Pero covariación no implica causalidad. Inteligencia Rendimiento escolar covariación Número de fumadores Cantidad de humo causalidad

  23. Relación espúrea • Tanto la relación causal como la de covariación implica a dos variables • La relación espúrea necesita de al menos tres variables • En la relación espúrea se da covariación entre dos variables, pero debida total o parcialmente a la relación de esas dos variables con al menos una tercera.

  24. En niños cantidad deconocimientos y estatura , la variable edad sería la que hace que exista la covariación, la relación entre las dos primeras variables es espurea. Conocimientos Edad estatura

  25. Relación causal indirecta • Una relación causal indirecta implica la presencia de al menos tres variables • El efecto pasa de la primera a la segunda variable a través de una tercera • La relación entre inteligencia y rendimiento puede estar mediada por la variable esfuerzo, medida como horas de estudio inteligencia esfuerzo rendimiento

  26. Relación causal directa e indirecta • El efecto indirecto entre las variables Inteligencia y Rendimiento puede ser potenciado (o atenuado) por la variable esfuerzo • … • Será el investigador el que decide el tipo de relaciones que su teoría es capaz de explicar Esfuerzo inteligencia Rendimiento

  27. Relación causal condicionada • Hay situaciones en las que el valor de una variable puede determinar la existencia de relación entre otras dos variables. • Este tipo de relaciones son difíciles de formular en un modelo causal. • La manera de estimar estas relaciones suele ser mediante el análisis de subgrupos. Permiso para fumar Nº de fumadores Cantidad de humo

  28. Representación GRAFICA y representación ALGEBRAICA de los modelos • Para facilitar la comprensión de los modelos causales disponemos de dos formas para representarlos, la gráfica y la algebraica. • Estas dos formas de representación son equivalentes entre sí. La representación gráfica se realiza mediante los diagramas de caminos y la forma algebraica mediante ecuaciones (en la mayoría de los casos lineales) que relacionan las variables entre sí.

  29. Representación gráfica y algebraica de los modelos • En este ejemplo todas las variables son observables.

  30. ♦ Las flechas entre las variables simbolizan las relaciones cuya existencia se postula. ♦ Las flechas, que pueden ser rectas o curvas ♦ Si la variable X1 tiene un efecto causal sobre la variable Y1, dibujamos una flecha recta con origen en X1 y final en Y1. ♦ Se asume que, si se produce un cambio en el valor de la variable situada en el origen de la flecha, también se producirá en el valor de la variable situada en la punta de la flecha. Este fenómeno no se da en el sentido inverso. ♦Cuando dos variables están correlacionadas, se unen mediante una flecha curva con dos puntas que apuntan a las dos variables

  31. MODELO DE REGRESIÓN SIMPLE • Este modelo consta de: • - una variable x, independiente, que es observable (medible directamente); • - una variable y, dependiente, que también es observable; • - un camino , que va de la variable x a la y; • una variable de error . • La ecuación de este modelo de regresión lineal sería: • y =  x +  • Esta ecuación muestra la relación existente entre las variables x e y, e indica que una variación unitaria en la variable x produce una variación de unidades en la variable y. •  es el efecto de la variable x sobre la variable y. • es el término de error de y.

  32. Modelo de regresión múltiple y = 1 x1 + 2 x2 + 

  33. Algunos supuestos del modelo de regresión • La relación funcional entre las variables independientes (xi) y la variable dependiente (y) es lineal • No se omiten variables relevantes, ni se incluyen variables irrelevantes en el modelo • Las variables X1 , X 2, ... Xk son linealmente independientes (no se puede poner a una de ellas como combinación lineal de las otras). Esta es la hipótesis de independencia y cuando no se cumple se dice que el modelo presenta multicolinealidad. O sea: Ninguna v. Independiente da un R 2 = 1 con las otras v.independientes • Los residuos siguen una distribución Normal N(0, σ2) , no están correlacionados con ninguna de la variables independientes, ni están autocorrelacionados. Hay homocedasticidad : la varianza del error es constante para los distintos valores de las variables independientes.

  34. Modelo recursivo de ecuaciones estructurales

  35. y1 = 11 x1 + 12 x2 + 13 x3 + 1 y2 = 21 x1 + 21 y1 + 23 x3 + 2 En este sistema y1, y2 son las variables endógenas, dependientes o efectos del modelo y x1, x2, x3 son las variables exógenas e independientes del modelo. Estas variables actúan como causa y el modelo no explica su ocurrencia. La flecha curva de doble dirección entre x1 y x2 representa una relación existente (covariación) entre estas dos variables exógenas, no explicada por el modelo. 12 es la covarianza entre las variables exógenas x1 , x2; 11 es el efecto de x1 sobre y1; 12 es el efecto de x2 sobre y1; 13 es el efecto de x3 sobre y1; 21 es el efecto de x1 sobre y2; 21 es el efecto de y1 sobre y2; 1 es el termino de error de y1; 2 es el termino de error de y2.

  36. Modelo de Medida – Análisis Factorial Confirmatorio se usa para medir variables no observables directamente su medida se realiza mediante la utilización de indicadores • La representación algebraica de un modelo de este tipo sería • 1 = 11 x1 + 21 x2 + 31 x31 + 1

  37. MODELO RECURSIVO COMPLETO DE ESTRUCTURAS DE COVARIANZA

  38. Prerequisito • Para avanzar en los modelos de estructura de covarianza son necesarios ciertos conocimientos previos. • Entre ellos es indispensable saber como realizar (con SPPS u otro programa similar) e interpretar los resultados de un análisis de regresión múltiple.

  39. Variables independientes: • NIVEL SOCIOECONOMICO FAMILIAR, • Edad del/a encuestado/a, • RIQUEZA VERBAL • Variable dependiente: • PAGA SEMANAL EN EUROS.

  40. Resumen del modelo • Modelo R R cuadrado R cuadrado corregida • 1 ,554(a) ,307 ,267 • a Variables predictoras: (Constante), NIVEL SOCIOECONOMICO FAMILIAR, Edad del/a encuestado/a, RIQUEZA VERBAL • El 30’7 % de la variación de la paga es explicado por las variables del modelo.

  41. Salida modelo regresión con SPSS La ecuación de regresión será: Paga = - 5´318 + 0’761 edad – 0’016 Riq.verbal + 4’ 249 niv socioec

  42. El resultado del diagrama realizado con los mismos datos en AMOS

More Related