2.14k likes | 2.53k Views
Master Intervención Psicosocial. Análisis de la regresión. Modelos de análisis estadístico. I. Conceptos básicos. II. Regresión múltiple. Parte I. Conceptos básicos. Análisis estadístico.
E N D
Modelos de análisis estadístico I. Conceptos básicos. II. Regresión múltiple
Análisis estadístico • En un sentido amplio, se refiere a todos los métodos que describen las relaciones que se dan entre diversas variables o dimensiones de variación.
Conceptos básicos • Datos: observaciones realizadas de los individuos o grupos de individuos • Escalas de medida: no métricas (nominales y ordinales) y métricas (intervalos y de razón) • Diseños: estrategias de recogida de datos • Estrategia del diseño: transversal o longitudinal • Modelos de análisis: sistemas o ecuaciones que permiten inferir el tipo de relación entre los datos • Clases de relaciones: asociativas y causales
Elaboración de datos Observación Escala Dato científico directa de medida o valor numérico La conversión de una observación directa en un dato científico se realiza mediante la aplicación de una adecuada escala de medida.
Reunión de datos Sistemas de reunión de datos • Tablas • Gráficos
Tablas • Las tablas se usan en los informes científicos para resumir los datos u otra información que no puede ser presentada de forma conveniente en la narrativa del texto.
Acerca de las tablas Las tablas deben tener un título que informe claramente sobre su contenido como por ejemplo preferencias del partido político. Las tablas estadísticas deberían informar también sobre el número de observaciones que se incluyen (frecuencia). La parte superior de la columna del lado izquierdo de la tabla es referida como título de filas e informa sobre el contenido de las fila. El cuerpo de la tabla contiene los datos de interés. En el ejemplo propuesto se muestra el número de individuos que prefieren un partido político. ..//..
Las tablas que se refieren a una sola variable son conocidas por representaciones univariadas y las que informan sobre dos variables, representaciones bivariadas. En la representaciones bivariadas una variables está asociada a las filas y la otra a las columnas y se conocen, también, por tablas de contingencia. Ejemplo de tabla bivariada que relaciona preferencia de un partido político y afiliación religiosa (en paréntesis están los porcentajes).
Gráficos • Con los gráficos se consigue una representación visual de los datos, por lo que es un procedimiento útil a la investigación. Los gráficos captan mejor la atención del lector, permite clarificar los resultados y facilitar su interpretación
Histograma de frecuencias o gráfico de barras El histograma de frecuencias es un gráfico que muestra la distribución de frecuencias de una variable de intervalo. El eje horizontal del histograma o gráfico de barras presenta los intervalos y el eje vertical la cantidad de puntuaciones de cada intervalo (frecuencia). La altura de la barra indica la frecuencia de casos de cada categoría. El gráfico siguiente muestra la cantidad de amigos reportados por estudiantes de un College americano. ..//..
En el segundo ejemplo, se muestra un gráfico de barras sobre el efecto de dos drogas antiansiolíticas. Se trata de una escala nominal y la diferencia entre el primer y segundo panel estriba en la forma de representar las unidades en el eje vertical (unidades pequeñas en el primer panel y punto cero y unidades grandes en el segundo). Nótese que la gran diferencia entre las dos drogas que se observa en el primer panel y que desaparece en la segunda representación.
Polígono de frecuencias Es una forma alternativa de representa el histograma de frecuencias. Así, en lugar de barras se utilizan líneas que conectan las frecuencias de los intervalos de clase. En el ejemplo siguiente se muestra la misma información sobre la cantidad de amigos, pero utilizando el sistema de líneas y no de barras. De igual modo, se tiene el gráfico de la cantidad de divorcios al aprobarse correspondiente ley en el Estado de Nebraska.
Cantidad de divorcios antes y después de su promulgación en el Estado de Nebraska
Cuantificación de las variables • Las variables se cuantifican al asignar valores numéricos a los atributos o características de los individuos, objetos y hechos de acuerdo a reglas. • El proceso de asignación de los números de acuerdo a reglas se denomina medida.
Escalas de medida • Las reglas particulares de asignación de números a las variables se definen como escalas de medida. Clasificación: Nominal Ordinal débiles Escalas De intervalo De razón fuertes
Escalas de medida Nominal 1 = varón 2 = hembra Ordinal 1 2 3 De intervalo 15 16 17 18 19 20 21 22 23 De razón 0 1 2 3 4 5 6 7 8
Ejemplos de escalas Nominal los valores sólo representan categorías o nombres (género, raza, religión, etc.) Ordinal los valores representan el orden en función del grado como actitud, preferencia, etc. De intervalo la distancia entre los valores se mantiene constante como la temperatura, respuestas correctas, etc. De razón cuando además de la constancia del intervalo hay un valor cero que coincide con la ausencia del atributo.
Escalas y naturaleza de los datos Escala Tipo Dato Nominal Cualitativa No-paramétrico Ordinal Cuantitativa No-paramétrico De intervalo Cuantitativa discreta Paramétrico De razón Cuantitativa continua Paramétrico
Naturaleza de los datos y prueba estadística Datos de escala Prueba estadística Nominal Prueba Ordinal no paramétrica De intervalo Prueba no paramétrica y De razón paramétrica
Variable dependiente • Datos métricos o gaussianos • Datos no métricos o no gaussianos
Concepto de diseño • El diseño es una estrategia particular de recogida de datos y es función de los objetivos o hipótesis propuestos. • Los diseños son transversales y longitudinales, según la no presencia o presencia de la dimensión temporal en el estudio.
A modo de resumen • ¿Cuál es la relación entre diseño (estudio) matriz de datos y modelo de análisis? • ¿Cuál es la estructura de cualquier investigación científica?
Estructura de la investigación en ciencias sociales Diseño Datos Modelo análisis Problema Estadístico Hipótesis Estimación Variables Inferencia Modelo de escala
A modo de resumen • Se ha visto la secuencia entre las tres fases o momentos de una investigación: diseño, datos y análisis. • Es importante conocer la estructura del diseño, así como los distintos procedimientos o tipos de investigación
Tipología del diseño de investigación • Diseños observacionales • Diseños correlaciones o predictivos (estudios de encuesta) • Diseños cuasi-experimentales • Diseños experimentales
Naturaleza de los datos (variable dependiente) • Datos métricos o cuantitativos (de distribución gaussiana o normal) • Datos no métricos o categóricos (de distribución no-gaussiana)
Estrategia del diseño y modelo de análisisDiseños experimentales y cuasi-experimentales
Diseño Datos cuantitativos Estrategia Datos cualitativos ANOVA Transversal Longitudinal TC Grupos Medidas AR paralelos repetidas Modelo log-lineal Factorial Cross-over MANOVARegresión Medidas Antes-después logística repetidas Cohortes Factorial mixto Split-plot
Diseños no experimentales • En el contexto no experimental (experimento verdadero y cuasi-experimentales) los diseños suelen ser observacionales y correlacionales.Los diseños correlacionales se basan en el análisis de múltiples variables con el propósito de estimar la magnitud de cambio entre ellas.
Sigue… • El objetivo es poder predecir la variable dependiente a partir de la o las variables predictoras o independientes. También se pretende explicar la proporción de variación de la variable dependiente por la o las variables independientes.
¡Cuestión! • Una vez recogidos los datos, ¿qué hacer con ellos? • A esta cuestión cabe responder lo siguiente: los datos se analizan de acuerdo con modelos estadísticos adecuados a fin de derivar consecuencias teóricamente interpretables; es decir, se obtienen resultados que han de ser interpretados.
Modelo estadístico general Y = f(X) + g(E) V.Dep. Parte fija Parte aleatoria
Concepto • El modelo estadístico, o ecuación de carácter lineal, asume que una observación Y es el resultado de la combinación aditiva de alguna función f de variables fijas y de alguna función g de componentes aleatorios, y que tanto f como g pueden tomar parámetros conocidos o desconocidos. ..//..
continuación • Considerada esta ecuación como un modelo estadístico general, se tiene que cualquier observación es la suma de dos partes o componentes: una parte fija o determinista, f(X), y una parte aleatoria desconocida, g(E).