440 likes | 891 Views
Técnicas de análisis multivariante. Pedro Juez Martel. Regresión logística. Es un modelo que determina probabilidades. La variable explicada (dependiente) es dicotómica (1= Presencia; 0= Ausencia). Las variables explicativas pueden ser: cuantitativas
E N D
Técnicas de análisis multivariante Pedro Juez Martel
Regresión logística • Es un modelo que determina probabilidades. • La variable explicada (dependiente) es dicotómica (1= Presencia; 0= Ausencia). • Las variables explicativas pueden ser: • cuantitativas • cualitativas: se deben categorizar si tienen más de dos niveles 1
Regresión logística • La categorización consiste en representar las variables cualitativas a través de unas variables denominadas ficticias. El número de variables será igual al número de niveles menos 1. P.e. Variable situación laboral: fijo, temporal, en paro. Se representaría por dos variables = 3 niveles - 1 = 2. • La representación sería así: • Trabajador fijo: VF1: 1 y VF2: 0 • Trabajador temporal: VF1: 0 y VF2: 1 • Trabajador en paro: VF1: 0 y VF2: 0 1
Regresión logística • Ejemplo: Una empresa de seguros desea establecer un modelo que determine la probabilidad de que se suscriba un seguro. Las variables explicativas elegidas son: • Ingresos (en MM. de pts.) • Situación laboral: • Trabajador fijo: VF1: 1 y VF2: 0 • Trabajador temporal: VF1: 0 y VF2: 1 • Trabajador en paro: VF1: 0 y VF2: 0 • Cargas familiares: 1 = Sí 0 = No
Análisis de la varianza • Permite estudiar si un conjunto de variable/s independientes o explicativas influyen sobre una variable explicada. • VARIACIÓN TOTAL = VARIACIÓN ENTRE+ VARIACIÓN INTRA • Variación total: Mide la variación de cada elemento respecto a la media total. • Variación entre: Mide la variación de la media de cada uno de los grupos respecto a la media total. • Variación Intra: Mide la variación de cada elemento respecto a la media en cada grupo. 1
Análisis de la varianza • Si la VE es igual que la VI significará que los grupos no son distintos respecto a la variable explicada. Es decir, la variable explicativa no servirá para explicarla. El estadístico empleado es: VE/VI. • Cuanto mayor sea este cociente más representativa será la variable. 1
Anova para un factor • En el ANOVA para un factor encontramos una sola variable explicativa. • La representatividad de la variable viene determinada por un contraste F 1
Anova para dos factores • En el ANOVA para dos factores encontramos dos variables explicativas. • Cuando existe más de una variable explicativa hemos de estudiar las interacciones. Es decir el efecto que tiene la presencia de los dos factores a la vez. 1
Análisis factorial • Permite agrupar variables con alta correlación. • Estas variables se denominan factores y al ver con qué variables están más correlacionados.
Análisis factorial • Prueba de esfericidad de Bartlett: Contrasta que existe ausencia de correlación entre las variables. • Indice KMO: Un índice KMO bajo indica que la intercorrelación no es grande y, por lo tanto, el análisis factorial no sería útil. • Correlación múltiple: Indica el grado de asociación entre una variable y todas las otras que intervienen en el análisis.