380 likes | 1.04k Views
ANÁLISIS DISCRIMINANTE. Investigación de Mercados II. EQUIPO 4:. Caamal Miguel Gómez Enrique Catzín Omar Esparza Eber Escalante Rosario. INTRODUCCIÓN. En los negocios hay muchas situaciones donde sujetos en estudio pueden ser separados en dos o más grupos bien definidos.
E N D
ANÁLISIS DISCRIMINANTE Investigación de Mercados II
EQUIPO 4: • Caamal Miguel • Gómez Enrique • Catzín Omar • Esparza Eber • Escalante Rosario
INTRODUCCIÓN En los negocios hay muchas situaciones donde sujetos en estudio pueden ser separados en dos o más grupos bien definidos. Estos sujetos pueden ser personas, ciudades, universidades, países u otros. El propósito del Análisis Discriminante es construir un clasificador basado en datos multivariados, pertenecientes a grupos bien conocidos por el investigador.
DEFINICIÓN Análisis discriminante: • Técnica de Análisis Multivariante que permite asignar o clasificar nuevos individuos dentro de grupos previamente reconocidos o definidos.
DEFINICIÓN • Análisis discriminante de dos grupos: Técnica de análisis discriminante en la que la variable de criterio tiene dos categorías. • Análisis discriminante múltiple: Técnica de análisis discriminante en la que la variable de criterio abarca tres o más categorías.
PASOS REQUERIDOS EN EL ANÁLISIS DISCRIMINANTE • Formulación • Estimación • Determinación de la significancia • Interpretación • Validación
OBJETIVOS • 1. La habilidad para describir los casos observados matemáticamente de una manera que los separa en grupos tan bien como sea posible. • 2. La habilidad para clasificar nuevas observaciones como pertenencia a uno u algunos grupos.
SE DEBE TENER EN CUENTA QUE: • Los grupos de la variable dependiente deben ser mutuamente excluyentes. • No es confiable el grado de error si se pronostica con los mismos datos (use un % de la población o muestra observada). • Se pueden tener n variables independientes siempre y cuando sean medidas métricas. • La variable dependiente no debe ser métrica sino categórica (nominal) para formar grupos.
SEMEJANZA Y DIFERENCIA ENTRE ANÁLISIS DE VARIANZA, REGRESIÓN Y DISCRIMINANTE
ETAPAS • SELECCIÓN DE VARIABLES DEPENDIENTE E INDEPENDIENTES. • SELECCIÓN DEL TAMAÑO MUESTRAL. • DIVISIÓN DE LA MUESTRA. • CHEQUEO DE LAS HIPÓTESIS DE PARTIDA. • ESTIMACIÓN DEL MODELO. • VALIDACIÓN DE LAS FUNCIONES DISCRIMINANTES. • CONTRIBUCIÓN DE LAS VARIABLES A LA CAPACIDAD DISCRIMINANTE DE LAS FUNCIONES. • VALORACIÓN DE LA CAPACIDAD PREDICTIVA. • UTILIZACIÓN FUNCIONES.
SUPUESTOS QUE FUNDAMENTAN LA TÉCNICA Para que se logre una Función Linear Discriminante óptima se supone que: • Cada grupo debe ser una muestra de una población normal multivariada. • Las matrices de covarianza poblacional deben ser iguales. (Se entiende por varianza la dispersión de los datos con respecto a su media y covarianza la dispersión de los datos tomando en cuenta las dos variables como si fueran una sola). Se utiliza la M de Box para probar la igualdad de las matrices de covarianza de la variables independientes entre los grupos que forman la variable dependiente. Si la M de Box resulta significativa no se puede sustentar la hipótesis que señala que las matrices de covarianza poblacional son iguales y por consiguiente no hay lugar al uso de la técnica.
SELECCIÓN DE VARIABLES DEPENDIENTE EINDEPENDIENTES • La variable dependiente no tiene que ser, necesariamente, categórica en origen. • Los grupos deben ser mutuamente excluyentes. • La decisión sobre el número de categorías. • Debe ajustarse al poder discriminante de los predictores • Puede observarse en etapas sucesivas (inicial con todas, y en el límite, optando sólo por el enfoque de extremos polares) • Las variables explicativas: • No deben ser excesivas • Deben atender siempre al objetivo conceptual • Pueden someterse a un test univariante de diferencia de medias o un test ANOV.
SELECCIÓN DEL TAMAÑO MUESTRAL • Elevada sensibilidad al tamaño muestral Vs. Nº de predictoras. (Receta: mínimo 5 observaciones por variable, recomendado 20 observaciones por variable). • También debe vigilarse el tamaño de los grupos: • El equilibrio no es necesario pero es recomendable. • El más pequeño de los grupos no puede serlo mucho (Receta: como mínimo, el tamaño del grupo más pequeño debe ser mayor al número de variables).
DIVISIÓN DE LA MUESTRA • Utilidad del “enfoque de validación cruzada (muestra de análisis + muestra ampliada)”. • Garantizado un tamaño muestral total suficiente. • Aplicando muestreo estratificado proporcional en ambas muestra.
VALIDACIÓN DE LAS FUNCIONES DISCRIMINANTES • Autovalores: En el método de Fisher, la obtención de las distintas funciones se deriva de un proceso de obtención de raíces y vectores propios de una forma cuadrática. La suma de cuadrados entre grupos de cada función discriminante, viene definida por un autovalor l(i). • Ratio Autovalor / Suma autovalores: capacidad discriminante relativa, pero no absoluta. • Correlación canónica función - variable clasificación original: Coeficientes elevados anticipan adecuada capacidad discriminante.
EJEMPLO Se dispone de una muestra de pacientes a los que se les mide previamente un conjunto de variables. El investigador puede dividir la muestra en dos (o más) grupos de diagnóstico. Más tarde se mide a un nuevo enfermo el mismo grupo de variables y, por los valores obtenidos, el Análisis Discriminante permite asignar dicho paciente al grupo de máxima probabilidad, cuantificando a la vez el valor de ella.