390 likes | 756 Views
Análisis de Correspondencias Simples ACS. Prof: Salvador Carrasco Arroyo. Materias Troncales. Tema 1: Análisis de Datos Multivariantes Tema 2: Análisis de la Varianza Tema 3: Técnicas de Análisis Multivariantes Tema 4: Análisis de Componentes Principales Tema 5: Análisis Factorial
E N D
Análisis de Correspondencias Simples ACS Prof: Salvador Carrasco Arroyo
Materias Troncales Tema 1: Análisis de Datos Multivariantes Tema 2: Análisis de la Varianza Tema 3: Técnicas de Análisis Multivariantes Tema 4: Análisis de Componentes Principales Tema 5: Análisis Factorial Tema 6: Análisis Cluster Tema 7: Análisis Discriminante Tema 8: Análisis de Correspondencias Simples Estadística I Estadística II Materia Optativa 3º de ECO Análisis de datos II
Tema 8: Análisis de Correspondencias Simples –Pág:3 Selección de la Técnica A.F.C. ¿cuántas variables hay? Información inicial ¿Existe dependencia o interdependencia entre las variables? ¿cuáles son las características de estas variables? ¿qué escala de medida se ha utilizado? Objetivo General Analizar simultáneamente todas las variables para encontrar una estructura de menor dimensión que explique el comportamiento de los “elementos-individuos” según la estructura de las modalidades de las variables ACS Si se trabaja con dos variables ACM Si se trabaja con más de dos variables
Tema 8: Análisis de Correspondencias Simples –Pág:4 Técnica exploratoria de análisis especialmente diseñada para analizar tablas de contingencia formada por números positivos. Objetivo: establecer una tipología de los “elementos”, en función del comportamiento de asociación o independencia expresado entre las modalidades Análisis de Correspondencias Simples En general como todo Análisis factorial reduciremos la dimensión inicial y nos permitirá realizar tratamientos estadísticos posteriores.
Tema 8: Análisis de Correspondencias Simples –Pág:5 Esquema del ACS
Tema 8: Análisis de Correspondencias Simples –Pág:6 V – Fila: Color de pelo V – Columna:Color de ojos PAHOGUE96 Nº Individuos 4959 Variables: Sexo Edad Ingresos anuales V – Fila: Edad –Sexo V – Columna: Ingresos según el SMIP SPSS/Spad.N Excel/SPSS Tabla de datos = N
Tema 8: Análisis de Correspondencias Simples –Pág:7 Tabla de frecuencias = F ¿Existe o no independencia estadística entre las dos variables?
Tema 8: Análisis de Correspondencias Simples –Pág:8 i,j fij = fi. . f.j ¿Existe o no independencia? Las modalidades i y j se asocian mas que la Ho fij > fi. .f.j fij fi. .f.j Las modalidades i y j se asocian menos que la Ho fij < fi. . f.j fij > fi. .f.j
Tema 8: Análisis de Correspondencias Simples –Pág:10 Tabla de perfiles fila= H Rp fij/fi.representa el porcentaje de elementos de la distribución que cumplen la modalidad j sabiendo que poseen la condición i de la primera variable. Donde: La semejanza entre dos filas vendrá determinada por establecer la distancia euclidea entre los dos perfiles. Esta distancia favorece las columnas que tienen una masa o peso mas importante
Tema 8: Análisis de Correspondencias Simples –Pág:11 Al introducir la ponderación estamos equilibrando los perfiles y dando la misma importancia a cada uno de ellos Aparece una distancia entre los perfiles-fila (i,l), definida por: La distancia entre dos filas depende esencialmente de las diferencias termino a termino entre los dos perfiles. Esta distancia es una suma ponderada de los cuadrados de las diferencias entre los perfiles. Esta distancia tiene la propiedad de la llamada equivalencia distribucional.
Tema 8: Análisis de Correspondencias Simples –Pág:12 De acuerdo con esta distancia, las modalidades (p-f) están representadas por una configuración de i puntos en un espacio euclideo Rp de coordenadas. Así la matriz X de perfiles transformados será: Donde: En ACS los pesos o masas de cada punto de la nube vienen impuestos. El punto i tienen un peso igual a la frecuencia marginal fi., este peso es proporcional al número de individuos que representa. El Baricentro GI de los p-filasI dotados de estos pesos tiene como j-ésima coordenada la media ponderada de las j-ésimas coordenadas de los puntos NI.
Tema 8: Análisis de Correspondencias Simples –Pág:14 En general se trata de buscar un subespacio de menor dimensión que nos llevara a encontrar un sistema de vectores ortonormado para la métrica (Rp, Rr) de manera que sea máxima la inercia de las nubes proyectada sobre el subespacio . Este proceso se realiza a partir de la diagonallización de la matriz de varianzas-covarianzas Cp.
Tema 8: Análisis de Correspondencias Simples –Pág:15 Cp = X' DnX - M M' Donde: Matriz diagonal de los pesosfi. Dn Vector medias M • M es el vector propio de Cp de valor propio = 0 • Los vectores propios de Cp son también vectores propios de X' DnX. • M es un vector propio de X'DnX de valor propio = 1 Basta diagonalizar Cp*= X’DnX
Tema 8: Análisis de Correspondencias Simples –Pág:16 Esta matriz Cp* la obtenemos a partir de: Donde la matriz X* cuyo termino general es x = Se obtiene la ecuación característica de grado cuatro de la que se obtiene los 4 valores propios 1=1 2=0’146445 3=0’111375 4=0’000014
Tema 8: Análisis de Correspondencias Simples –Pág:17 Calculo de las tasas de inercia El calculo de las tasas de inercia permiten evaluar la calidad global del ajuste. La tasa de inercia asociada al eje factorial indica la parte de la inercia total de la nube proyectada sobre este eje. En forma general será: El porcentaje de la inercia explicada por el 2 º y 3er ... ejes factoriales será:
Tema 8: Análisis de Correspondencias Simples –Pág:18 Calculo de las coordenadas factoriales -- Rp Las coordenadas de los perfiles-fila vendrán dadas a partir del producto de la matriz de los perfiles transformados por la matriz de vectores propios. F = X . U u1 u2 u3 x =
Tema 8: Análisis de Correspondencias Simples –Pág:19 Calculo de las coordenadas factoriales -- Rr Debido al papel simétrico que juegan las filas y las columnas en ACS, el ajuste en Rr se plantea en los mismos términos y posee las mismas propiedades que el ajuste en Rp Las coordenadas de los puntos p-columna las obtenemos a través de las relaciones de transición.
Tema 8: Análisis de Correspondencias Simples –Pág:20 Calculo de las contribuciones de los p-fila Contribuciones absolutas.- Expresan la proporción de la varianza explicada por un eje debida a un perfil (i,j). Es decir, permiten saber que modalidades son las responsables de la construcción de un factor.
Tema 8: Análisis de Correspondencias Simples –Pág:21 Contribuciones relativas.- Expresan la contribución de un factor en la explicación de la dispersión o variabilidad de los elementos de la población que constituyen una modalidad de la variable. matriz de perfiles transformados centrada
Tema 8: Análisis de Correspondencias Simples –Pág:22 Calculo de las contribuciones de los p-columna Simétricamente obtendríamos las contribuciones absolutas y relativas de los perfiles columna:
Tema 8: Análisis de Correspondencias Simples –Pág:23 El cuadro resumen
Tema 8: Análisis de Correspondencias Simples –Pág:24 12 modalidades: • Partimos de los resultados del Panel de Hogares de 1996. • Nº de elementos: 4.959 • Hemos seleccionado las variables: • Sexo • Edad • Salario • Realizada la transformación • Sexo-edad • Salario según nº de veces el SMIP Utilizamos el SPSS V.7,5 – SPAD.N <25 H <25M 25-33H 25-33M 33-41H 33-41M 41-49H 41-49M 49-57H 49-57M >57H >57M 6 modalidades: < 1 SMIP 1 – 2 SMIP 2 – 3 SMIP 3 – 4 SMIP 4 – 5 SMIP > 5 SMIP
Tema 8: Análisis de Correspondencias Simples –Pág:25 Tabla de datos
Tema 8: Análisis de Correspondencias Simples –Pág:27 Tabla de Frecuencias Perfiles Fila Perfiles Columna