370 likes | 502 Views
Análisis de correspondencias. Procedimiento para el AC.
E N D
Procedimiento para el AC 1. Se estandariza la tabla de frecuencias relativas dividiendo por (la raiz cuadrada de) los totales de fila y columna. Esta estandarización se hace para que dos filas (columnas) tengan la misma estructura sin efectos de escala. Sea Z la nueva matriz.
Interpretación: una variable binomial tiene media np y desviación típica (npq)1/2. Si p es pequeño se aproxima por (np)1/2. • Cada celda tiene una desviación estandar distinta que podemos estimar por el producto de sus frecuencias relativas por filas (fri)1/2 y columnas (frj)1/2. Estandarizando su desviación típida las hacemos comparables.
2. Se calculan valores y vectores propios de las matrices Z’Z y ZZ’ donde Z es la matriz de frecuencias relativas estandarizada. 3. Se toman los dos vectores propios ligados a los dos mayores valores propios (excluyendo el uno) de la matriz Z’Z (o del matriz ZZ’) y se proyectan las filas (columnas) sobre ellos.
Idea del método AC Dada una matriz F de frecuencias relativas representar conjuntamente en un mismo gráfico las filas y las columnas con la mínima pérdida de información Procedimiento: Comencemos con las filas ¿Cómo representarlas? • Primer Problema: Si no estandarizamos por el total, dos filas con la misma estructura pueden parecer muy distintas
Llamemos Df a la matriz diagonal que tiene las frecuencias relativas de las filas en la diagonal principal • Igualmente Dc será la matriz diagonal de las frecuencias de las columnas
Podemos estandarizar las filas dividiendo cada una por su frecuencia relativa, obteniendo la matriz Segundo Problema: Con datos cualitativos la distancia razonable entre dos filas es la ji cuadrado, no la distancia euclídea