460 likes | 833 Views
Análise Fatorial. Factor analysis. Análise Fatorial. Objetivo: Estudar a estrutura de dependência existente em um conjunto de variáveis através da criação de fatores que, eventualmente, expressam constructos subjacentes aos dados. Spearman (1904) - medida de inteligência. Análise Fatorial.
E N D
Análise Fatorial Factor analysis
Análise Fatorial Objetivo: Estudar a estrutura de dependência existente em um conjunto de variáveis através da criação de fatores que, eventualmente, expressam constructos subjacentes aos dados. Spearman (1904) - medida de inteligência
Análise Fatorial Situação comum: observar grande número de variáveis • Como caracterizar a amostra • Como descrever a inter-relação entre as variáveis
Constructos Definir o que e como medir • nível de ansiedade • satisfação • bem-estar • percepção
Modelo de Análise Fatorial Variáveis originais X1 X2 Xp Fatores comuns 1 2 m AF m < p
Modelo de Análise Fatorial 1, …, m: fatores comuns 1, …, p: fatores únicos ou específicos
Modelo de Análise Fatorial Modelo na forma matricial: X - = + X = (X1, X2, …, Xp)T, = (1, 2, …, m)T, = (1, 2, …, p)T
Modelo esquematizado e1 X1 1 e2 X2 2 m ep Xp
Características impostas ao modelo • Os fatores únicos são não correlacionados. • Os fatores comuns e únicos são não correlacionados entre si. • Os fatores comuns são não correlacionados (esta suposição pode ser abandonada em alguns tipos de AF). • As variâncias dos fatores comuns são iguais a 1.
Análise do modelo Ci2 = comunalidade ou variância comum i = especificidade
Análise do modelo Ci2 = comunalidade ou variância comum: expressa o quanto da variabiliade de Xi é explicada pelo modelo (se Var (Xi)=1 pode ser encarada como uma proporção) i = especificidade: expressa o quanto da variabilidade de Xi não é explicada pelo modelo. Um bom modelo deve apresentar uma comunalidade alta para todas as variáveis
Alguns métodos de estimação • Máxima verossimilhança: supõe que os dados seguem uma distribuição normal multivariada. • Método da componente principal: baseia-se na análise de componentes principais.
Método da componente principal Modelo: X = + e Decomposição espectral de : ~ ~ ~ ~ ~ ~ ~ ~ ~
Métododamáximaverossimilhança Suposição:distribuição normal Estimação dos parâmetros = T+ Restrição: T-1: diagonal
Resultado importante = T+ = T T + = (T)(T)T + = T TT T+ = T+ =
Rotação VARIMAX Há infinitas matrizes que resultam na mesma matriz T. Essas matrizes podem ser obtidas através da rotação de uma solução inicial (por exemplo, oriunda do método das componentes principais). Problema: Como escolher uma boa solução?
Rotação - Interpretação geométrica 2 Exemplo: Solução com dois fatores 1e 2definem um plano 1* e 2* , obtidos através de uma rotação ortogonal dos eixos, definem o mesmo plano. Logo representam uma solução equivalente. 2* 1* 1
Quantos fatores usar? • Critério de Kaiser • Porcentagem da variância total explicada • Atingir comunalidade fixada • Critério scree-test • Métodos inferenciais
Autovalores Componentes
Rotação 2 1
Interpretação • Fator 1: Satisfação pessoal • Fator 2: Dificuldade em lidar com problemas
EscoresFatoriais • Métodos dos mínimosquadradosponderados xi - = i+ i Minimizar: (xi - - i)T-1 (xi - - i) EMQ(fi) = (T-1)-1T-1 (xi - )
Escores Fatoriais • Métodosdaregressão e : distribuição normal ER(i) = T (T + )-1 (xi - )
Viabilidade da AFmatriz anti-imagem Coeficiente de correlação parcial entre os pares, excluindo-se o efeito das demais variáveis. Esperam-se valores baixos.
Viabilidade da AF Coeficiente KMO: Kaiser-Meyer-Olkin a2ij é a correlação parcial entre Xi e Xj, eliminado o efeito das demais variáveis
Viabilidade da AF MSA: Measure of sampling adequacy a2ij é a correlação parcial entre Xi e Xj, eliminado o efeito das demais variáveis
Interpretação da MSA Para o exemplo IDATE
Avaliação do ajuste do modelo resumo: raiz do quadrado médio residual
1 1 X1 X1 10 10 X10 X10 1 1 13 13 X13 X13 16 16 X16 X16 9 9 X9 X9 11 11 X11 X11 2 2 17 17 X17 X17 18 18 X18 X18
Comentários Sucesso • Número pequeno de fatores • fatores interpretáveis Insucesso • Tamanho insuficiente da amostra • variáveis com fraca dependência • estrutura não homogênea (grupos)