840 likes | 1.24k Views
MÉTODOS QUANTITATIVOS EM CIÊNCIAS SOCIAIS: ANÁLISE DE DADOS QUALITATIVOS. Ana Paula Vidal Bastos pbastos@ufpa.br. Indicadores e sua Construção. Indicadores são medidas compostas de variáveis, ou seja, medições baseadas em mais de um dado.
E N D
MÉTODOS QUANTITATIVOS EM CIÊNCIAS SOCIAIS:ANÁLISE DE DADOS QUALITATIVOS Ana Paula Vidal Bastos pbastos@ufpa.br
Indicadores e sua Construção • Indicadores são medidas compostas de variáveis, ou seja, medições baseadas em mais de um dado. • Um índice é construído através do somatório de resultados de atributos individuais. Métodos Quantitativos: análise da dados qualitativos
Indicadores e sua Construção • De acordo com Babbie (1989) existem etapas específicas na construção de indicadores: • seleção dos itens, avaliação de suas relações empíricas, combinação dos itens no indicador, e a validação do indicador. Métodos Quantitativos: análise da dados qualitativos
Seleção dos itens • Um indicador composto é sempre criado para medir uma variável. • O primeiro critério na seleção dos itens é a validade lógica do item. • Se quisermos avaliar a degradação ambiental devemos escolher itens que, pelo menos aparentemente, estejam medindo esta variável. • É importante observar as características específicas das dimensões que se pretende mensurar. • 2. Relações binárias entre itens: Uma vez determinada a validade lógica do item • sendo considerado para inclusão no indicador, deve-se fazer uma análise das • relações binárias entre os itens para se determinar o tipo e a força da relação • empírica os pares de itens têm entre si. Podem-se utilizar tabelas de percentagem, • ou coeficientes de correlações, ou ambos para conduzir esta análise. Pares com • relações muito fracas dificilmente estarão medindo a mesma dimensão da variável, • e devem ser eliminados. Relações demasiadamente fortes indicam que ambos os • itens estão medindo a mesma dimensão da mesma maneira. Neste caso um dos • itens deve ser eliminado do indicador. • 3. Análise multivariada: O objetivo principal da construção de um indicador é • desenvolver um método de classificar o sujeito da pesquisa de acordo com alguma • variável, como nível de degradação ambiental de uma localidade. Os sujeitos da • pesquisa são a localidade e a degradação ambiental como variáveis de interesse. • O indicador deverá ser capaz de demonstrar diferentes níveis de degradação • ambiental quando usado em diferentes localidades. Para que isto aconteça cada • item que constitui o indicador deve contribuir para a avaliação de cada sujeito de • pesquisa. Por esta razão dois itens perfeitamente correlacionados não devem fazer • parte do mesmo indicador. Se um dos itens já foi incluído a adição do outro não • contribuiria em nada para a avaliação dos sujeitos da pesquisa. Recomenda-se a • 5 • utilização de tabelas multivariadas complexas para conduzir a análise das relações • entre todos os itens do indicador. • 4. Pontuação do indicador: Uma vez escolhidos os itens que irão compor o indicador é • necessário fazer duas decisões importantes. A primeira decisão irá determinar o • intervalo de variação do indicador e o número de casos em cada ponto do índice. • Quanto maior o intervalo entre os dois extremos, menor o número de casos em cada • extremo. Sendo assim deve-se considerar o nível de graduação exigido pelo estudo • para determinar o número de intervalos na escala do indicador. A segunda decisão • importante a ser tomada é quanto cada item do indicador vai contribuir para o valor • final. Na verdade deve-se decidir se cada item terá o mesmo valor ou se haverá um • sistema de pesos para cada item. Utilizam-se sempre valores iguais para cada item, a • menos que existam razões fortes para dar pesos diferentes aos itens. • Estes passos simples na construção de indicadores compostos podem ser vistos em • mais detalhes em Babbie (1989) e ajudam a orientar e padronizar a elaboração de indicadores • sociais. A melhor compreensão das etapas na elaboração de indicadores compostos também • auxilia na avaliação e utilização destes indicadores. • A próxima seção deste artigo investigará três dos principais indicadores de sustentabilidade • desenvolvidos recentemente. A análise buscou não só descrever estes indicadores, como • também identificar seus principais elementos constitutivos e suas principais características. • Desenvolvimento Sustentável: Principais Ferramentas de Avaliação • Existem várias ferramentas desenvolvidas especificamente para avaliar a • sustentabilidade do desenvolvimento, mas muito pouco se sabe sobre as características • teóricas e práticas destas ferramentas. Com o intuito de aprofundar a discussão sobre o • desenvolvimento sustentável três destas ferramentas foram identificadas como sendo as mais • relevantes no contexto internacional atual (VAN BELLEN, 2005). Através da técnica Delphi de • investigação Van Bellen (2005) identificou o "Ecological Footprint", o "Dashboard of • Sustainability", e o "Barometer of Sustainability" como sendo os principais indicadores • internacionais de sustentabilidade. A técnica Delphi, utilizada na pesquisa, representa uma • consulta a um painel de especialistas em um assunto específico, e busca encontrar um • consenso entre estes especialistas participantes. Métodos Quantitativos: análise da dados qualitativos
Por exemplo, existem vários tipos diferentes de degradação ambiental (poluição do ar, derrubada de vegetação nativa, extinção de espécies). • Se o indicador pretende medir aspectos específicos da degradação ambiental deve-se selecionar itens que mensurem estes aspectos específicos. • Por outro lado, se a intenção do indicador medir a degradação ambiental de maneira mais ampla, o indicador pode se utilizar de um índice menos específico que represente a variável degradação ambiental. Métodos Quantitativos: análise da dados qualitativos
Seleção dos itens • A natureza dos itens irá determinar a especificidade ou não do indicador. Métodos Quantitativos: análise da dados qualitativos
Relações binárias entre itens • Uma vez determinada a validade lógica do item sendo considerado para inclusão no indicador, deve-se fazer uma análise das relações binárias entre os itens para se determinar o tipo e a força da relação empírica os pares de itens têm entre si. • Podem-se utilizar tabelas de percentagem, ou coeficientes de correlações, ou ambos para conduzir esta análise. Métodos Quantitativos: análise da dados qualitativos
Relações binárias entre itens • Pares com relações muito fracas dificilmente estarão medindo a mesma dimensão da variável, e devem ser eliminados. • Relações demasiadamente fortes indicam que ambos os itens estão medindo a mesma dimensão da mesma maneira. • Neste caso um dos itens deve ser eliminado do indicador. Métodos Quantitativos: análise da dados qualitativos
Análise multivariada • O objetivo principal da construção de um indicador é desenvolver um método de classificar o sujeito da pesquisa de acordo com alguma variável, como nível de degradação ambiental de uma localidade. • Os sujeitos da pesquisa são a localidade e a degradação ambiental como variáveis de interesse. • O indicador deverá ser capaz de demonstrar diferentes níveis de degradação ambiental quando usado em diferentes localidades. Métodos Quantitativos: análise da dados qualitativos
Análise multivariada • Para que isto aconteça cada item que constitui o indicador deve contribuir para a avaliação de cada sujeito de pesquisa. • Por esta razão dois itens perfeitamente correlacionados não devem fazer parte do mesmo indicador. • Se um dos itens já foi incluído a adição do outro não contribuiria em nada para a avaliação dos sujeitos da pesquisa. • Recomenda-se a utilização de tabelas multivariadas complexas para conduzir a análise das relações entre todos os itens do indicador. • 4. Pontuação do indicador: Uma vez escolhidos os itens que irão compor o indicador é • necessário fazer duas decisões importantes. A primeira decisão irá determinar o • intervalo de variação do indicador e o número de casos em cada ponto do índice. • Quanto maior o intervalo entre os dois extremos, menor o número de casos em cada • extremo. Sendo assim deve-se considerar o nível de graduação exigido pelo estudo • para determinar o número de intervalos na escala do indicador. A segunda decisão • importante a ser tomada é quanto cada item do indicador vai contribuir para o valor • final. Na verdade deve-se decidir se cada item terá o mesmo valor ou se haverá um • sistema de pesos para cada item. Utilizam-se sempre valores iguais para cada item, a • menos que existam razões fortes para dar pesos diferentes aos itens. • Estes passos simples na construção de indicadores compostos podem ser vistos em • mais detalhes em Babbie (1989) e ajudam a orientar e padronizar a elaboração de indicadores • sociais. A melhor compreensão das etapas na elaboração de indicadores compostos também • auxilia na avaliação e utilização destes indicadores. • A próxima seção deste artigo investigará três dos principais indicadores de sustentabilidade • desenvolvidos recentemente. A análise buscou não só descrever estes indicadores, como • também identificar seus principais elementos constitutivos e suas principais características. • Desenvolvimento Sustentável: Principais Ferramentas de Avaliação • Existem várias ferramentas desenvolvidas especificamente para avaliar a • sustentabilidade do desenvolvimento, mas muito pouco se sabe sobre as características • teóricas e práticas destas ferramentas. Com o intuito de aprofundar a discussão sobre o • desenvolvimento sustentável três destas ferramentas foram identificadas como sendo as mais • relevantes no contexto internacional atual (VAN BELLEN, 2005). Através da técnica Delphi de • investigação Van Bellen (2005) identificou o "Ecological Footprint", o "Dashboard of • Sustainability", e o "Barometer of Sustainability" como sendo os principais indicadores • internacionais de sustentabilidade. A técnica Delphi, utilizada na pesquisa, representa uma • consulta a um painel de especialistas em um assunto específico, e busca encontrar um • consenso entre estes especialistas participantes. Métodos Quantitativos: análise da dados qualitativos
Pontuação do indicador • Uma vez escolhidos os itens que irão compor o indicador é necessário fazer duas decisões importantes. • A primeira decisão irá determinar o intervalo de variação do indicador e o número de casos em cada ponto do índice. • Quanto maior o intervalo entre os dois extremos, menor o número de casos em cada extremo. • Sendo assim deve-se considerar o nível de graduação exigido pelo estudo para determinar o número de intervalos na escala do indicador. A segunda decisão • importante a ser tomada é quanto cada item do indicador vai contribuir para o valor • final. Na verdade deve-se decidir se cada item terá o mesmo valor ou se haverá um • sistema de pesos para cada item. Utilizam-se sempre valores iguais para cada item, a • menos que existam razões fortes para dar pesos diferentes aos itens. • Estes passos simples na construção de indicadores compostos podem ser vistos em • mais detalhes em Babbie (1989) e ajudam a orientar e padronizar a elaboração de indicadores • sociais. A melhor compreensão das etapas na elaboração de indicadores compostos também • auxilia na avaliação e utilização destes indicadores. • A próxima seção deste artigo investigará três dos principais indicadores de sustentabilidade • desenvolvidos recentemente. A análise buscou não só descrever estes indicadores, como • também identificar seus principais elementos constitutivos e suas principais características. • Desenvolvimento Sustentável: Principais Ferramentas de Avaliação • Existem várias ferramentas desenvolvidas especificamente para avaliar a • sustentabilidade do desenvolvimento, mas muito pouco se sabe sobre as características • teóricas e práticas destas ferramentas. Com o intuito de aprofundar a discussão sobre o • desenvolvimento sustentável três destas ferramentas foram identificadas como sendo as mais • relevantes no contexto internacional atual (VAN BELLEN, 2005). Através da técnica Delphi de • investigação Van Bellen (2005) identificou o "Ecological Footprint", o "Dashboard of • Sustainability", e o "Barometer of Sustainability" como sendo os principais indicadores • internacionais de sustentabilidade. A técnica Delphi, utilizada na pesquisa, representa uma • consulta a um painel de especialistas em um assunto específico, e busca encontrar um • consenso entre estes especialistas participantes. Métodos Quantitativos: análise da dados qualitativos
Pontuação do indicador • A segunda decisão importante a ser tomada é quanto cada item do indicador vai contribuir para o valor final. • Deve-se decidir se cada item terá o mesmo valor ou se haverá um sistema de pesos para cada item. • Utilizam-se sempre valores iguais para cada item, a menos que existam razões fortes para dar pesos diferentes aos itens. • Babbie (1989) • . Métodos Quantitativos: análise da dados qualitativos
Pontuação do indicador • A melhor compreensão das etapas na elaboração de indicadores compostos também auxilia na avaliação e utilização destes indicadores. Métodos Quantitativos: análise da dados qualitativos
Desenvolvimento Sustentável: Principais Ferramentas de Avaliação • Existem várias ferramentas desenvolvidas especificamente para avaliar a sustentabilidade do desenvolvimento, mas muito pouco se sabe sobre as características teóricas e práticas destas ferramentas. Métodos Quantitativos: análise da dados qualitativos
ANÁLISE MULTIVARIADA • Análise de variância multivariada • Componentes Principais • Análise de Agrupamento • Análise de Fatores • Análise de Correlação Canônica
ANÁLISE MULTIVARIADA • Análise de variância multivariada • Componentes Principais • Análise de Agrupamento • Análise de Fatores • Análise de Correlação Canônica
ANÁLISE MULTIVARIADA • Os objetivos gerais, para os quais a análise multivariada conduz são: • a. redução de dados ou simplificação estrutural: o fenômeno sob estudo é representado da maneira mais simples possível, sem sacrificar informações valiosas e tornando as interpretações mais simples; • b. ordenação e agrupamento: agrupamento de objetos (tratamentos) ou variáveis similares, baseados em dados amostrais ou experimentais;
c. investigação da dependência entre variáveis: estudos das relações estruturais entre variáveis muitas vezes é de interesse do pesquisador; • d. predição: relações entre variáveis devem ser determinadas para o propósito de predição de uma ou mais variável com base na observação de outras variáveis; • e. construção e teste de hipóteses Métodos Quantitativos: análise da dados qualitativos
As técnicas estatísticas constituem se uma parte integral da pesquisa científica e em particular as técnicas multivariadas tem sido regularmente aplicada em várias investigações científicas nas áreas de biologia, física, sociologia e ciências médicas.
A utilização de gráficos e arranjos tabulares são importantes auxiliares nas análises de dados. • Por outro lado, números que resumem, ou seja, que descrevem quantitativamente certas características, são essenciais para a interpretação de os dados amostrais ou experimentais.
As medidas são tomadas em cada unidade da amostra ou do experimento. A representação destes dados é feita com a notação xjk para indicar um valor particular da j-ésima unidade amostral ou experimental e da k-ésima variável mensurada.
Matriz de dados • Considere a situação em que observamos ‘p’ características de ‘n’ indivíduos de uma população π. As características observadas são representadas pelas variáveis x1, x2, x3, ..., xp. A matriz de dados é de ordem ‘n x p’ e normalmente denominada de matriz ‘X’. Métodos Quantitativos: análise da dados qualitativos
exemplo • 4 firmas de ração queremos avaliar a venda de rações. • Cada observação bivariada forneceu a quantidade de sacos de ração vendidos e a quantidade de reais de cada venda. • Os dados são: • Variável 1 (Reais/venda) 80, 120, 90, 110 • Variável 2 (número de sacos de ração vendidos)10; 12; 6; 8
Usando a notação proposta anteriormente, tem-se: X11=80; X21=120; X31=90; X41=110; X12=10; X22=12; X32=6; X42=8
As características são observadas em unidades de medidas diferentes entre si, e neste caso, é conveniente padronizar as variáveis Xj (i=1, 2, 3, ..., p). A padronização pode ser feita com média zero e variância 1, ou com variância 1 e média qualquer. Métodos Quantitativos: análise da dados qualitativos
Matriz de covariância S • A partir da matriz X de dados de ordem ‘n x p’ podemos fazer uma estimativa da matriz de covariância Σ da população π que representaremos por S. A matriz S é simétrica e de ordem ‘p x p’. Métodos Quantitativos: análise da dados qualitativos
Medidas de associação e correlação • Covariância
Padronização com média zero e variância 1 (curva normal) A padronização dos valores é muito importante em estatística é o que nos permite avaliar o quanto dos nossos dados amostrais podem ser inferidos para os valores da população. Métodos Quantitativos: análise da dados qualitativos
Padronização com variância 1e média qualquer • em que, e são, respectivamente, a estimativa da média e o desvio padrão da característica j: Métodos Quantitativos: análise da dados qualitativos
Matriz de valores padronizados Métodos Quantitativos: análise da dados qualitativos
A maioria das técnicas multivariadas é baseada no simples conceito de distância, por mais formidável que isso possa parecer. • A princípio, será considerada a construção de uma distância entre um ponto P, com p coordenadas, da origem. O argumento que pode ser usado refere-se ao fato de que as coordenadas de P podem variar no espaço produzindo diferentes posições para os pontos.
Para ilustrar, suponha que se tenha n pares de medidas em duas variáveis (x1 e x2) e que as medidas de x1 variam independentemente das mensurações em x2. • O significado de independente neste ponto pode ser dado pelo fato de que os valores de x1 não podem ser preditos com nenhuma acurácia a partir dos valores de x2 e vice-versa. • Em adição, é assumido que as observações de x1 possuem maior variabilidade que as de x2.
Análise de variância multivariada • A análise de variância multivariada (MANAVA) é usada para investigar se os vetores de médias de tratamento são os mesmos, e se não, qual componente de média difere significativamente. • Fazemos o teste de hipóteses da significância de diferenças de médias, para avaliar se existe ou não diferença nos tratamentos.
Análise de componentes principais • A análise de componentes principais está relacionada com a explicação da estrutura de covariância por meio de poucas combinações lineares das variáveis originais em estudo. • Os objetivos dessa análise são: i) redução da dimensão original; e ii) facilitação da interpretação das análises realizadas.
Em geral, a explicação de toda a variabilidade do sistema determinado por p variáveis só pode ser efetuada por p componentes principais. • No entanto, uma grande parte dessa variabilidade pode ser explicada por um número r menor de componentes, r≤p. • Os componentes principais são uma técnica de análise intermediária e, portanto não se constituem em um método final e conclusivo.
A análise de componentes principais é uma técnica de análise multivariada que consiste em transformar um conjunto de variáveis em outro conjunto, os componentes principais, de mesma dimensão, porém com propriedades importantes: cada componente principal é uma combinação linear de todas as variáveis originais, são independentes entre si e estimados com o propósito de reter, em ordem de estimação, o máximo de informação, em termos da variação total contida nos dados. Métodos Quantitativos: análise da dados qualitativos
A análise de componentes principais é associada à idéia de redução de massa de dados, com menor perda possível da informação. • Procura-se redistribuir a variação observada nos eixos originais de forma a se obter um conjunto de eixos ortogonais não correlacionados. • Esta técnica também pode ser utilizada para o agrupamento de indivíduos similares, mediante exame visual em gráficos de dispersão no espaço bi ou tridimensional. Métodos Quantitativos: análise da dados qualitativos
A análise agrupa os indivíduos de acordo com sua variação, isto é, os indivíduos são agrupados segundo suas variâncias, ou seja, segundo seu comportamento dentro da população, representado pela variação do conjunto de características que define o indivíduo, ou seja, a técnica agrupa os indivíduos de uma população segundo a variação de suas características. Métodos Quantitativos: análise da dados qualitativos
Podemos decidir quantos componente vamos usar na análise, isto é, quantos componentes serão utilizados para diferenciar os indivíduos. • Não existe um modelo estatístico que ajude nesta decisão. Segundo REGAZZI (2000) para aplicações em diversas áreas do conhecimento o número de componentes utilizados tem sido aquele que acumula 70% ou mais de proporção da variância total. Métodos Quantitativos: análise da dados qualitativos
A matriz Z das variáveis padronizadas zj é igual a matriz de correlação da matriz de dados X. • Para determinar os componentes principais normalmente partimos da matriz de correlação R. • A recomendação é que a padronização só dever ser feita quando as unidades de medidas das características observadas não forem as mesmas. Métodos Quantitativos: análise da dados qualitativos
Os componentes principais apresentam as seguintes propriedades: • 1) A variância do componente principal Yi é igual ao valor do autovalor λi. • 2) O primeiro componente é o que apresenta maior variância e assim por diante • 3) O total de variância das variáveis originais é igual ao somatório dos autovalores que é igual ao total de variância dos componentes principais • 4) Os componentes principais não são correlacionados entre si Métodos Quantitativos: análise da dados qualitativos
Exemplo de aplicação No quadro estão os valores originais observados (X1 e X2) e padronizados (Z1 e Z2) de duas variáveis para cinco tratamentos (n=5). Métodos Quantitativos: análise da dados qualitativos
Análise de agrupamentos • As análises rudimentares e exploratórias de dados como os procedimentos gráficos auxiliam, em geral, o entendimento da complexa natureza da análise multivariada. • No entanto existem outras técnicas gráficas para agrupar objetos (itens ou variáveis) e também apresentar os algoritmos que devem ser usados para efetivamente realizá-los. • Encontrar nos dados uma estrutura natural de agrupamento é uma importante técnica exploratória.
A análise de agrupamento deve ser distinguida da análise discriminante, pelo fato desta última ser aplicada a um número de grupos já conhecidos, tendo por objetivo a discriminação de um novo indivíduo a um destes grupos. • A análise de agrupamento por sua vez não considera o número de grupos e é realizada com base na similaridade ou dissimilaridade (distâncias).
Objetivo dessa análise é agrupar objetos semelhantes segundo suas características (variáveis). • Todavia, não existem impedimentos para realizar o agrupamento de variáveis semelhantes segundo as realizações obtidas pelos objetos amostrados.
Um outro problema para o qual uma resposta é necessária consiste em verificar se um indivíduo A é mais parecido com B do que com C. • Quando o número de variáveis envolvidas é pequeno, a inspeção visual poderá responder.
Para fazer tal inferência usou-se o conceito de distância euclidiana, o qual definiu a idéia de parecença. • Especificar um coeficiente de parecença que indique a proximidade entre os indivíduos. • É importante considerar, em todos os casos semelhantes a este, a natureza da variável (discreta, contínua, binária) e a escala de medida (nominal, ordinal, real ou razão).
Análise fatorial • Análise de fatores pretende descrever, se possível, as relações de covariância entre diversas variáveis em função de poucas, não observáveis, quantidades aleatórias denominadas de fatores. • Sob o modelo de fatores cada variável resposta é representada por uma função linear de uma pequena quantidade de fatores • comuns, não observáveis, e de uma simples variável latente específica.
Os fatores comuns geram as covariâncias entre as variáveis observadas e os termos específicos contribuem somente para as variâncias de suas respostas relacionadas. • Os coeficientes dos fatores comuns não são restritos a condição de ortogonalidade, o que confere generalidade, apesar de se exigir normalidade dos dados e a determinação, a priori, do número de fatores.
Exemplo de aplicação: POLARIZAÇÃO Iij indica o grau de interação entre o centro i e o centro j; Ai, Aj são a dimensão dos aglomerados (população) dos centros i e j; dbij é a medida da distância entre i e j; G é a constante semelhante à constante gravitacional numérica; b é um parâmetro exponencial.