270 likes | 307 Views
Métodos Quantitativos. Eduardo Pontual Ribeiro PPGE - UFRGS Treinamento Exclusivo BRDE - 19 a 22 de agosto de 2002 -. TIPOS DE DADOS E INDICADORES. Fontes, disponibilidade e confiabilidade dos dados disponíveis. Dados em cross-section, séries de tempo e longitudinais. Escalas de medida.
E N D
Métodos Quantitativos Eduardo Pontual Ribeiro PPGE - UFRGS Treinamento Exclusivo BRDE - 19 a 22 de agosto de 2002 -
TIPOS DE DADOS E INDICADORES • Fontes, disponibilidade e confiabilidade dos dados disponíveis. • Dados em cross-section, séries de tempo e longitudinais. • Escalas de medida.
Variáveis Quantitativas: Implicam em relações de mensuração, medida, contagem. Exemplos: salário, idade, preço, produção, escolaridade (número de anos na escola). Variáveis Qualitativas: Expressam atributos, qualidades do indivíduo pesquisado. Exemplos: estado civil, profissão, escolaridade (fundamental, médio ou superior). CLASSIFICAÇÃO DAS VARIÁVEIS
VARIÁVEIS QUALITATIVAS • Ordinal: é possível atribuir alguma ordem aos indivíduos depois de atribuída a característica. Exemplo: Escolaridade. • Nominal: não é possível fazer nenhuma classificação depois das realizações. Exemplo: Profissão.
VARIÁVEIS QUANTITATIVAS • Discreta: valores assumem um conjunto finito de valores possíveis. Exemplo: número de filhos. • Contínua: valores pertencem a um intervalo dos número Reais. Exemplo: rendimentos do trabalho.
DISTRIBUIÇÃO DE FREQÜÊNCIA Verificação do número de realizações do evento dentro da amostra e a sua importância dentro da população. • Para variáveis discretas: proporção em relação à característica. • Para variáveis contínuas: proporção em relação a intervalos.
Exemplo: Variáveis DiscretasNúmero de filhos de 2805 mulheres na RMPA FONTE: PNAD, MULHERES ENTRE 25-55 ANOS, RESIDENTES DA REGIÃO METROPOLITANA DE PORTO ALEGRE/RS
Exemplo: Variáveis ContínuasRendimentos (em R$) de 2805 mulheres na RMPA FONTE: PNAD, MULHERES ENTRE 25-55 ANOS, RESIDENTES DA REGIÃO METROPOLITANA DE PORTO ALEGRE/RS
GRÁFICOS • Gráficos para variáveis qualitativas • Histogramas • Evolução temporal
GRÁFICOS PARA VARIÁVEIS DISCRETASFreqüência Relativa de Número de Filhos FONTE: PNAD, MULHERES ENTRE 25-55 ANOS, RESIDENTES DA REGIÃO METROPOLITANA DE PORTO ALEGRE/RS
GRÁFICOS PARA VARIÁVEIS QUALITATIVASFreqüência Relativa de Número de Filhos
HISTOGRAMAS • Gráfico que relaciona a freqüência de realizações do evento na amostra com o tipo de evento. • Pode agrupar como rótulos os valores do evento (no caso de variáveis discretas) ou os intervalos onde os eventos se encontram (para variáveis contínuas)
Exemplo: Histograma - Escolaridade FONTE: PNAD, MULHERES ENTRE 25-55 ANOS, RESIDENTES DA REGIÃO METROPOLITANA DE PORTO ALEGRE/RS
CONSTRUÇÃO DE HISTOGRAMAS NO EXCEL • Selecione a função “Análise de Dados” no menu “Ferramentas”. • Na janela que aparece, selecione a opção “Histograma”. • Na janela que se abre, escolha como “Intervalo de Entrada” os dados de origem do histograma. • Cuidado para selecionar a opção “Rótulos”, caso o título da coluna de dados tenha sido selecionado. • Como “Intervalo de Saída”, escolha, de preferência, a opção “Nova Planilha”.
Na planilha nova que se criou, uma das colunas é denominada “Bloco” e a outra “Freqüência”. • O gráfico do histograma é gerado ao selecionar os dados da planilha nova criada e desenhar o gráfico de colunas. • O gráfico gerado desta forma é criado com intervalos eqüidistantes e o rótulo do eixo X se constitui na média do intervalo.
ANÁLISE BIDIMENSIONAL Considerações sobre duas variáveis em torno do mesmo objeto de análise
CONSIDERAÇÕES PRÉVIAS • Problema fundamental: como fazer a análise a partir de diferentes combinações de tipos de variáveis. Dada a classificação vista anteriormente, sabemos que, no caso do estudo com duas variáveis, três combinações são possíveis: • duas variáveis qualitativas; • duas variáveis quantitativas; • uma variável qualitativa e a outra quantitativa.
DISTRIBUIÇÕES CONJUNTAS - VARIÁVEIS “EMPREGADA” E “CHEFE DE FAMÍLIA” FONTE: PNAD, MULHERES ENTRE 25-55 ANOS, RESIDENTES DA REGIÃO METROPOLITANA DE PORTO ALEGRE/RS
FREQÜÊNCIA EM ANÁLISE BIDIMENSIONAL • Como calcular a freqüência em análise com duas variáveis? Qual o total utilizar? Da coluna? Da linha? Ou o total geral? • Resposta: depende da análise desejada. A divisão pelo total geral expressa a composição do grupo por ambas características. A divisão pelo total da linha ou da coluna expressa um resultado condicional à observação da linha ou coluna.
Exemplo: “Empregada” e “Chefe de Família” - Análise pelo Total Geral
Exemplo: “Empregada” e “Chefe de Família” - Análise pelo Total da Coluna
No exemplo da divisão pelo total geral da tabela de dados, temos que 46% da população total é formada por mulheres empregadas que não são chefes de família. • Por outro lado, no exemplo da divisão pelos totais das colunas, temos que entre a população empregada, 73,47% dos indivíduos não são chefes de família. • A diferença na análise está na condição imposta pela divisão do total da coluna: passa a avaliar entre o total de indivíduos empregados.
Outra informação importante que se pode extrair da divisão por colunas é que, independentemente do fato da pessoa estar empregada ou não, 21,32% da população é formada por mulheres chefes de família. • A distribuição entre emprego e ser chefe de família é um tanto diferente entre grupos, além das diferenças de tamanhos totais; desta forma, parece existir correlação entre as duas variáveis: o fato da mulher estar empregada parece ser um condicionante importante para que ela seja chefe de família.
Considerações sobre associação entre Variáveis Quantitativas • O procedimento de cálculo de freqüências entre tabelas pode ser feito normalmente no caso de variáveis quantitativas, desde que se atribuam intervalos que formem as categorias de análise - os chamados intervalos de classes. • Uma ferramenta importante na análise de variáveis quantitativas é o gráfico de dispersão.
Exemplo: Renda da família e percentual de gastos com alimentação.
COEFICIENTE DE CORRELAÇÃO • O coeficiente de correlação busca auferir a direção da relação entre as variáveis, dentro de um intervalo determinado entre -1 e 1. • O objetivo do intervalo é discriminar a direção e a intensidade da relação: valores próximos de zero indicam ausência de relação entre as variáveis; valores próximos de 1 indicam forte relação positiva; valores próximos de -1 indicam forte relação negativa.
Fórmula do coeficiente de correlação: corr(X,Y) = (1/n)[(xi-x)/x][(yi-y)/y] , onde: x média de X y média de Y x desvio padrão de X y desvio padrão de Y