300 likes | 499 Views
LES0407 Estatística Aplicada II. Prof. Dr. Vitor Ozaki. Variáveis. São características observáveis em cada elemento pesquisado: medidas, controladas ou manipuladas em uma pesquisa; Cada variável, para cada elemento pesquisado pode assumir APENAS UM valor em determinado momento;
E N D
LES0407 Estatística Aplicada II Prof. Dr. Vitor Ozaki
Variáveis • São características observáveis em cada elemento pesquisado: medidas, controladas ou manipuladas em uma pesquisa; • Cada variável, para cada elemento pesquisado pode assumir APENAS UM valor em determinado momento; • A escolha da variável (ou variáveis) de interesse - objetivos do estudo estatístico em questão;
Variáveis • As variáveis podem ser qualitativas ou quantitativas. • As variáveis qualitativas são aquelas para as quais uma medição numérica não é possível e, subdividem-se em ordinais ou nominais. Exemplos: • Ex: ordinal: escolaridade; classe social; • Ex: nominal: sexo, município de procedência;
Variáveis • As variáveis quantitativas são aquelas que podem ser mensuradas numa escala de valores e, subdividem-se em discretas e contínuas; • As discretas são definidas em um conjunto enumerável, sendo próprias de dados de contagem.
Variáveis • As contínuas por sua vez, podem assumir qualquer valor real entre dois extremos (processo de medição). Exemplos: • População: municípios em um estado. • Variável: renda per capita. • População: propriedades agrícolas do Brasil. • Variável: produção de soja.
Análise Exploratória de Dados • Considere o exemplo da tabela no site http://www.economia.esalq.usp.br/~vitor/Material_R-excel/questionario.xlsx • As variáveissão: • Sexo masc(M)/femin(F) • Idade anos • Altura metros • Peso kg • Fuma sim(S)/não(N) • Beb. Alc. Qtos dias na semana • Onde estudou no ens. médio pública(PU)/privada(PR) • Após se formar na Esalq mercado(M)/pós-graduação(P)? • Horas diárias que se dedica ao estudo extra-classe • Horas diárias que se dedica ao estágio • Horas diárias que dedica a algum esporte • Média geral na esalq • Nota em estatistica I • Moradia sozinho(S) repúbl.(R) pais(P) • Meio de locomoção a pé(P) bicicl.(B) motoc.(M) automóv.(A)
Análise Exploratória de Dados • A tabela de dados brutos pode não ser prática para responder questões de interesse; • P.ex: Qualfoi a nota emestatística I? • Solução: elaborar umatabela de frequência absoluta para cada variável;
Análise Exploratória de Dados • Procedimento: listar os possíveis valores da variável e fazer a contagem do número de suasocorrências; • Sejani a frequência do valor i e n a frequência total; • Para fins de comparaçãocomoutroconjunto de dados calcular a frequência relativa;
Análise Exploratória de Dados • A frequência relativa é dada por: fi = ni / n • Calcular a tabela de frequência para a variávelSexo;
Análise Exploratória de Dados Tabela de frequenciapara a variável sexo
Análise Exploratória de Dados • Para variáveiscujos valores possuemordenação natural (qualit. ordinais e quantit. emgeral) é interessante incluir umacolunacom a frequência acumulada (fac); • Até umcerto valor é a soma das frequências de todas os valores da variável, menores ouiguaisao valor considerado; • Útil para estabelecer pontos de corte;
Análise Exploratória de Dados Tabela de frequenciapara a variável Idade
Análise Exploratória de Dados • Para variáveisquantitativascontínuas, teoricamente, podem ser qualquer número real emumcerto intervalo; • Para a variável Peso, os valores variam de 46,0 a 87,0 kg; • Nesse caso é interessante agrupar os dados emclassesoufaixas de valores e contar o número de ocorrênciasem cada faixa;
Análise Exploratória de Dados • Para a variável Peso usaremos a faixa de amplitude 9.9, iniciando em 40 kg; • Teremosentão as seguintesfaixas: • 40 – 49,9 kg; • 50 – 59,9 kg; • 60 – 69,9 kg; • 70 – 79,9 kg; • 80 – 89,9 kg;
Análise Exploratória de Dados Tabela de frequência para a variável Peso
Análise Exploratória de Dados Tabela de frequência para a variável Peso
Análise Exploratória de Dados • Até agora vimos que podemos representar os dados e as informações de interessena forma de tabelas; • Outra forma de representação é por meio de gráficos;
Análise Exploratória de Dados • Veremos três tipos de gráficos: disco ou pizza, barras e histograma; • O gráfico de disco pode ser usado comvariáveisqualitativas, p.ex. a variávelFumante. • Cada fatia do disco corresponde àspercentagens de cada valor, multiplicando-se por 100 a frequência relativa fi;
Análise Exploratória de Dados • Gráfico de pizza da variávelFumante.
Análise Exploratória de Dados • Já o gráfico de barras utiliza o plano cartesiano com os valores da variável no eixo das abscissas e as frequênciasouporcentagens no eixo das ordenadas; • Esse tipo de gráfico se ajusta melhor as variáveis discretas ouqualitativasordinais; • Veja o ex. com a variávelbebida;
Análise Exploratória de Dados • Gráfico de barras da variávelbebida. alunos Numdias que consome bebida
Análise Exploratória de Dados • Gráfico de barras da variávelbebida. alunos Numdias que consome bebida
Análise Exploratória de Dados • Gráfico de barras da variávelbebida. alunos Numdias que consome bebida
Análise Exploratória de Dados • O histograma é outro gráfico que resume as informações da tabela; • O histograma é um gráfico composto por retângulos justapostos em que a base de cada um deles corresponde ao intervalo de classe e a sua altura à respectiva freqüência; • O histograma para a variável Peso é descrita a seguir:
Análise Exploratória de Dados • Histograma da variável Peso.
Análise Exploratória de Dados • Muito cuidado com as proporções dos gráficos! • Um gráfico desproporcional pode dar a falsa impressão de desempenho e conduzir a conclusões equivocadas; • Veja os gráficos seguintesem que apenas os limites do eixo vertical foi alterado:
Análise Exploratória de Dados http://blog.brasilacademico.com/2014/04/graficos-que-mentem-manipulando.html
Por fim… • Para a próxima aula estudar os capítulos: • 3, Bussab e Morettin (BM); • 4, Magalhães e Lima (ML);