440 likes | 534 Views
ME203 – Estatística Elementar Introdução. Prof. Laura Segundo Semestre 2008. Objetivos da Estatística. Através dos métodos estatísticos, obter um melhor conhecimento sobre o mundo físico, biológico e social. Os principais passos são: coleta dos dados interpretação das informações obtidas
E N D
ME203 – Estatística ElementarIntrodução Prof. Laura Segundo Semestre 2008
Objetivos da Estatística Através dos métodos estatísticos, obter um melhor conhecimento sobre o mundo físico, biológico e social. Os principais passos são: • coleta dos dados • interpretação das informações obtidas • tomada de decisões, formulação de previsões e/ou diagnósticos
Planejamento de experimentos Definir formas de coleta de dados (amostragem) válidas e eficientes que: • minimizem a possibilidade de que os dados apresentem uma visão distorcida da realidade, • minimizem tempo e recursos utilizados Realização de amostragens: escolha dos indivíduos, shopping center, eleições
Estatística descritiva Interpretação dos dados coletados, mediante • apresentação dos dados: gráficos, tabelas • resumo dos dados: medidas-resumo de posição, de dispersão Uma apresentação e um resumo bem feitos podem entregar muita informação sobre as variáveis em estudo. tipo de dados tipos de gráficos relações entre as variáveis
Inferência estatística Tem como objetivo definir ferramentas formais que permitam testar teorias/hipóteses com ajuda dos dados coletados para fins de • previsões • tomada de decisões • diagnósticos inferência clássica ou freqüentista inferência bayesiana
Probabilidade Construção de modelos matemáticos que permitam incorporar a aleatoriedade existente, ou proveniente de nossa falta de informação, no mundo real: • fumantes – doenças respiratórias – progressão • mecânica de Newton – micropartículas em meio líquido – movimento Browniano
Questões que a estatística estuda: • Como planejar um experimento para medir o efeito de um novo medicamento. • Como são medidas as taxas de inflação e desemprego, e como elas estão relacionadas entre si? • Prever se haverá segundo turno nas eleições para governador de SP. • Determinar a chance de um time específico ser rebaixado para a 3ª divisão.
Experimento realizado para a testar a efetividade da vacina Salk, Estados Unidos, 1953 experimento controlado, homogeneização da amostra, caso-controle
Estudo observacional sobre a relação entre pílula anticoncepcional e doenças trombo-embólicas Casos: mulheres entre 16 e 40 anos com quadro de trombose arterial, embolia pulmonar, trombose cerebral ou trombose arterial, p1=proporção de usuárias(n=84, p2 =50%) Controle: duas por caso, p2=proporção de usuárias(n=168, p2 =14%) É p1significativamente diferente de p2?
Método Científico Resumir Resultados Interpretar e Tomar Decisões Coletar Dados Formular Teorias
Conceitos básicos • População é o grupo completo de indivíduos em estudo, dos quais se pretende obter uma informação. • Unidade é um objeto individual da população. • Amostra é uma parte da população utilizada para obter a informação. • O tamanho da população será denotado por N, e o tamanho da amostra por n.
Primeiros passos • Como coletar uma boa amostra? • De que tamanho deve ser amostra?
Exemplo Suponha que você é dono(a) de um sacolão. Um carregamento de batatas acaba de chegar e você deve verificar a qualidade da mercadoria. O dono do carregamento pega algumas batatas do topo e diz que as batatas estão ótimas. Você acha que esta é uma boa amostra?
Exemplo Um programa de televisão promove uma discussão sobre o tema: “o corintins voltará para a primeira divisão?” e convida os espectadores a participarem com suas respostas por telefone (0300-xxxx sim; 0300-yyyy não). A conclusão ao fim do programa é válida para estimar a proporção de torcedores a favor desse time?
Definição Um método de amostragem que produz resultados que sistematicamente diferem da verdade sobre a população são chamados viesados ou viciados. O erro é chamado viés ou vício.
Definição • Uma amostra conveniente é uma amostra que consiste de unidades da população que são facilmente acessíveis. • Uma amostra voluntária é uma amostra que consiste de unidades da população que decidem responder. Estes dois tipos de amostras são viciadas.
Definição • Viés por seleção é a tendência sistemática no procedimento de amostragem de excluir ou incluir um certo tipo de unidade. • Viés por não resposta é a distorção que aparece no estudo quando um grande número de unidades se recusa a responder. • Viés na resposta é a distorção que aparece devido à formulação da pergunta e/ou ao comportamento do entrevistador.
Exemplo • Você quer conhecer o perfil do estudante da UNICAMP e você decidiu que 50 estudantes seria um número suficiente para entrevistar. Você escolhe um lugar no campus e entrevista alguns dos estudantes que passam. Quais são as possíveis conseqüências desta amostragem?
Exemplo Separação vs. atração Estudos psicológicos mostram que a relação do casal se enfraquece com a distância prolongada. Como diz o velho ditado: “longe dos olhos, longe do coração”. Você acha esta conclusão razoável?
Exemplo Separação vs. atração Estudos psicológicos mostram que a relação do casal se fortalece com a distância prolongada. Como diz o velho ditado: “a saudade aumenta o amor”. Você acha esta conclusão razoável?
Observação Quando um processo de amostragem é viciado, tomar amostras grandes não ajuda. Isto apenas repete o erro em grande escala.
Definição Uma forma de superar a parcialidade no momento de selecionar a amostra é usar o “acaso”. A idéia básica é que toda unidade da população deve ter a mesma chance de ser selecionada para a amostra. Tais métodos de amostragem são ditos probabilísticos.
Tipos de amostragens probabilísticas • amostragem aleatória simples • amostragem aleatória estratificada • amostragem sistemática • amostragem por grupos
Definição • Uma amostra aleatória simples de tamanho n é uma amostra de n unidades selecionada de modo que todas as amostras de tamanho n têm a mesma chance de ser escolhidas.
Exemplo Como parte de um estudo sobre o efeito da fragmentação florestal na diminuição da população de aves canoras, uma equipe de pesquisadores precisa recolher informação sobre depredação nos ninhos. A grande área florestal é dividida em N=80 partes de mesmo tamanho aproximadamente. Devido à limitação de recursos, eles selecionam n=5 das 80 partes aleatoriamente para serem observadas.
Exemplo A fim de conhecer o perfil da turma de Estatística Elementar, deseja-se selecionar de forma aleatória uma amostra de 10 alunos. Como fazê-lo? Essa seria uma boa amostra para conhecer o perfil dos alunos da Unicamp?
Definição Uma amostra aleatória estratificada é selecionada dividindo a população em subgrupos mutuamente exclusivos e tomando uma amostra aleatória simples de cada estrato. A amostra completa é a combinação de todas as sub-amostras.
Exemplo • No estudo das aves, a floresta poderia ser dividida por particularidades do terreno (altura, recursos hídricos). • No estudo do perfil dos alunos da faculdade, poderíamos realizar amostras aleatórias simples das diversas turmas, classificadas por semestre, por sexo, por altura.
Definição Para uma amostragem sistemática 1-em-k, deve-se ordenar as unidades da população de alguma forma e escolher aleatoriamente uma das primeiras k unidades, na lista ordenada. Esta unidade é a primeira da amostra. Continuamos selecionando toda k-ésima unidade daí em diante.
Exemplo • No exemplo da floresta, selecionando 1-em-16, obtemos uma amostra de tamanho 5. • No exemplo do perfil da turma de estatística, podemos selecionar 1-em-8 de acordo com a lista de presença.
Definição Em uma amostragem por grupos, as unidades da população são subdivididas em grupos. Um ou mais grupos são selecionados aleatoriamente. Se um grupo for selecionado, todas as unidades que formam o grupo passam a fazer parte da amostra.
Exemplo • No estudo do perfil dos alunos da Unicamp, se a turma de Estatística Elementar for selecionada, todos os seus integrantes serão incluídos na amostra.
Conceitos básicos • Variável é uma característica de interesse a ser medida em cada unidade amostral.
Exemplos de variáveis • qualitativa nominal: sexo, carreira, região onde mora, portador de diabetes • qualitativa ordinal: grau de instrução, nível de renda, grau de evolução de uma doença • quantitativa discreta: número de filhos, número de acidentes em um mês • quantitativa contínua: peso, altura, pressão sangüínea sistólica, tempo de vida útil
Tipos de gráficos Dados unidimensionais: • Gráfico de pizza • Histograma • Gráfico de barras • Boxplot Dados bivariados • Diagrama de dispersão
Histograma Distribuição de notas finais na disciplina de Noções de Estatística
Gráfico de dispersão Y x x x x x x x x x x x X Correlação entre variáveis quantitativas
Associação entre variáveis qualitativas Distribuição conjunta das proporções de alunos segundo o sexo e o curso escolhido Variáveis não associadas
Associação entre variáveis qualitativas Distribuição conjunta das proporções de alunos segundo o sexo e o curso escolhido Variáveis associadas
Taxas de morte por 1000 de acordo com estado civil, Estados Unidos, 1949-1951.