1 / 26

Estatística Inferencial (cap. 7 Martins)

Estatística Inferencial (cap. 7 Martins). Estatística descritiva – trata da organização, sumarização e descrição dos dados Estatística inferencial – métodos que tornam possível a estimação de características de uma população baseadas nos resultados amostrais

Download Presentation

Estatística Inferencial (cap. 7 Martins)

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Estatística Inferencial (cap. 7 Martins) • Estatística descritiva – trata da organização, sumarização e descrição dos dados • Estatística inferencial – métodos que tornam possível a estimação de características de uma população baseadas nos resultados amostrais • População é a totalidade de itens, objetos, ou pessoas sob consideração • Amostra é uma parte da população que é selecionada

  2. Amostragem Amostragem aleatória simples – todos os elementos da população têm igual probabilidade de compor a amostra; Se a população é finita, a escolha de uma amostra aleatória envolve a compilação de uma lista de todos os elementos da população, e a realização de sorteios para escolher os itens que irão compor a amostra

  3. Níveis de mensuração As operações aritméticas e técnicas estatísticas admissíveis dependem do nível de mensuração da variável Nível nominal – a variável pode assumir duas ou mais categorias. Ex.: estado civil, religião. Não é possível realizar operações aritméticas. Estas variáveis são chamadas de variáveis categóricas Nível ordinal – quando as categorias mantêm uma relação de ordem. Ex.: escolaridade Nível intervalar – além de manter uma ordem, os intervalos de medição são iguais. Ex.: peso, altura, volume. Permite operações aritméticas básicas. Nível de razão – além das características do nível intervalar, o zero é real, é absoluto (não é arbitrário).

  4. Medidas de posição e de dispersão Soma dos valores de x Σ x X = = n Número de observações Amostra (a) = 20, 19, 21 Dispersão Amostra (b) = 30, 20, 10 X Xa = 20 Xb = 20 O que interessa é o desvio em relação à média

  5. Medidas de posição e de dispersão Amostra (a) = 20, 19, 21 Dispersão Amostra (b) = 30, 20, 10 X Xa = 20 Xb = 20 O que interessa é o desvio em relação à média, mas ...... A variância amostral (S²), de uma amostra de n medidas é igual à soma dos quadrados dos desvios dividido por (n-1) Σ (Xi –X)² n-1 S = √S² S² = O desvio padrão (S),

  6. Regra empírica • O intervalo X ± S contém entre 60% e 80% de todas as observações amostrais • O intervalo X ± 2S contém aproximadamente 95% de todas as observações amostrais Coeficiente de variação de Pearson S Mede a dispersão relativa C.V = x 100 X C.V < 15% baixa dispersão C.V > 30% alta dispersão

  7. Escore padronizado É outra medida relativa de dispersão Para uma medida Xi é dado por: Um escore negativo indica que Xi está à esquerda da média e positivo à direita Xi –X S Zi = Exemplo: São dadas as médias e os desvios padrões das avaliações de duas disciplinas: Português Xp = 6,5 Sp = 1,2 Matemática Xm = 5,0 Sm= 0,9 Relativamente às duas disciplinas, em qual delas obteve melhor desempenho um aluno que tirou 7,5 em português e 6,0 em matemática?

  8. Utilizando escore padronizado teremos: Xi –X S 7,5– 6,5 1,2 Zi = Zp = Zp = 0,83 6,0– 5,0 0,9 Zm = Zm = 1,11 0,83 1,11 -3s 3s 7,5 6,0 Xp= 6,5 Xm = 5,0 Logo, o desempenho melhor foi em matemática, apesar da sua nota ter sido menor

  9. Outliers Observações que fogem das dimensões esperadas Considerar outliers as observações cujos escores padronizados sejam maiores do que 3, em valor absoluto 99,74 % m 3s -3s

  10. Distribuição normal padrão X -m Z = s Área = probabilidade Z=0 Zi Uma tabela fornece a área em função de Z

  11. Exercício 1 As alturas dos alunos de determinada escola são normalmente distribuídas com média 1,60 m e desvio padrão de 0,3 m. Encontre a probabilidade de um aluno medir entre 1,50 e 1,80m 1,80 –1,60 1,50 –1,60 X -m Solução Z1 = Z2 = Z = 0,3 0,3 s • = 1,60 s = 0,30 • P (1,50 < X < 1,80) = P(Z1 < Z < Z2) Z1 = - 0,33 Z = 0 Z1 Z2 Z2 = 0,67

  12. Exercício 1 - continuação Consultando a tabela: Área = 0,1293 p/Z1 = 0,33 Área = 0,2486 p/Z2 = 0,67 Logo, Área total = 0,1293+ 0,2486 Área = 0,3779 ou P (1,50 < X < 1,80) = 37,79% Z = 0 Z1 Z2

  13. Exercício 2 As alturas dos alunos de determinada escola são normalmente distribuídas com média 1,60 m e desvio padrão de 0,3 m. Encontre a probabilidade de um aluno medir mais de 1,75 m Solução Transformando em normal padrão 1,75 0 0,5 Consultando a tabela temos a área (amarela) que é 0,1915, logo a área azul será 0,5 – 0,1915 = 0,3085 A probabilidade de um aluno com mais de 1,75m é de 30,85% X=1,60

  14. Exercício 3 As alturas dos alunos de determinada escola são normalmente distribuídas com média 1,60 m e desvio padrão de 0,3 m. Encontre a probabilidade de um aluno medir menos de 1,48 m Solução 1,48 – 1,60 Z = 0,3 Z = - 0,4 -0,4 0 1,48 1,60 Consultando a tabela temos a área igual (0,5 – 0,1554) = 0,3446 A probabilidade de um aluno com menos de 1,48m é de 34,46%

  15. Exercício 4 As alturas dos alunos de determinada escola são normalmente distribuídas com média 1,60 m e desvio padrão de 0,3 m. Qual deve ser a medida mínima para escolhermos 10% dos mais altos? Solução 10% mais altos, logo conhecemos a área e queremos determinar o valor de Z Consultando a tabela para uma área igual a 0,40 (0,5-0,1) temos Z=1,28 0 Z Z = (X – 1,60)/ 0,3 Logo X = (1,28x0,3) + 1,60 X = 1,98 Assim, a medida mínima para escolhermos os 10% mais altos é 1,98m

  16. Inferência estatística Busca obter informações sobre a população a partir dos elementos amostrais População Amostra ^ q q Estimador Parâmetro populacional Inferência ou indução estatística

  17. Inferência estatística População Amostra m s x s

  18. Inferência estatística Pode ser feita por ponto ou por intervalo de confiança Exemplo: retira-se uma amostra aleatória de 500 brasileiros e calcula-se a média de suas alturas, encontrando-se 1,66. Uma estimativa pontual da verdadeira altura média (μ) é dada por X = 1,66m. Através do intervalo de confiança poder-se-ia encontrar um intervalo, por exemplo [1,58; 1,68] que, em 95% das vezes incluiria μ, o verdadeiro valor da média dos brasileiros

  19. Intervalo de confiança α = erro (nível de significância) 1- α = nível de confiança α = 5% 1- α = 95% α/2 1- α α/2 -Z α/2 Z α/2

  20. Intervalo de confiança O intervalo de confiança para a média populacional (μ) quando a variância (s²) é conhecida P [ ]= 1- α X - Zα/2 ≤ μ ≤ X + Zα/2 s s √n √n

  21. Exemplo: a duração da vida de uma peça é tal que s = 5 horas. Foram amostradas 100 dessas peças obtendo-se a média de 500 horas. Deseja-se construir a verdadeira duração média da peça com um nível de 95%. Solução Do enunciado do problema se tem: s = 5 n = 100 X = 500 (1- α)100 = 95%

  22. Solução Do enunciado do problema se tem: s = 5 n = 100 X = 500 (1- α)100 = 95% 2,5% 95% 2,5% Para se encontrar o valor de Z α/2 entrou-se na tabela com 0,475 Z α/2 = 1,96 -Z α/2 = -1,96 P [ ]= 1- α Substituindo os valores na fórmula abaixo X - Zα/2 ≤ μ ≤ X + Zα/2 s s √n √n P[ 500 – 1,96. 5/√100 ≤ μ ≤ 500 + 1,96. 5/√100] = 95% P[ 499,02≤ μ ≤ 500,98] = 95% Intervalo de confiança

  23. Estimativa de intervalo Ex.: O intervalo [ 1,60m; 1,64m] contém a altura média dos moradores do município X, com um nível de confiança de 95% . O risco do erro de inferência será de 5%, isto é, se tomarmos 100 amostras de tamanhos iguais, poderíamos esperar que 95 desses intervalos iriam conter o parâmetro populacional 1 2 3 4 5 6 99 100 m

  24. Amostragem Amostra é um subconjunto da população que deve de fato representar toda a população População Amostra N n n = fração amostral N

  25. Amostragem Tamanho da amostra para se estimar a média de uma população finita n = tamanho da amostra aleatória simples Z = abscissa da distribuição normal padrão d = erro amostral, máxima diferença entre m e x admissível s = desvio padrão da população Z = 1,96 para um nível de confiança de 95% 2 [ ] s Z . Z = 2,0 para um nível de confiança de 95,5% n = d Z = 2,57 para um nível de confiança de 99%

  26. Exemplos Suponha que a variável escolhida em um estudo seja o peso de uma certa peça, e que a população é infinita. O desvio padrão é de 10kg. Admitindo-se um nível de confiança de 95,5% e um erro amostral de 1,5 kg, qual deve ser o tamanho da amostra? d = 1,5 kg s = 10kg Z = 2,0 Z = 2,0 para um nível de confiança de 95,5% n = tamanho da amostra aleatória simples = 178 2 2 [ [ ] ] s 2 . Z . 10 n = n = 1,5 d

More Related