210 likes | 286 Views
CAPÍTULO 5 - Intervalo de confiança. 5.1 Introdução 5.2 Margem de erro (ME) 5.3 Exemplo com a distribuição normal padronizada Z usando os dados de reclamações no capítulo 2, tabela 2.2 e figuras 2.2 e 2.3. 5.4 Tamanho da amostra para variáveis mensuráveis
E N D
CAPÍTULO 5 - Intervalo de confiança 5.1 Introdução 5.2 Margem de erro (ME) 5.3 Exemplo com a distribuição normal padronizada Zusando os dados de reclamações no capítulo 2, tabela 2.2 e figuras 2.2 e 2.3. 5.4 Tamanho da amostra para variáveis mensuráveis 5.5 Exemplo com distribuição t de Gosset usando os dados de reclamações no capítulo 2, tabela 2.2 e figura 2.2 5.6 Exemplo do conteúdo das latas de cerveja da introdução do capítulo 5.7 Intervalo de confiança para atributos: a distribuição binomial 5.8 Exemplo eleitoral - intervalo de confiança 5.9 Tamanho da amostra para atributos 5.10 As desvantagens do censo universal e as vantagens de pesquisas amostrais 5.11 Exercícios 5.12 Referências.
5.1 Introdução • O conceito de intervalo de confiança é diretamente relacionado com a exatidão da média amostral como representação da média da população μ. • A média amostral é uma estatística, estimada de uma amostra com o número de elementos muito menor que a população e, necessariamente existe certo grau de incerteza. • A média da população é um parâmetro existente, mas por causa de alguma razão, por exemplo, o alto custo de examinar todos os elementos da população, o seu valor não é conhecido. O cálculo do intervalo de confiança é um método para quantificar o nível de incerteza envolvido na amostragem.
Exemplo • Na cervejaria, um lote de produção de cerveja em lata tem 100.000 unidades, e o conteúdo nominal da lata é 350 ml. Para verificar se o valor de 350 ml prossegue, uma vez por semana uma amostra de 1000 latas é inspecionada e a média amostral calculada. • Não é para esperar que a média amostral das latas seja exatamente igual ao parâmetro populacional, mas podemos esperar sim um intervalo de confiança ao redor da média amostral que contenha a média da população com certa probabilidade (confiança). • A informação sobre a média das latas e os limites de confiança com a respectiva probabilidade é suficiente para o gerente julgar se o lote está dentro dos conformes ou não.
5.2 Margem de erro (ME) O valor da margem de erro pode ser escolhido pelo pesquisador, mas como vai ficar claro embaixo, não sem decisões difíceis sobre gastos em tempo e recursos. A margem de erro depende rigorosamente de dois aspectos, o tamanho da amostra e a confiança que é desejada na busca da representatividade da estatística.
Nível de confiança Amostras grandes A Amostras pequenas B C Variabilidade Figura 5.1 – Para determinado valor de margem de erro, a relação entre a variabilidade, o tamanho da amostra e o nível de confiança.
A margem de erro é a peça chave no cálculo do intervalo de confiança. No meio do intervalo de confiança fica a média amostral. A distância entre a média e o limite do intervalo de confiança é exatamente igual à margem de erro.
A expressão é a margem de erro (ME) para determinado nível de confiança (1 – α).
5.3 Exemplo com a distribuição normal padronizada usando os dados de reclamações no capítulo 2, tabela 2.2 e figuras 2.2 e 2.3. Existe uma probabilidade de 90% que a média populacional fica entre 154,45 e 211,33 minutos.
Figure 5.3 - Para margem de erro igual a 28,44, a relação entre a variabilidade, o tamanho da amostra e o nível de confiança no exemplo das reclamações. As três linhas representam três tamanhos de amostras diferentes: a linha mais baixa representa uma amostra pequena de 10 elementos enquanto as demais linhas representam amostras de tamanho 30 e 50 elementos respectivamente. A figura 5.3 é uma repetição prática da figura 5.1, uma representação teórica, com dados observados baseada no exemplo das reclamações. Na figura, a margem de erro é fixa em 28,44 minutos.
5.4 Tamanho da amostra para variáveis mensuráveis Margem de erro = MEP = Margem de erro padronizada
Exemplo No exemplo anterior, foi utilizado um valor de = 1,64 denotando um nível de confiança de 90% e exigindo uma amostra de tamanho 30. Se o pesquisador for mudar a confiabilidade desejada do intervalo de confiança para um nível de confiança de 95%, o valor se torna 1,96 e aplicando a formula O tamanho da amostra fica em 43 unidades, confirmando que níveis de confiança mais altos exigem amostras maiores.
Figure 5.4 – Tamanho da amostra (n = 1 a 900), margem de erro padronizada (MEP = 0,0 a 0,6) e níveis de confiança (1- α = 90% a 99,73%) Quando MEP aproxima-se ao valor 1,0 (margem de erro e desvio padrão iguais) o tamanho da amostra é pequena, e quando o desvio padrão aumenta em relação a ME, MEP diminuindo, surge a necessidade de obter amostras cada vez maiores.
Tabela 5.1 – O efeito do tamanho da população no cálculo do tamanho da amostra.
5.5 Exemplo com distribuição t de Gosset usando os dados de reclamações no capítulo 2, tabela 2.2 e figura 2.2 Usando a distribuição t, reconhecendo que a amostra de trinta elementos é pequena e não tão representativa da população obriga um afastamento dos limites de confiança para manter o mesmo nível de confiança de 90%.
5.6 Exemplo do conteúdo das latas de cerveja da introdução do capítulo A amostra de latas a ser mensurada tem apenas 1000 unidades, muito menos que o tamanho do lote que é 100.000 unidades. Para responder a essa questão, vamos calcular o intervalo de confiança. Os resultados da amostra são: A média da amostra ficou em 350,4 ml, acima do valor nominal de 350, satisfazendo aparentemente as normas de qualidade da fábrica. Mas o valor da amostra de 350,4 representa o valor do lote? O intervalo de confiança para o nível de confiança de 99% fica em O gerente pode ter 99% de confiança de que o valor do lote fica entre 350,15 e 350,65 ml. Todo o intervalo está acima do valor nominal garantindo o conteúdo da lata de cerveja, e a empresa com muita tradição no mercado sente orgulho frente aos clientes.
5.7 Intervalos de confiança para atributos: a distribuição binomial • O intervalo de confiança montado na base da distribuição binomial é utilizado no dia a dia das campanhas políticas e publicitárias. • Em épocas eleitorais o eleitor cansa de ver e escutar notícias sobre as últimas pesquisas de opinião sobre qual candidato está na frente da corrida para algum cargo no governo, ás vezes até mesmo meses antes das eleições. • O noticiário divulga percentagens de aceitação e rejeição entre candidatos (44% favorecia um candidato e 56% o outro, por exemplo) em amostras de eleitores de tamanho 1000, 2000 ou 3000, e sempre comenta a margem de erro das pesquisas em torno de 2 ou 3 por cento de cada lado. • As conclusões em termos de percentagens vêm da utilização da distribuição binomial, e o cálculo dos limites de confiança e • margens de erro.
5.8 Exemplo eleitoral - intervalo de confiança Em pesquisa eleitoral levantada um mês antes das eleições, com amostra de tamanho 1000, candidato BO recebe 51% das intenções de voto. Trabalhando com nível de confiança de 95%, podemos calcular o intervalo de confiança: A margem de erro fica em aproximadamente 3%. A percentagem de preferência eleitoral pelo candidato é 51%, suficiente para ganhar a eleição, mas considerando que a média da população pode ficar entre 48% e 54%, existe um espaço no intervalo menos que 50% abrindo a possibilidade de derrota. Para diminuir a margem de erro há duas alternativas, ou diminuir o nível de confiança ou aumentar o tamanho da amostra.
5.9 Tamanho da amostra para atributos Margem de erro (ME) = O pesquisador, no entanto não ficou satisfeito com a margem de erro anterior (0,03) achando a (ME) grande e imprecisa e conseqüentemente argumentou que a eleição tão disputada com resultado tão acirrado merecia maior esforço na coleta da amostragem para que a margem de erro fosse apenas 0,01. Então fazendo as substituições apropriadas, temos:
Continuação Infelizmente para o pesquisador buscando resultados mais precisos, uma amostra de tamanho quase 10.000 foi considerado grande demais pelo candidato em termos de tempo e recursos exigidos para seu levantamento e, portanto foi definido como adequada uma margem de erro intermediária de 2%. Com isso então novo tamanho de amostra foi calculado em 2400. Assim, as pesquisas prosseguiram. Este tamanho da amostra em 2400 é um número tradicional e universalmente utilizado para pesquisas eleitorais e empresariais. Na prática, a fórmula sofre uma simplificação que facilita o uso para margem de erro de 2% arredondando Zα/2 para 2,00 e p para 0,50 resultando em n = 2,02*(0,25)/0,022 = 1/0,0004 = 2500 A pequena diferença de 2400 para 2500 satisfaz o conservadorismo do estatístico errando para valores maiores e, portanto mais seguros.
5.10 As desvantagens do censo universal e as vantagens de pesquisas amostrais
É interessante reparar o tamanho amostral para o caso mais exigente na tabela 5.3 com nível de confiança de 99,73% e margem de erro de 0,5% (no canto superior à direita). Com 90.000 elementos na amostra, a confiança nos resultados da pesquisa é quase perfeita. Essa conseqüência levanta uma dúvida sobre a necessidade de elaborar uma enorme estrutura burocrática para o censo brasileiro cada 10 anos.