260 likes | 443 Views
Universidade Federal de Alagoas Centro de Tecnologia. Estatística. Aula 23. Prof. Marllus Gustavo Ferreira Passos das Neves. Aula 23. Teste de Hipóteses para 3 ou mais médias: ANOVA fator único. Inferência sobre 3 ou mais médias.
E N D
Universidade Federal de Alagoas Centro de Tecnologia Estatística Aula 23 Prof. Marllus Gustavo Ferreira Passos das Neves
Aula 23 • Teste de Hipóteses para 3 ou mais médias: • ANOVA fator único
Inferência sobre 3 ou mais médias Objetivo: dadas 3 ou mais amostras, verificar a hipótese de igualdade de 3 ou mais médias populacionais Suponha que a equipe de engenheiros de uma fábrica de papel desconfia que a porcentagem (concentração) de madeira de lei na fabricação aumenta a resistência à tensão. Eles resolvem fazer experimentos com 4 níveis de concentração: 5%, 10%, 15% e 20%, fabricando 6 corpos de prova para cada nível, totalizando 24 corpos de prova
Inferência sobre 3 ou mais médias O quadro abaixo o experimento com os resultados Neste tipo de experimento, há um único fator concentração de madeira de Lei. O fator no nosso exemplo possui 4 níveis chamados de tratamentos Cada tratamento teve 6 observações 6 replicatas
Inferência sobre 3 ou mais médias A pergunta a ser respondida: o nível do fator ou os diferentes tratamentos fazem melhorar a resistência à tensão do papel? Outro Exemplo: testar a hipótese de que o CRs acumulados médios dos alunos de engenharia são diferentes para 3 diferentes populações: iniciantes, intermediários e concluintes. Os dados estão a seguir amostras de tamanhos iguais a 30 Quem é o fator? Quem são os tratamentos?
Inferência sobre 3 ou mais médias Hipóteses: H0: m1 = m2 = m3 = ... H1: pelo menos uma é diferente das demais Usaremos a chamada análise de variância (ANOVA) médias muito diferentes ocasionam variância entre elas alta
Inferência sobre 3 ou mais médias Ideia geral do teste: como se supõe que as populações têm variâncias iguais, ou seja, s12 = s22 = s32 = ... = s2, estimamos s2com 2 abordagens diferentes. Com a estatística F descobriremos se estas 2 abordagens possuem estimativas muito direfentes F alto ou parecidas F próximo de 1. O 1º caso será evidência em favor de H1 e o 2º caso em favor de H0 Variância entre amostras (variância devido ao tratamento) Quais são as 2 abordagens? Variância dentro das amostras (variância devido ao erro)
Inferência sobre 3 ou mais médias Médias muito diferentes ocasionam variância entre elas alta (variância entre amostras) F alto Região de rejeição rejeitamos H0 evidência contra a igualdade de médias Médias parecidas ocasionam variância entre elas baixa (variância entre amostras) F baixo Região de não rejeição não rejeitamos H0 evidência a favor da igualdade de médias numerador denominador
Inferência sobre 3 ou mais médias • Suposições: • As amostras são independentes umas das outras; • As populações têm distribuições que são aproximadamente normais • As populações têm a mesma variância (exigência leve tamanhos de amostras iguais podem ter variâncias bem diferentes: a maior ser até 9 vezes a menor os resultados ainda são confiáveis) • Amostras aleatórias • As amostras são de populações que são categorizadas de uma só maneira
Aplicações Exemplo (continuação): testar a hipótese de que o CRs acumulados médios dos alunos de engenharia são diferentes para 3 diferentes populações: iniciantes, intermediários e concluintes. numerador denominador
Aplicações Como sempre achar o valor crítico de F da tabela Para a = 0,05 e graus de liberdade: glnumerador = k – 1 = 3 – 1 = 2 gldenominador = k.(n – 1) = 3.(30 – 1) = 87 onde k é o no de amostras e n o tamanho das amostras (por enquanto o mesmo para todas elas)
Aplicações A tabela não possui 87, mas sim 60 e 120, cujos valores são 3,1504 e 3,0718. Tomando o valor médio, temos Fc = 3,111 Como F = 1,268 < Fc = 3,111 não há evidência estatística suficiente, ao nível de significância de 5%, para afirmar que as 3 médias sejam diferentes
Inferência sobre 3 ou mais médias Esse foi o caso da aplicação da ANOVA de um critério ou ANOVA de fator único, pois usamos uma única característica ou propriedade para categorizar populações. Essa característica é, algumas vezes chamada de tratamento ou fator. Outra observação: os tamanhos das amostras foram iguais, o que facilitou bastante o cálculo e o entendimento A seguir veremos como fica o caso de amostras com tamanhos diferentes
ANOVA fator único: amostras de tamanhos diferentes Para o caso de amostras com tamanhos diferentes, também usamos a estatística F como a razão entre duas estimativas diferentes da variância populacional comum s2, mas agora elas envolvem medidas ponderadas • Variação entre as médias das • amostras (tratamento) Variação dentro das amostras (erro)
ANOVA fator único: amostras de tamanhos diferentes Média de todos os valores amostrais combinados No de médias populacionais sendo comparadas k ni No de valores da i-ésima amostra Média dos valores da i-ésima amostra Variância dos valores da i-ésima amostra
ANOVA fator único: amostras de tamanhos diferentes Suponhamos 3 amostras (tabela abaixo) k = 3 3 médias populacionais sendo comparadas: m1, m2 e m3 n1 = 2 n2 = 3 n3 = 2 médias amostrais variâncias amostrais média de todos os valores amostrais combinados = 7
ANOVA fator único: amostras de tamanhos diferentes Suponhamos 3 amostras (tabela abaixo) n1 = 2 n2 = 3 n3 = 2 e
ANOVA fator único: amostras de tamanhos diferentes Há uma nomenclatura para estes somatórios ou SQ(entre amostras) ou SQ(entre grupos) ou SQ(fator) ou SQ(dentro das amostras) onde SQ = Soma dos quadrados Dividindo SQ(tratamento) e SQ(erro) por seus respectivos graus de liberdade MQ(tratamento) e MQ(erro) onde MQ = Média quadrática
ANOVA fator único: amostras de tamanhos diferentes onde N = n1 + n2 + n3 no total de valores em todas as amostras combinadas k do nosso exemplo
ANOVA fator único: amostras de tamanhos diferentes Então para testarmos a hipótese de diferenças de 3 ou mais médias H0: m1 = m2 = m3 = ... H1: pelo menos uma é diferente das demais Estatística de teste: gl = k - 1 gl = N - k
ANOVA fator único: amostras de tamanhos diferentes Este tipo de teste costuma ser feito com o auxílio da tabela ANOVA
Aplicações Um engenheiro ambiental está analisando o efeito da vazão de um efluente contaminado com chumbo na concentração de saída do chumbo em um sistema de tratamento. A tabela abaixo apresenta o resultado dos ensaios realizados com 5 vazões diferentes. • Há qualquer diferença na concentração de saída do chumbo devido à variação na vazão? Use a = 0,05
Aplicações Uso do Statdisk
Aplicações Revisitando o teste dos CRs acumulados
Universidade Federal de Alagoas Centro de Tecnologia Estatística Aula 23 Prof. Marllus Gustavo Ferreira Passos das Neves