820 likes | 1.3k Views
TESTE T DE STUDENT TESTE ANOVA. Prof.ª Dr.ª Ana Daniela Silva da Silveira. REVISAR É PRECISO!. LEMBRAM DOS FEIJÕES?!??. EXISTE DIFERENÇA QUANTO AO TEMPO DE COZIMENTO?. QUAIS AS HIPÓTESES?. EXISTE DIFERENÇA QUANTO AO TEMPO DE COZIMENTO?.
E N D
TESTE T DE STUDENT TESTE ANOVA Prof.ª Dr.ª Ana Daniela Silva da Silveira
LEMBRAM DOS FEIJÕES?!?? EXISTE DIFERENÇA QUANTO AO TEMPO DE COZIMENTO?
QUAIS AS HIPÓTESES? EXISTE DIFERENÇA QUANTO AO TEMPO DE COZIMENTO? 1- NÃO! NÃO EXISTE DIFERENÇA, OU SEJA, OS TEMPOS SÃO IGUAIS... 2- SIM! EXISTE DIFERENÇA...
COMO RESOLVER? Depois de definirmos as hipóteses, vamos testá-las para descobrir qual delas eu aceito, H0 ou H1
O meuestudoseguiráestaordem… • Definir as hipóteses • Identificar as variáveis • Analisar as variáveis quanto: • Natureza: numérica ou categórica; • Distribuição: normal ou anormal; • Continuidade; • Instabilidade; 3. Adotar o nível de significância (α) 4. Tomar a decisão quanto ao tipo de erro que quero evitar ou minimizar. 5. Escolher o teste que seja o mais adequado para minha decisão.
Realizou-se uma pesquisa com o objetivo de se verificar se existe diferença entre o tempo de cozimento do feijão marrom e do tempo de cozimento do feijão preto. Foram feitas 10 análises para cada um dos grupos... EXPERIMENTO E DADOS TOTALMENTE FICTÍCIOS!!!
Distribuição dos valores de tempo de cozimento dos feijões marrons O que eu entendo ao analisar este gráfico? 95% 36,07 - 2dp + 2dp 30,47 41,66
Distribuição dos valores de tempo de cozimento dos feijões marrons Entendo também que, se eu respeitei os padrões de amostragem, significa que a chance da média de tempo de cozimento da população de feijões ser maior que 30,47 e menor que 41,66 é de 95% Que o tempo de cozimento médio dos feijões marrons é de 36,07 minutos, com intervalo de confiança de 30,47 – 41,66 95% - 2dp 36,07 + 2dp 30,47 41,66
X Distribuição dos valores de tempo de cozimento Feijão preto Feijão marrom 36,07(±2,8) 51,45(±4,6)
Então, neste caso, vou assumir o parâmetro de 5% α=0,05 95% Zona de rejeição = 2,5% 41,66 - 2dp 36,07 30,47 Zona de rejeição = 2,5%
Onde as duas curvas se encontram? Qual a probabilidade do valor real da população de feijões ser igual para os feijões pretos e marrons? Feijão preto Feijão marrom 30,47 36,07 41,66 42,08 51,45 60,81 *Me perdoem os matemáticos e estatísticos, mas esse esquema foi o que eu consegui criar para explicar o próximo slide...
O valor de p O valor de p é a probabilidade de dois grupos serem iguais, ou seja, aceitar H0! Em geral, assume-se um parâmetro de análise para o p, um nível de decisão para se descartar H0 e se dizer, com segurança, que de fato há diferença entre os grupos. Este nível de decisão é exatamente o valor de α, ou nível de significância. Geralmente, este nível de decisão é de 5%, ou seja, o valor de p, ou p valor, deve ser menor que 0,05 para que se diga que os grupos são diferentes entre si, rejeitar H0, ou como estamos acostumados a dizer, ter diferença estatisticamente significante.
Como eu faço para descobrir o calor de p? Eu preciso testar as hipóteses...E como eu faço isso?
TESTE T DE STUDENT TESTE ANOVA Prof.ª Dr.ª Ana Daniela Silva da Silveira
Os testes de hipóteses que eu vou utilizar dependem de algumas características do meu estudo e das minhas variáveis...
Sexo, Cor dos Olhos, Etnia N úmero de Dentes Cariados, Perdidos e Obturado (CPO-D) Classificação das Variáveis TIPO CLASSE SUB-CLASSE - EXEMPLOS CATEGÓRICAS Nominal Exaustivas Gênero musical preferido Mutuamente Exclusivas Ordinal Escolaridade QUANTITATIVAS Contínua Intervalar Temperatura Racional Idade, Peso, Altura Discreta Fonte: Berquó et al, 1981; Costa, 1998 apud Roncalli, 2008
Princípio para aplicação de Testes A aplicaçãoadequadade um testeestatísticodepende de algunsfatores: 1- O tipo de perguntaque se deseja responder 1- A classificação da variáveldependente e da independente Retirado da aula do Prof. Dr. AngeloRoncalli (UFRN), 2008
Princípio para aplicação de Testes Dessemodo, sãopossíveisváriascombinaçõesemfunçãodestesfatores: Retirado da aula do Prof. Dr. AngeloRoncalli (UFRN), 2008
Pergunta da Pesquisa: As médias da variável dependente diferem entre os grupos estudados? 1a Pergunta: Os dados apresentam distribuição normal? Sim – TestesParamétricos Não – TestesNão-Paramétricos 2a Pergunta: Com quantos grupos ou com quantas categorias da variável estou trabalhando? 2 grupos Mais de 2 grupos 2 grupos Mais de 2 grupos 3a Pergunta: Existe vinculação entre as categorias da variável? Sim Não Sim Não Sim Não Sim Não 4a Pergunta: Qual teste devo usar? Teste “t”Pareado Teste “t” AnáliseVariância AnáliseVariância Wilcoxon Mann-Whitney Friedman Kruskal-Wallis Retirado da aula do Prof. Dr. AngeloRoncalli (UFRN), 2008
Pergunta da Pesquisa: As variáveis dependente e independente se correlacionam entre si? Qual a magnitude? 1a Pergunta: Qual o tipo de variável? Quantitativa Categórica 2a Pergunta: Com quantos grupos ou com quantas categorias da variável estou trabalhando? 2 grupos Mais de 2 grupos 2 grupos Mais de 2 grupos Retirado da aula do Prof. Dr. AngeloRoncalli (UFRN), 2008 3a Pergunta: Os dados apresentam distribuição normal? Sim Não Sim Não Não Não 4a Pergunta: Qual teste devo usar? CorrelaçãoPearson CorrelaçãoSpearman RegressãoMúltipla RegressãoMúltipla Qui-Quadrado Exato deFisher RegressãoLogística n > 20 n < 20
Comparando médias de populações com Distribuição Normal: Teste “t” de Student
Teste t-Student O teste t-Student é um teste paramétrico de largo uso. Como ele analisa amostras quantitativas, seu objetivo vai ser comparar os dois grupos... Devemos observar: a) amostras randômicas de cada população investigada; b) as variâncias devem ser homogêneas; c) as variáveis das populações de onde as amostras foram selecionadas devem apresentar distribuição aproximadamente normal.
Teste t-Student – situações... TESTE F - As duasmédias, relativas à mesmavariávelquantitativa, se referem a duaspopulaçõescujasvariâncias, emboradesconhecidas, sãoiguais. - As duasmédias, relativas à mesmavariávelquantitativa, se referem a duaspopulaçõescujasvariâncias, emboradesconhecidas, sãodiferentes. - As duasmédias se referem a duasmedidasrelativas à mesmavariávelquantitativa, tomadas dos mesmoselementos de umapopulação, mas emduassituaçõesdistintas
Teste t-Student – situações... - As duasmédias, relativas à mesmavariávelquantitativa, se referem a duaspopulaçõescujasvariâncias, emboradesconhecidas, sãoiguais (homocedásticas). Onde S² é a variância ponderada das duas amostras... Retirado da aula do Prof. Dr. AngeloRoncalli (UFRN), 2008
Teste t-Student – situações... - As duasmédias, relativas à mesmavariávelquantitativa, se referem a duaspopulaçõescujasvariâncias, emboradesconhecidas, sãodiferentes (heterocedásticas). O valor de t dependerá dos graus de liberdade... Retirado da aula do Prof. Dr. AngeloRoncalli (UFRN), 2008
Exemplo… Tamanho da amostra, média e variância da estatura, em centímetros, de recém-nascidos não-portadores de anomalias congênitas, segundo sexo. Fonte: Arena, 1976, apud Vieira, 1981 Retirado da aula do Prof. Dr. AngeloRoncalli (UFRN), 2008
Na prática… Duas populações distintas
Na prática… Observar o que temos: 1- Quantas amostras? 2- São relacionadas ou independentes? 3- Eu tenho todos os dados?
Na prática… Observar o que temos: 1- Quantas amostras? 2- São relacionadas ou independentes? 3- Eu tenho todos os dados?
Na prática… Observar o que temos: 1- Quantas amostras? 2- São relacionadas ou independentes? 3- Eu tenho todos os dados?
Na prática… Mas o que é o valor de p mesmo?
Mas o que é o valor de p mesmo? O valor de p é a probabilidade de dois grupos serem iguais, ou seja, aceitar H0! Em geral, assume-se um parâmetro de análise para o p, um nível de decisão para se descartar H0 e se dizer, com segurança, que de fato há diferença entre os grupos. Este nível de decisão é exatamente o valor de α, ou nível de significância. Geralmente, este nível de decisão (α ) é de 5%, ou seja, o valor de p, ou p valor, deve ser menor que 0,05 para que se diga que os grupos são diferentes entre si, rejeitar H0, ou como estamos acostumados a dizer, ter diferença estatisticamente significante.
Teste t-Student – situações... - As duasmédias se referem a duasmedidasrelativas à mesmavariávelquantitativa, tomadas dos mesmoselementos de umapopulação, mas emduassituaçõesdistintas Onde d é a média das diferenças entre cada par de dados e S² a variância desta média. O “t” encontrado está associado a n – 1 graus de liberdade Retirado da aula do Prof. Dr. AngeloRoncalli (UFRN), 2008
Na prática… Vamos supor que eu quero fazer um estudo e definir o valor de cor (∆E) em dentes de boi em duas situações; antes e depois de aplicar algum produto clareador que eu inventei... (estudo fictício)
Na prática… Observar o que temos: 1- Quantas amostras? 2- São relacionadas ou independentes? 3- Eu tenho todos os dados?
Comparando médias de populações com Distribuição Normal: a Análise de Variância
A Análise de Variância - ANOVA É o testeestatísticoindicado para variáveis com distribuição normal, estabelecendo a comparação entre trêsoumaismédias. Podeser de doistipos: One-way – quandooselementosforamcategorizados de um únicomodo – tipo de medicamento Two-way – Quandooselementosforamcategorizados de doismodos – tipo de medicamento e sexo Adaptado da aula do Prof. Dr. AngeloRoncalli (UFRN), 2008
A Análise de Variância - ANOVA O uso do ANOVA indicará a probabilidade de se rejeitar H0... Se, ao final H0 for rejeitada deve-se proceder para a comparação 2 a 2 • Vimos que o teste t serve para a comparação entre duas amostras. Agora, iremos comparar três ou mais... • Ex.: testar 4 drogasdiferentes (diuréticos) aomesmo tempo e avaliar o efeito de cadadrogasobre o débitourinárioem 16 voluntários. • teste t: compararosgrupos 2 a 2 (6 testes t separados) • - perda de tempo • - errotipo I de 30% (5% de erroem 6 análises) • Então, vamosusar o teste ANOVA (comparação de pares): Ulisses Doria Filho. Introdução a Bioestatística para simples mortais. Rio de Janeiro: Elsevier; 2003. p. 114-20
A Análise de Variância - ANOVA Princípiobásico do Teste ANOVA: Emumatabela de dados com determinadonúmero de repetições (indivíduos, p.ex.) e de tratamentos (grupos de estudo, p.ex.), espera-se que a variação entre osgruposseja superior àquelainerenteaomodelo (resíduo) dentro de determinadoslimites. Retirado da aula do Prof. Dr. AngeloRoncalli (UFRN), 2008
A Análise de Variância - ANOVA Comparação entre as médias de grupos estudados. Retirado da aula do Prof. Dr. AngeloRoncalli (UFRN), 2008