470 likes | 623 Views
Testes de Hipótese. Dr Hermano Alexandre Doutorando em Saúde Coletiva Mestre em Saúde Pública Especialista em auditoria de sistemas de saúde Faculdade de Medicina Universidade Federal do Ceará. Tópicos essenciais da aula. Significância estatística Intervalos de confiança
E N D
Testes de Hipótese Dr Hermano Alexandre Doutorando em Saúde Coletiva Mestre em Saúde Pública Especialista em auditoria de sistemas de saúde Faculdade de Medicina Universidade Federal do Ceará
Tópicos essenciais da aula Significância estatística Intervalos de confiança Inferência estatística
Tópicos Testes de hipótese Teste t de student Teste F Teste chi quadrado Intervalos de confiança Inferência estatística
Teste de hipótese Visa testar qual a probabilidade de que um determinado resultado encontrado em uma determinada amostra seja somente devido ao acaso.
O que é hipótese? Em inglês, hypothesis Em alemão, Hypothese Em latim, hypothesis ... Vem de: base(hipo) de uma proposição(thesis).
O que é hipótese? População 100 Obesos Amostra 100 Não obesos
O que é hipótese? Obesos – 120, 113, 167, 100, 98, 76, 129, ... Média - 122 37 Pré diabéticos Não obesos – 98, 90, 100, 73, 200, 103, 78, ... Média – 98 13 Prédiabéticos
Por que testar a hipótese O acaso (erro tipo I)
Ho - Hipótese Nula H1 - Hipótese Alternativa Hipóteses de um Teste
Ho - Hipótese Nula- hipótese que será suposta inicialmente como verdadeira. É, basicamente, a negação do que o pesquisador deseja provar. Hipóteses de um Teste
H1 - Hipótese Alternativa- hipótese que será aceita, se os dados mostrarem evidências suficientes para a rejeição da hipótese nula. Geralmente, é a própria hipótese da pesquisa. Hipóteses de um Teste
Ho: Em média, as vendas não aumentam com a introdução da propaganda. H1: Em média, as vendas aumentam com a introdução da propaganda. Ho: Em média, o IAM não diminui com uso de aspirina. H1: Em média, o IAM diminui com o uso de aspirina. Exemplo
Suspeita-se que uma moeda, utilizada em jogo de azar, seja viciada, isto é, que a probabilidade de sair “cara” seja diferente de 50%. Exemplo
Ho: p = 0,5(a probabilidade é 50%) H1: p = 0,5(a probabilidade não é 50%) p - probabilidade de cara. Hipóteses
Para se tomar a decisão de se aceitar, ou não, que a moeda seja honesta, tomou-se uma amostra com 10 lançamentos e observou-se o número de caras. (variável X - estatística do teste). Amostra
Qual é o valor esperado para o número de caras (variável X - estatística do teste) se a probabilidade for realmente 50%? 5 caras ValorEsperado
Valor esperado se a probabilidade for realmente 50%: 5 caras. Situação 1: Valor obtido: X = 10 caras. Qual seria a conclusão? Situação 2: Valor obtido: X = 7 caras. Qual seria a conclusão? Resultado da amostra
Valor esperado se Ho for verdadeira Valor observado na amostra ocorreu por acaso? (Ho verdadeira) Desvio Observado Desvio ocorreu porque Ho é falsa ?
Tipos de testes estatísticos Cada um para uma finalidade específica Tipo de variável Distribuição da variável Paramétricos Não paramétricos Quantidade de amostras Amostras relacionadas ou não
Tipos de variáveis Numéricas? T de student Teste F ANOVA Mann Whitney Categóricas? Chi quadrado Análise de verossimilhança Kendall`s Tau B
Distribuição de variáveis Paramétricas Teste T Anova Não paramétricas Mann Whitney Chi quadrado *KolmogorovSmirnov
Quantidade de amostras Duas? Mann Whitney Teste T Chi quadrado K? Kruskall Wallis Chi quadrado ANOVA
Relação entre amostras Com controle? McNemar Wilcoxon Sem controle? Teste T Chi quadrado
Como funciona um teste? Fórmula matemática Valor lançado em uma curva
Como funciona um teste? Valor de p
Teste T Utilizado para comparar duas médias, variáveis paramétricas, não relacionadas, duas amostras Obesos – 120, 113, 167, 100, 98, 76, 129, ... Média - 122 37 Pré diabéticos Não obesos – 98, 90, 100, 73, 200, 103, 78, ... Média – 98 13 Pré diabéticos T(Médias)
Teste F (ANOVA) Utilizado para comparar duas variâncias, variáveis paramétricas ou não, não relacionadas, K amostras Obesos – 120, 113, 167, 100, 98, 76, 129, ... Média - 122 37 Pré diabéticos Não obesos – 98, 90, 100, 73, 200, 103, 78, ... Média – 98 13 Pré diabéticos F(Variâncias)
Teste chi quadrado Utilizado para comparar duas categorias, variáveis paramétricas, não relacionadas, duas amostras Vários tipo de chi quadrado Ideia ->
Teste chi quadrado Utilizado para comparar duas categorias, variáveis paramétricas, não relacionadas, duas amostras Obesos – 120, 113, 167, 100, 98, 76, 129, ... Média - 122 37 Pré diabéticos Não obesos – 98, 90, 100, 73, 200, 103, 78, ... Média – 98 13 Pré diabéticos X2(Categorias)
Intervalo de confiança As medidas de tendência central apresentam valores que podem assumir até um certo limite com uma certa confiança O limite mais utilizado é o de 95% Médias 122 (IC 95% 110 – 134) Médias 98 (IC 95% 86 – 110)
Inferência estatística Generalizar uma proposição retirada de uma amostra para uma população. Critérios de causalidade; Viéses.
População Conjectura (hipótese) sobre o comportamento de variáveis Amostra Resultados reais obtidos Inferência estatística Decisão sobre a admissibilidade da hipótese
Probabilidade da estatística do teste acusar um resultado tão (ou mais) distante do esperado quanto o resultado ocorrido na amostra observada. Pode ser compreendida como a probabili-dade do desvio observado ter ocorrido por acaso se a hipótese nula for verdadeira. Probabilidade de Significância (ps) – Valor de p
Valor esperado se Ho for verdadeira Valor observado na amostra ocorreu por acaso? (Ho verdadeira) Desvio Observado Desvio ocorreu porque Ho é falsa ?
A amostra apresentou 10 caras. Sep = 0,5, a probabilidade da amostra apresentar X = 10 (ou X=0) caras é: Situação 1
Situação 1 0.246 0.205 0.205 0.117 0.117 0.044 0.044 0.01 0.01 0.001 0.001 X 0 1 2 3 4 5 6 7 8 9 10 ps = 0,002 ou 0,2%
ps = 0,2% (probabilidade do desvio ter ocorrido por acaso) Qual seria a conclusão? Rejeita-se Ho, ou seja, não se admite que o desvio tenha ocorrido por acaso. Conclusão...
A amostra apresentou 7 caras. Sep = 0,5, a probabilidade da amostra apresentar X = 7 ou mais (ou X=3 ou menos) caras é: Situação 2
Situação 2 0.246 0.205 0.205 0.117 0.117 0.044 0.044 0.01 0.006 0.001 0.001 X 0 1 2 3 4 5 6 7 8 9 10 ps = 0,344 ou 34,4%
ps = 34,4% (probabilidade do desvio ter ocorrido por acaso) Qual seria a conclusão? Aceita-se Ho,ou seja, não se pode afirmar que o desvio não tenha ocorrido por acaso. Conclusão...
Se a probabilidade do desvio ter ocorrido por acaso for considerável (ps alta), não há evidências para se rejeitar Ho. Aceita-se Ho. Quando a probabilidade do desvio ter ocorrido por acaso for considerada pequena (ps baixa), há evidências para a rejeição de Ho. Rejeita-se Ho. Decisão
O nível de significância () é o limite para a probabilidade de significância a partir do qual se passa a rejeitar a hipótese nula do teste. Representa a probabilidade tolerável de se rejeitar Ho quando esta for verdadeira. Os valores mais comuns para o nível de significância são 5%, 10% e 1%. VALOR DE P
Critérios de causalidade Força de associação (maior proporção de imc elevado e pré-diabetes) Consistência ( Se repetido o estudo, encontra-se o mesmo resultado) Especificidade (todos os imc elevados teriam pré-diabetes) Temporalidade (primeiro vem o imc alto, depois a pré-diabetes)
Critérios de causalidade Gradiente biológico (Maior imc, maior glicemia de jejum) Plausibilidade (Faz sentido relacionar imc e pré-diabetes?) Coerência (Existe teoria que contradiz?) Evidência experimental (Se engordarmos uma pessoa ela adquire pré-diabetes?)
Viéses Decorre do fato de não se utilizar a população inteira Viés de seleção Viés de estimativa Viés de financiamento
Obrigado! Dúvidas ou sugestões? hermanoalexandre@gmail.com