1 / 70

Estatística em Medicina ( Estatística Fisiológica e Bayes: Darwin, Neurônios, Freud)

Estatística em Medicina ( Estatística Fisiológica e Bayes: Darwin, Neurônios, Freud) Basílio de Bragança Pereira DP/HUCFF, FM e COPPE. Estatística. Um assunto que a maioria dos estatísticos acha difícil porem que quase todos os médicos são especialistas. Estatísticos são vistos como:

ember
Download Presentation

Estatística em Medicina ( Estatística Fisiológica e Bayes: Darwin, Neurônios, Freud)

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Estatística em Medicina (Estatística Fisiológica e Bayes: Darwin, Neurônios, Freud) Basílio de Bragança Pereira DP/HUCFF, FM e COPPE

  2. Estatística Um assunto que a maioria dos estatísticos acha difícil porem que quase todos os médicos são especialistas.

  3. Estatísticos são vistos como: • Desnecessários: alguém que sabe usar pacotes estatísticos. • Técnicos necessários: digitadores de números. • Demônios necessários: a benção do estatístico é necessária para publicação. • Mágicos necessários : pode obter significância manipulando os dados (Lies, Damn lies, and Statistics – Disraeli).

  4. Ou como: • Deus: Salvador, responde as rezas. • Bispo: Abençoa, ouve aos pecados. • Padre : Companheiro. • Sacristão: Servo, faz o que é mandado.

  5. Estatístico como colega: • Coletando informação adequadamente. • Interpretando informação adequadamente. • Analisando informação adequadamente. • Podendo pescar ou ensinar como pescar. • Estar disposto a ensinar os conceitos atrás da metodologia. • Precisa ter um conhecimento da área de aplicação para ser um consultor eficiente.

  6. Efeito da revolução do computador: • Liberou os cálculos cansativos • Facilita a análise exploratória de dados • Permite trabalhar com grande massa de dados • Permitiu trabalhar com métodos multivariados complexos • Permite o uso de métodos computacionalmente intensivos • Permite a possibilidade de estudar convergência assintótica e revolucionou o ensino • Sistemas computacionais comerciais: caros , tornando-se inviável Sistemas gratuitos: • Sistema R • WinBugs • Etc.

  7. Desenvolvimento histórico: Começo do século 20 (antes de 1950): • Aplicações a agricultura • Modelos paramétricos (Gaussianos) • Univariados Anos 1960-1980: • Aplicações biomédicas • Modelos lineares • Multivariado Anos após 1990 e século 21: • Genética • Métodos computacionais intensivos, não lineares, modelos robustos • Modelos longitudinais, multidimensionais , complexos: Exemplos: tese de doutorado da Clinica Medica (CART) e da COPPE (redes neurais) desenvolvida na UPT – Unidade de Pesquisa de Tuberculose do HUCFF- Premios 2002 e 2004 de Ciência e Tecnologia do SUS.

  8. Interação: Como? Por que?

  9. Como? Estatística Fisiológica (David Sackett, 2001) Em virtude da Estatística muito freqüentemente ser apresentada como uma caixa de ferramentas computacionais especializadas, com ênfase mórbida em cálculos, não é surpresa que os sobreviventes de tal exposição considerem as ferramentas estatísticas como instrumentos de tortura e não como ferramentas diagnósticas na ciência e arte de análise de dados. (George Cobb) Mesmo hoje, o jovem pesquisador prático-clínico que vem para os nossos Workshops continua achando difícil, se não impossível visualizar a floresta prática entre as árvores estatísticas.

  10. Dificuldades com as diversas fórmulas estatísticas para o clínico-futuro-realizador de um ensaio clínico: Causas: • Elas assustam e dão medo de usar • Elas são difíceis de lembrar • Elas requerem um conhecimento de matemática e estatística muito longe do conhecimento e experiência do clínico (would-be-trialist) • O tempo necessário para entender suas nuances será feito às expensas de manter competência clínica, vida social, uma auto-imagem positiva e um senso de humor • Elas existem isoladas e sem relação com cada uma das outras (Tenha cuidado com o homem que trabalha duro para aprender algo , aprende , e no final não está mais competente do que antes. Ele está cheio de re-sentimento criminoso com as pessoas que não são competentes, mas que não chegaram à sua situação da maneira difícil).

  11. Solução e uma introdução a Estatística Fisiológica: Esqueça as fórmulas (eu sei menos fórmulas hoje do que quando planejei meu primeiro RCT em 1963) Nunca trabalhe sozinho, porém sempre com um estatístico (a grande maioria de clínicos que eu encontrei sabem suficiente estatística para arranjar problemas, porém não o suficiente para sair deles) Empregue “estatística fisiológica”: A importância das formulas estatísticas não esta na sua individualidade mas sim na sua combinação criteriosa. Clínicos as entenderão bem melhor se pensarem nelas em termos fisiológicos, análogos a combinar os determinantes do sistema sanguíneo de pressão arterial.

  12. A única formula da estatística fisiológica é ridiculamente simples: Diferença entre os efeitos do tratamento experimental e do controle Quão curto é o intervalo de confiança Nº de pacientes na amostra Soma de todos os fatores que podem afetar o sinal (Incerteza)

  13. e se for Bayesiano P(θ / X) α P(θ)P(X / θ)

  14. Duas Culturas Cultura de Modelagem dos Dados Cultura Algorítmica Estatística:Teoria em busca de dados Data Mining:Dados em busca de teoria

  15. Exemplos

  16. TIPOS DE INDEPENDÊNCIA: a) Quando existe três variáveis totalmente independentes (ex.:cor do cabelo, PA, sexo masculino); b) Variáveis conjuntamente independentes (ex.: sal e hipertensão arterial – cor do cabelo) c) Duas variáveis independentes quando condicionadas a uma terceira (ex.: peso, altura|adulto); d) Dependência mútua (ex.:sal, PA e raça negra)

  17. S S S

  18. DV IC ECG DNS sexo idade AcM2 Fonte: SDM/ HUCFF (2003-2005) Figura 1: Representação gráfica das relações entre as variáveis pelo teste qui-quadrado. Linhas cheias representam os valores de p <0,05, as tracejadas os valores de p ≥0,05 e ≤0,10 e as pontilhadas os valores de p >0,10 e <0,16. AcM2: anticorpos com ação agonita de receptores muscarínicos M2; DNS: disfunção do nódulo sinusal; ECG: eletrocardiograma alterado; DV: disfunção ventricular; IC: insuficiência cardíaca. Tabela 2x2

  19. ECG λ=1,5 AcM2 DNS DV IC λ=1,9 λ=1,5 λ=1,3 Fonte: SDM/ HUCFF (2003-2005) Figura 2: Representação do modelo log linear demostrando as relações de interdependência entre as variáveis estudadas. Os valores numéricos (λ) correspondem ao estimador da força da relação entre as variáveis. AcM2: anticorpo com ação agonista de receptores muscarínicos M2; DNS: disfunção do nódulo sinusal, DV: disfunção ventricular, ECG: eletrocardiograma alterado, IC: clínica de insuficiência cardíaca. Modelo log linear

  20. 2) Análise de Correspondência Resistência de bactérias ao antibióticos

  21. A interpretação de CA na Estatística fisiológica • Análise de Correspondência-é uma representação gráfica e das interações entre modalidades (ou categorias ) de duas variáveis categóricas Ela permite a descoberta visual e interpretação destas interações, isto é do distanciamento da independência entre as duas variáveis • CA não e muito diferente de PCA , os fatores são definidos de forma a ter uma uma representação 2D das modalidades como pontos nos planos de fatores com menos distorções possíveis • Nesses planos fatoriais, espera-se que as distancias sejam indicativas das tendências das modalidades se atraírem ou se repelirem entre si • Por exemplo se 2 variáveis são: X com 3 modalidade X1, X2, X3 e Y com 2 modalidades Y1, Y2 então se X1 esta perto de Y2 isto é uma indicação de que mais observações escolheram o par (X1,Y2) do que a hipótese de independência entre X e Y nos levaria a esperar • CA também interpreta distancias entre duas modalidades da mesma variável em termos de similaridade de suas composições cruzadas com as modalidades da outra variável. • A descrição matemática de CA ´e um pouco complicada , e interpretação do diagrama de CA e um pouco de magia negra, porém apoiada por uma metodologia bem definida. De qualquer forma CA é uma ferramenta poderosa para uma rápida e relativamente segura interpretação de uma tabela de contingência grande.

  22. where the n-dimensional point is X = (x1,x2,….., xn) The function is usually plotted in the interval - Pi < t < Pi. This is similar to a Fourier transform of a data point. One advantage of this visualization is that it can represent many dimensions. A disadvantage is the computational time to display each n-dimensional point for large datasets. 3) Visualização ) Andrew’s Plot Andrews’ curves plot each N-dimensional point as a curved line using the function

  23. Iris Data

  24. Alterações Eletrocardiográficas 0 – Não cardiopata 1 – Cardiopata

  25. B) Testes de Significância e Testes Diagnósticos Tabela 1 – Resultado de teste diagnóstico

  26. Quantidades Associadas • p(T+/D+) = a/(a+b) = S – sensibilidade • p(T-/D-) = d/(c+d) = E – especificidade • p(D+) = (a+b)/N = prevalência • p(T+) = (a+c)/N = positividade do teste • p(T-) = (b+d)/N = negatividade do teste • p(D+/T+) = a/(a+c) = VPP – valor preditivo positivo • p(D-/T-) = d/(b+d) = VPN – valor preditivo negativo

  27. Tabela 2 – Decisões e erros de teste de hipótese

  28. Tabela 3 – Analogias: teste diagnóstico x teste de hipóteses

  29. C)Verossimilhança • Na inferência estatística, em geral, temos um conjunto de dados e queremos fazer afirmações sobre plausibilidade relativa de valores diferentes de um parâmetro da população

  30. Exemplo • Um determinado medicamento em teste foi utilizado em 10 pacientes, deste 7 ficaram curados • Se soubermos a eficácia p.ex (= 0,7) podemos calcular a probabilidade de obter x curas em 10 pacientes • O problema é que a real eficácia (π) deste medicamento é desconhecida e então definimos a função de verossimilhança. • O valor da verossimilhança de cada valor de π é:

  31. Estimador de máxima verossimilhança Verossimilhança de π

  32. Razão de Verossimilhança • Corresponde a quantas vezes um determinado valor é mais plausível que outro. • Exemplo: π=0,7 ou π=0,5

  33. C)Inferência Bayesiana • O Teorema de Bayes transforma a crença prévia (distribuição a priori, prevalência antes do teste, risco inical) através da verossimilhança (dados, resultado do teste) em uma crença posterior (distribuição a posteriori, prevalência após resultado do teste).

  34. Exemplo • Vamos considerar o mesmo caso do remédio experimental. • Mas temos 6 médicos com crenças prévias na eficiência do remédio • Temos uma distribuição a priori a eficiência (π) do remédio

  35. Estimador de máxima probabilidade posterior • A verossimilhança seria a experiência onde 7 de 10 ficaram curados • Com isto a distribuição a posteriori da eficiência (π) do remédio é:

  36. Darwin Equivalência Entre o Princípio Darwiniano e o Teorema de Bayes

More Related