510 likes | 650 Views
Taxas em pequenas áreas : uma abordagem bayesiana. Análise Espacial - INPE. Ilka Afonso Reis. Quanto menor o n o. esperado de casos, maior a variabilidade na estimação . Taxas em pequenas áreas . y i é o número de casos da “doença” na área i ;
E N D
Taxas em pequenas áreas : uma abordagem bayesiana Análise Espacial - INPE Ilka Afonso Reis
Quanto menor o no. esperado de casos, maior a variabilidade na estimação Taxas em pequenas áreas • yié o número de casos da “doença” na área i ; • ei é o número esperado de casos da “doença” na área i ; • ρi é o risco relativo (desconhecido) da “doença” em relação à taxa de referência ; (padronização) • Taxa bruta :
Qual é o problema com taxas brutas ? • Suponha uma “doença” com r = 0,10 e acontece um caso em cada área (y = 1) • Se Pop1 = 10000, e1 = 0,10 x 10000 = 1000 • Se Pop2 = 1000, e2 = 0,10 x 1000 = 100 • Se Pop3 = 100, e3 = 0,10 x 100 = 10 p1=1/10000 = 0,0001 e Var(p1) = 1/100002 = 1 x 10-8 p2=1/1000 = 0,001 e Var(p2) = 1/10002 = 1 x 10-6 p3=1/100 = 0,01 e Var(p3) = 1/1002 = 1 x 10-4
Qual é o problema com taxas brutas ? Taxa bruta Taxa suavizada
Solução para o problema das taxas brutas • Suavizar as taxas • Como ? • Estimadores Bayesianos • Empíricos • Completos
Uma Breve Introdução à Inferência Bayesiana Probabilidade Condicional Teorema de Bayes Verossimilhança Probabilidade a priori Probabilidade a posteriori
Positivo (+|D) Doente (D) Negativo (-|D) Positivo (+|S) Sadio (S) Negativo (-|S) Um exemplo : medidas de qualidade de testes diagnósticos
Especificidade (e) Avaliação da qualidade do teste Acertos : • Entre os doentes Sensibilidade (s) • Entre os sadios
Valor de Predição Negativa (VPN) Avaliação da qualidade do diagnóstico Acertos : • Entre os positivos Valor de Predição Positiva (VPP) • Entre os negativos
Regra de Bayes Avaliação da qualidade do diagnóstico
Probabilidade a priori “Verossimilhança” Probabilidade a posteriori Enfim ...
Conceitos Básicos e Notação • Dados : provenientes de uma amostra da população de interesse • y = (y1, y2, ..., yn) • P(y), distribuição de probabilidade conjunta de y. • Parâmetros: quantidades, em geral desconhecidas, que estão presentes nos modelos probabilísticos para y e serão representadas por. • P(y|), função de verossimilhança de y.
Exemplo : estimação de taxas • yi , casos da “doença” na área i • ei , número de casos esperados na área i segunda a taxa de referência • Parâmetros a serem estimados • ρi : o risco relativo (desconhecido) da “doença” em relação à taxa de referência • eiρi representa o número de casos esperados (média) na área i • Na inferência clássica, boas estimativas para ρi são os valores que maximizam a função de verossimilhança P(y|ρi ). Estes valores são a estimativa de máxima verossimilhança • O modelo para os dados é a função de verossimilhança P(y|). • Modelo : yi ∼ Poisson(eiρi)
O Método da Máxima Verossimilhança • Na inferência clássica, os parâmetros de um modelo são tratados como quantidades fixas (não aleatórias), porém desconhecidas. • O método da máxima verossimilhança é considerado bom em muitos casos. • Porém, quando a forma de P(y|) é complexa e/ou quando o número de parâmetros envolvidos é grande, este método torna-se difícil de implementar.
A abordagem Bayesiana • Na inferência Bayesiana, os parâmetros são tratados como quantidades aleatórias. • O modelo estatístico não é mais somente P(y|) e sim P(y,), a distribuição conjunta dos dados y e dos parâmetros . • As estimativas para não serão somente valores, mas sim uma distribuição de probabilidades. P(|y) é a distribuição de probabilidades dos parâmetros “ à luz” dos dados y.
Pela Regra de Bayes Probabilidade a priori Verossimilhança Probabilidade a posteriori A abordagem Bayesiana • Como obter P(|y) ?
A abordagem Bayesiana • P() expressa a incerteza sobre antes de observarmos os dadosy que dependem dele (a priori) . • P(|y) expressa a incerteza sobre depois de observarmos os dados y que dependem dele (a posteriori). • De posse de P(|y), podemos examinar qualquer aspecto de (média, variância, percentis, probabilidade de assumir determinados valores, etc.) (“Full Posterior Distribution”)
Passos para obtenção de P(|y) • Escolher um modelo probabilístico para P(y|) – a função de verossimilhança; • Escolher um modelo probabilístico para P() – a distribuição a priori ; • Aplicar a regra de Bayes e calcular P(|y).
Modelo para P(y|) : y ~ Poisson (e) Exemplo : modelo Gamma-Poisson • y é o número de casos da “doença” em certa área ; • eé o número esperado de casos da “doença” em certa área; • ρ é o risco relativo (desconhecido) da “doença” em relação à taxa de referência nesta área;
hiperparâmetros Cálculo da posteriori P(|y) |y ~ Gamma ( +y , +e) Exemplo : modelo Gamma-Poisson Modelo para P() : ~ Gamma (,)
Exemplo : modelo Gamma-Poisson Suponha que y = 4 e e = 6.5 Priori´s :Gamma (0.5 , 0.5), Gamma (1,1) e Gamma (10,10) Posteriori´s :Gamma (4.5 , 7.0), Gamma(5,7.5) e Gamma(14,16.5)
Intervalo de Credibilidade de 95% Exemplo : modelo Gamma-Poisson
Quanto menor o no. esperado de casos, maior a variabilidade na estimação Modelo espacial bayesiano para taxas em pequenas áreas • Modelo geral • yi ∼ Poisson(µi) = Poisson(eiρi) • yié o número de casos da “doença” na área i ; • ei é o número esperado de casos da “doença” na área i ; • ρi é o risco relativo (desconhecido) da “doença” em relação à taxa de referência ; (padronização) • log µi = log ei + θi ; • θi denota o log do risco relativo (θi = log ρi , ou seja, ρi = exp(θi) ) • Modelo de efeitos fixos (máxima verossimilhança)
Qual é o problema com taxas brutas ? Taxa bruta Taxa suavizada
Qual é o problema com taxas brutas ? Taxa bruta Taxa suavizada
Qual é o problema com taxas brutas ? Taxa bruta Taxa suavizada
Modelo espacial bayesiano para taxas em pequenas áreas • Modelo de efeitos aleatórios • ρi ∼ Gamma(ψi, fi) µρ = ψi/fi e σ2ρ = ψi/fi2 ; • Gamma “+” Poisson “=” Gamma ; • P(ρi|y) ∼ Gamma(ψi+ yi, fi+ ei). • Quanto maior o número de dados, mais próximo de yi/ei estará a estimativa do risco relativo ; • Quanto menor o número de dados, mais próximo de ψi/fi estará a estimativa de risco relativo.
P(ρ, ψ, f|y) ∝ P(y|ρ)P(ρ|ψ, f)P(ψ)P(f) priori hiperprioris Exemplo: Mersey Modelo espacial bayesiano para taxas em pequenas áreas • Os parâmetros ψi e fi são os hiperparâmetros. • Como saber quem ψi e fi ? • Podem ser estimados (Bayes empírico) ; • Pode-se estabelecer uma distribuição a priori para ψ e φ (hiperprioris).
Modelo espacial bayesiano para taxas em pequenas áreas • Modelo espacialmente estruturado (abordagem completa) • yi ∼ Poisson(µi) = Poisson(eiρi) • log µi= log ei+ θi ; θi = log ρi • θi= α + fi + i , onde • α é o log do risco relativo médio sobre todas as áreas ; • fi é a parte não-espacialmente estruturada do log do risco relativo da área i ; (média zero) • i é a parte espacialmente estruturada do log do risco relativo da área i;
Modelo espacial bayesiano para taxas em pequenas áreas • Prioris : • α ~ Uniforme [- ; ] (“flat”) • fi ~ Normal (0 ; 2f) • A priori para νi é um modelo autoregressivo condicional Gaussiano (CAR) • wij são pesos representando a adjacência das áreas. A definição mais comum para wij são valores binários : • wij = 1, se as áreas i e j são adjacentes; wij = 0, caso contrário.
Modelo espacial bayesiano para taxas em pequenas áreas • Modelo completo • yi ∼ Poisson(µi) = Poisson(eiρi) • log µi= log ei+ α + i + i • α ~ Uniforme [- ; ] • i ~ Normal (0 ; 2) • νi ~ CAR(2) • Hiperprioris Gamma para τ= 1/ 2 e para τ= 1/2 (τ e τrepresentam a precisão) Exemplo: leishmaniose visceral (leish_inpe_spatial)
Modelo espacial bayesiano para taxas em pequenas áreas Leishmaniose Visceral Humana (BH – 1994/95) Taxa bruta Taxa bruta Taxa bruta Taxa suavizada Taxa suavizada Taxa suavizada
Modelo espacial bayesiano para taxas em pequenas áreas • Modelo espaço-temporal • yi ∼ Poisson(µi) = Poisson(eiρi) • log µi= log ei+ θi ; θi = log ρi • θi= α + i + i + 0t + it, onde • α , i e i são definidos como antes ; • 0 ~ Uniforme [- ; ] ei ~CAR(2) representam a parte temporal do modelo • Exemplo: leishmaniose visceral (leish_inpe_spatial_temporal)
Modelo espacial bayesiano para taxas em pequenas áreas Previsão para o quarto período Modelo: No. de parâmetros : 365 Tempo de simulação de 10000 iterações: 112 segundos AMD Athlon XP2000 1.67 GHz 512 Mb RAM
Modelo espacial bayesiano para taxas em pequenas áreas • Modelo espaço-temporal (alternativo) • yi ∼ Poisson(µi) = Poisson(eiρi) • log µi= log ei+ θi ; θi = log ρi • Modelo linear para θi • θi= α0 + αi + i (t-1), onde • α0 ~ Uniforme [- ; ] • αi ~ CAR(2α) e i ~ CAR(2β) são parâmetros de uma equação de regressão ; • Exemplo: leishmaniose visceral (leish_inpe_dissert)
Modelo espacial bayesiano para taxas em pequenas áreas Previsão para o quarto período Modelo linear No. de parâmetros : 243 Tempo de simulação de 10000 iterações: 51 segundos
Modelo espacial bayesiano para taxas em pequenas áreas • Modelo espaço-temporal (alternativo) • yi ∼ Poisson(µi) = Poisson(eiρi) • log µi= log ei+ θi ; θi = log ρi • θi= α0 + αi + i (t-1)+ i(t-1)2, onde • α0 , αi e i são definidos como antes ; • i ~CAR(2) ; • Exemplo: leishmaniose visceral (leish_inpe_dissert)
Modelo espacial bayesiano para taxas em pequenas áreas Previsão para o quarto período Modelo quadrático No. de parâmetros : 364 Tempo de simulação de 10000 iterações: 69 segundos
Referências Bibliográficas Assunção, R. M. ; Reis, I. A. ; Oliveira, C. L. Diffusion and Prediction of Leishmaniasis in a Large Metropolitan Area in Brasil with a Space-Time Model. Statistics in Medicine(2001), 20 : pp. 2319- 2335 Spiegelhalter, D. ; Thomas, A. ;Best, N. ;Lunn, D. WinBUGS User Manual , (References), version 1.4, (2003)
Pelo Método dos Momentos • Então Bayes Empírico • yi ∼ Poisson(µi) = Poisson(eiρi) • ρi ∼ Gamma(ψi, i) E[ρi] = ψi/i e Var[ρi] = ψi/i2 E[yi] = Eρ[Ey[yi| ρi]] = Eρ[eiρi] = eiψi/i Var [yi] = Eρ[Vary[yi| ρi]] + Varρ[Ey[ yi| ρi]] = eiψi/i + (ei)2 ψi/i2
Bayes Empírico • O que nos leva a • Igualando (1) e (2), temos
Padronização direta das taxas • r é taxa de referência da “doença”; • Popi é a população sob risco da área i ; • ei = rx Popi , é o número esperado de casos na área i ; • i é o risco da “doença” na área i ; • ρi = i / r é o risco relativo (desconhecido) da “doença” em relação à taxa de referência ; • eixρi = (rx Popi) x (i / r) = Popi xi ;
- < yi < , - < < > 0 , y = (y1, y2, ..., yn) y1, y2, ..., yn i.i.d Distribuição Gaussiana (Normal)