370 likes | 471 Views
Estudo das Concentrações de Partículas Inaláveis na Região Metropolitana do Rio de Janeiro. Marina Silva Paez marina@dme.ufrj.br Dani Gamerman dani@im.ufrj.br. Instituto de Matemática Universidade Federal do Rio de Janeiro Brasil.
E N D
Estudo das Concentrações de Partículas Inaláveis na Região Metropolitana do Rio de Janeiro Marina Silva Paez marina@dme.ufrj.br Dani Gamerman dani@im.ufrj.br Instituto de Matemática Universidade Federal do Rio de Janeiro Brasil Palestra no 9oSimpósio de Estatística Aplicada à Experimentação Agronômica e 46a Reunião Anual da Região Brasileira da Sociedade Internacional de Biometria ESALQ - USP Piracicaba, SP - 09 a 13 de Julho 2001
Apresentação • Descrição do Problema • Análise exploratória dos dados • Revisão metodológica • Resultados obtidos • Conclusão
Qualidade do ar na Região Metropolitana do Rio de Janeiro Região afetada por fontes de poluição móveis e estacionárias. A concentração de poluentes varia de acordo com as características topográficas, distâncias das fontes poluidoras, e condições de circulação do ar. As peculiaridades meteorológicas da região contribuem para o problema.
Localização dos postos de monitoramentono mapa do Rio de Janeiro 1 - Bonsucesso 2 - Botafogo 3 - Caxias 4 - Centro 5 - Sumaré 6 - Copacabana 7 - Inhaúma 8 - Itaguaí 9 - Jacarepaguá 10 - Maracanã 11 - Nova Iguaçú 12 - Nilópolis 13 - Niterói 14 - São Cristóvão 15 - São Gonçalo 16 - São João de Meriti A Campanha de Monitoramento Amostragem da qualidade do ar em 16 pontos distribuídos pela Região Metropolitana, em 1999.
1 - Bonsucesso 2 - Botafogo 3 - Caxias 4 - Centro 5 - Sumaré 6 - Copacabana 7 - Inhaúma 8 - Itaguaí 9 - Jacarepaguá 10 - Maracanã 11 - Nova Iguaçú 12 - Nilópolis 13 - Niterói 14 - São Cristóvão 15 - São Gonçalo 16 - São João de Meriti Localização dos postos de monitoramentono mapa do Rio de Janeiro • Bonsucesso, Inhaúma, e Jacarepaguá - emissões derivadas de veículos e indústrias. • Botafogo, Centro e Copacabana - emissões, em grande parte, provenientes de veículos; • Estações mais afastadas - Nova Iguaçú e São Gonçalo; • Itaguaí e Sumaré - “background” de superfície e altura.
Dados Analisados 1. Concentração de partículas PM10 (g/m3) ao longo do tempo • 16 postos de monitoramento; • medições feitas de janeiro a dezembro, a cada seis dias, no ano de 1999; • 59 períodos de tempo no total; • grande quantidade de dados omissos;
2. Temperatura máxima diária • Temperatura ambiente com base horária obtida através das informações meteorológicas de superfície do Aeroporto do Galeão. • Trabalhamos com a temperatura máxima diária
Média por estação Estatísticas descritivas Análise exploratória no espaço De acordo com a Conama, Br padrão primário - média anual: 50 padrão primário - média diária: 150 nível de atenção: 250 nível de alerta: 420 nível de emergência: 500
Ordenada por latitude Ordenada por longitude Orientação nas coordenadas espaciais da concentração de PM10
Verificação de normalidade Níveis de concentração Log dos níveis Raiz quadrada dos níveis
Análises preliminares Variável explicativa Yit - raiz quadrada do nível de concentração observado no posto i e tempo t.i=1,...,16t=1,...,59Vamos supor Yit’s normalmente distribuídos: Yit ~ N(mit ,s2) • Especificação da média mitVariáveis explicativas:- dia da semana (SEG, TER, QUA, QUI, SEX, SAB)- função polinomial das coordenadas espaciais latitude e longitude (LAT,LONG,LAT2,LONG2,LATLONG)- temperatura máxima diária (TEMP)
Resultados Foram significativas a nível de 5%:- SEG, QUA, QUI, SEX- LAT,LAT2, LONG,LONG2,LATLONG- TEMP A diferença entre a influência do dia da semana nos diferentes postos não foi significativa A diferença entre as influências da temperatura nos diferentes postos foi significativa em três postos
sem efeito espacial na média com efeito espacial na média Correlação estimada - muito disperso - existem correlações bem altas entre postos próximos, o que ocorre com pouca freqüência entre postos mais afastados. - Muitos postos próximos, no entanto, apresentam correlações bastante baixas.
onde Usualmente supomos Revisão Metodológica: modelo de regressão linear
Definição do modelo para e : ondent’s são independentes com distribuição N(0,sn2). Erros autoregressivos no tempo A autocorrelação dos erros geralmente está presente em dados de séries temporais. et’ssão correlacionados no tempo Notação: e ~ ART(r)e ~ ART(1) define estrutura não estacionária
São uma generalização dos modelos AR temporais. et’ssão correlacionados no espaço Definição do modelo para e : com onde Erros autoregressivos no espaço w ´s informam sobre vizinhança espacial. Notação: e ~ ARE(w).
é um local no plano. S(z ) - variável aleatória S no local z. Modelo Gaussiano • A distribuição conjunta de S(z1), ..., S(zn) é normal multivariada: (S(z1), ..., S(zn)) ~ N(m , sq2r(.)) r (u)define uma matriz positiva definida.r (u) quando u Modelos Geoestatísticos r(.) é função de z1 , ..., zn Estacionariedade: r(.) é função apenas de (zi- zj ). Isotropia: r(.) é função apenas de u= |zi- zj|.
Modelos isotrópicos mais comuns quando a = 1 temos a função de correlação exponencialquando a = 2 temos a função de correlação gaussiana Onde f e a são parâmetros e Ka(.) denota a função de Bessel modificada do tipo três e ordem a. Família esférica (Wackernagel, 1995) Família exponencial de potência (De Oliveira et al., 1997) Família Matérn (Matérn, 1986)
Yit ~ N(mit ,s2) onde mit = b0+ X’t b + qi + ft Xt = (TEMP, SEG, TER, QUA, QUI, SEX, SÁB) qi - componente espacial ft - componente temporal Modelos especificados para os níveis de concentração de partículas inaláveis
Especificações para q = (q1, ..., q16)A. qi = d1LATi + d2LONGi + d3LATLONGi + d4LAT2i+ d5LONG2iB. qi = d1LATi + d2LONGi + d3LATLONGi + d4LAT2i+ d5LONG2i+ eqieqi são independentes N(0,sq2) C. q ~ARE (w)D. q ~N(0, sq2r (.))r (.) é da família exponencial de potência com a = 1. Especificações para f1. ft = 02. ft são independentes N(0,sf2) 3. f ~ART (1)4. f ~ART (r)- Prioris vagas para os hiperparâmetros
Comparação de modelos Função Desvio - Corresponde à soma dos quadrados dos resíduos para o modelo normal. Indica quão bem os dados se ajustam ao modelo, sendo quanto menor melhor o ajuste. Não pune modelos superajustados. Estatística D(m) - Gelfand e Ghosh (1998) sugerem uma estatística que considera a bondade de ajuste, mas pune pelo excesso de parâmetros.
Comparação dos coeficientes d para os modelos A4 e B4 - Estimativas similares na média- Intervalos bem maiores sob o modelo B4- Apenas LONG é significativo sob B4
Comparação dos coeficientes b para os modelos C (ARE) - Efeitos similares na média exceto para TEMP- Intervalos maiores sob o modelo C2- QUI e SEX são significativos sob todos os modelos
Comparação dos coeficientes b para os modelos 4 (ART) - Intervalos similares- TER, QUA e SAB não são significativos
Comparação da média estimada ao longodo tempo pelos modelos C (ARE) - Médias bem ajustadas exceto pelo modelo C1- Estimativas subestimaram picos nos meses de março e agosto
Comparação da média estimada ao longo do espaço pelos modelos 4 (ART) - Médias bem ajustadas exceto pelo modelo A4
Interpolação Espacial • Zn = níveis de PM10 para pontos da grade em um dado período de tempo • Yn = raiz quadrada dos níveis de PM10 para pontos da grade em um dado período de tempo • dimensão (Zn) = dimensão (Yn) = I*J
Interpolação Bayesiana • 1. Gerar Y de via MCMC (usando BUGS) • 2. Gerar Ymis de usando independência condicional • 3. Gerar Yn de usando teoria normal • y- todos os parâmetros do modelo • Ymis - dados omissos, tratado como parâmetro • Obtemos P(Yn|Yobs)via simulação. • Passos para a geração de Yn|Yobs : • Construimos Zn = (Yn) 2
Conclusões - A inclusão de uma componente aleatória no tempo melhorou o ajuste do modelo consideravelmente. - Os modelos com erros autoregressivos no tempo estacionários foram os melhores segundo a estatística D(m). - Os modelos fixos no espaço tiveram um desempenho muito pior que os demais modelos. - Pela estatística D(m), modelos com erros independentes no espaço são piores que os modelos com estrutura autoregressiva e geoestatística.
Possíveis extensões - Considerar outras variáveis meteorológicas como explicativas. - Especificar outras estruturas de covariância para os erros da componente espacial, e trabalhar sob a hipótese de anisotropia dos mesmos. (Ver a apresentação da Alexandra Schmidt) - Especificar modelos dinâmicos temporais com estruturas mais elaboradas que as utilizadas nesse trabalho.
Principais Referências DIGGLE, P.J. e RIBEIRO JR, P.J. (2000) Model Based Geostatistics, 14o Simpósio Nacional de Probabilidade e Estatística. Caxambú. Associação Brasileira de Estatística (ABE).Fundação Estadual de Engenharia do Meio Ambiente (FEEMA), Deutsche Gesellschaft für Technicshe Zusammenarbeit (GTZ) GmbH, Dr. Krätzig Ingenieurgesellschaft mbH, Aachen RFA. e Universidade Federal do Rio de Janeiro (UFRJ) (1995). "Qualidade do Ar na Região Metropolitana do Rio de Janeiro".GAMERMAN, D. (1997). Markov Chain Monte Carlo: stochastic simulation for bayesian inference. Londres: Chapman & Hall. 192-211.GELFAND, A.E. e GHOSH, S.K. (1998). Model choice: A minimum posterior predictive loss approach. Biometrika, 85, 1-11.THOMAS, A., SPIEGELHALTER, D.J., e GILKS, W.R. (1992). BUGS: A program to perform Bayesian inference using Gibbs Sampling, in J.M.Bernardo, J.O.Berger, A.P.Dawid, and A.F.M. Smith (editors), Bayesian Statistics 4, 837-842, Oxford University Press.
Estudo das Concentrações de Partículas Inaláveis na Região Metropolitana do Rio de Janeiro Marina Silva Paez marina@dme.ufrj.br Dani Gamerman dani@im.ufrj.br Instituto de Matemática Universidade Federal do Rio de Janeiro Brasil Apresentação disponível na página http://acd.ufrj.br/~dani/papers/9seagro.ppt