500 likes | 668 Views
Estatística Espacial Análise de Padrões de Distribuição de Pontos. INPE - Divisão de Processamento de Imagens. Organização. Introdução Distribuição de Pontos Caracterização de Distribuição de Pontos Estimador de Intensidade (“Kernel Estimation”) Modelagem de Distribuição de Pontos
E N D
Estatística EspacialAnálise de Padrões de Distribuição de Pontos INPE - Divisão de Processamento de Imagens
Organização • Introdução • Distribuição de Pontos • Caracterização de Distribuição de Pontos • Estimador de Intensidade (“Kernel Estimation”) • Modelagem de Distribuição de Pontos • Método do Vizinho Mais Próximo • Função K • Exemplos Práticos com o Sistema Spring Estatística Espacial - Análise de Padrões de Distribuição de Pontos
Introdução - preliminares • Consideramos aqui fenômenos expressos através de ocorrências pontuais. • São observações disponíveis no espaço. • Representações pontuais podem corresponder a dados como • índice de mortalidade, • ocorrências de doenças, • localização de espécie vegetais, etc. • Objetivo • aumentar o entendimento do processo verificando hipóteses viáveis ou inferir valores em áreas sem observações. Estatística Espacial - Análise de Padrões de Distribuição de Pontos
Introdução - preliminares A L G U N S E X E M P L O S • Epidemologia • A distribuição dos casos de uma doença formam um padrão no espaço ? Existe associação com alguma fonte de poluição ? Evidência de contágio ? • Crime • Roubos que ocorrem em determinadas áreas estão correlacionados com características sócio econômicas ? • Geologia • Dado um conjunto de amostras, qual a extensão de um depósito mineral ? Estatística Espacial - Análise de Padrões de Distribuição de Pontos
Introdução - preliminares Mapeando a violência - localização pontual Santos,S.M., 1999 Estatística Espacial - Análise de Padrões de Distribuição de Pontos
Clusters • “Cluster”: qualquer agregado de eventos. • resultado de classificação onde se busca definir um grupamento de “semelhantes”. • Cluster espacial • agregado de eventos no espaço ou a ocorrência de “taxas semelhantes” em área próximas. • Detecção de cluster espacial • estabelecer a significância de um sobre-risco em um determinado espaço ou tempo e espaço. Estatística Espacial - Análise de Padrões de Distribuição de Pontos
Clusters • O que causa um “cluster”? • Agentes infecciosos, contaminação ambiental localizada, efeitos colaterais de tratamentos, etc. • Os estudos • evidência de tendência geral à clusterização, ou a um determinado e predefinido agregado. • Podem ser usados para pontos ou áreas. • Fatores de controle: • distribuição populacional e outras covariáveis que podem criar agregados. Estatística Espacial - Análise de Padrões de Distribuição de Pontos
Conceitos Básicos • Estacionariedade • As propriedades estatísticas da variável independem de sua localização absoluta, ou seja, a média e a variância são constantes em qualquer sub-área e a covariância entre dois pontos quaisquer depende somente de sua localização relativa; • Isotropia • Além de estacionário, a covariância depende somente da distância entre os pontos e não da direção entre eles. • Processo de modelagem • Transformações visando obtenção de estacionariedade; • Ajuste de modelos. Estatística Espacial - Análise de Padrões de Distribuição de Pontos
Introdução - preliminares • Fenômeno espacial: contínuo ou discreto • Discreto - espaço contém entidades do mundo real • Na concepção Spring denominado de modelo de objetos • Exs: municípios, quadras, escolas, hospitais, etc... • Contínuo - informação presente em todas as posições • Na concepção Spring denominado de modelo de campo • Exs: temperatura, pressão, teor de argila no solo, etc... Estatística Espacial - Análise de Padrões de Distribuição de Pontos
Introdução - preliminares Problemas Típicos Tipos de Dados Exemplo Análise de Padrões Pontuais Eventos Localizados Ocorrência de Doenças Determinação de Padrões Análise de Superficies Amostras de Campo Depósito Minerais Interpolação de Superfície Relacionamento das entidades Regressão Análise de Áreas Entidades e Atributos Dados Censitários C L A S S E S D E P R O B L E M A S Estatística Espacial - Análise de Padrões de Distribuição de Pontos
Distribuição de Pontos • Padrão pontual - conjunto de dados consistindo de uma série de localizações pontuais (p1, p2, ...,pn) que estão associados a eventos de interesse dentro da área de estudo. • p1 • p2 • p3 • p1 Área de Estudo • p4 • p5 • p6 • p7 • p8 Estatística Espacial - Análise de Padrões de Distribuição de Pontos
Distribuição de Pontos Distribuições pontuais tem as seguintes características: • As localizações não estão associadas a valores, mas apenas a ocorrência dos eventos. • Dimensão das medidas é zero. Medidas válidas na distribuição de pontos são o # de ocorrências no padrão e as localizações geográficas. • Área dos eventos não é uma medida válida apesar de em muitos casos ocuparem espaço. • Entidades geográficas representadas como pontos no mapa são considerados de mesma qualidade. Estatística Espacial - Análise de Padrões de Distribuição de Pontos
Distribuição de Pontos - Estatísticas Descritivas • A distribuição de características pontuais pode ser descrita pela: • Frequência • Densidade • Centro Geométrico • Dispersão Espacial • Arranjo Espacial * • Com exceção do arranjo espacial, a avaliação das propriedades espaciais • pontuais pode ser realizada através de estatísticas descritivas básicas. Estatística Espacial - Análise de Padrões de Distribuição de Pontos
Distribuição de Pontos - Estatísticas Descritivas • Frequência:- # de características pontuais que ocorrem no mapa. • Nota:-A comparação de duas distribuição de frequência pode ser enganosa • se a área não é considerada. • Quando dois padrões de pontos que diferem na área são comparados, • é aconselhável compará-los pela densidade. • Densidade:- Frequência / Área • Centro Geométrico e Dispersão Espacial:- são medidas que caracterizam as • propriedades geográfica de um padrão de pontos. • Centro Geométrico = média das coordenadas de localização X e Y • Dispersão = desvio padrão de cada média (X e Y). Estatística Espacial - Análise de Padrões de Distribuição de Pontos
Distribuição de Pontos - Estatísticas Descritivas (12, 15) A B (0,0) C D • A figura abaixo apresenta quatro padrões de pontos (A, B, C e D). L O C A L I Z A Ç Õ E S ----------------------------------------------------------------------------------------- A BCD ----------------------------------------------------------------------------------------- (2, 7)(3, 6)(2,4)(3,4) ----------------------------------------------------------------------------------------- (3, 5)(4, 4)(3,10)(5,2) ----------------------------------------------------------------------------------------- (3, 6)(4, 5)(4,7)(5,8) ----------------------------------------------------------------------------------------- (3, 7)(4, 6)(5,2)(7,11) ----------------------------------------------------------------------------------------- (3, 8)(5, 4)(7,4)(8,5) ----------------------------------------------------------------------------------------- (4, 6)(5, 5)(7,6)(8,8) ----------------------------------------------------------------------------------------- (4, 7)(5, 6)(7,9)(9,2) ----------------------------------------------------------------------------------------- (4, 8)(5, 7)(10,2)(10,8) ----------------------------------------------------------------------------------------- (5, 6)(6, 4)(11,6)(12,2) ----------------------------------------------------------------------------------------- (5, 7)(6, 5)(11,10)(13,4) ----------------------------------------------------------------------------------------- (5, 8)(6, 6)(13,4)(13,6) ----------------------------------------------------------------------------------------- (5, 9)(7, 5)(13,8)(13,8) Estatística Espacial - Análise de Padrões de Distribuição de Pontos
Distribuição de Pontos - Estatísticas Descritivas (12, 15) A B (0,0) C D • A figura abaixo apresenta quatro padrões de pontos (A, B, C e D). Frequência = 12 em A, B, C, D Densidade = 180/12 em A, B, C, D Centro Geométrico CGa CGd CGb CGc Nota: CGa e CGb representam bem a tendência central porque ambas distri- buições estão concentradas em torno dos respectivos centros. Por outro lado, CGc e CGd não são bons indicadores para suas respectivas distribuições. Estatística Espacial - Análise de Padrões de Distribuição de Pontos
Distribuição de Pontos - Estatísticas Descritivas • Padrões de pontos com diferentes características de dispersão espacial x > y x < y 2x ~ 2y 2x ~ 2y (significante) (insignificante) Estatística Espacial - Análise de Padrões de Distribuição de Pontos
Distribuição de Pontos - Arranjos Espaciais • Uma característica importante de um padrão espacial é a localização dos pontos e • a relação entre eles. Isto tem um efeito significativo na distribuição dos padrões. • Objetivo : verificar se os eventos observados apresentam algum tipo de padrão sistemático, ao invés de estar distribuídos aleatoriamente. Aleatório Agrupado Regular • Na realidade o que se deseja é detectar padrões de aglomerados espaciais (“clusters”). • Base conceitual -> supor uma distribuição estocástica que serve de base para a hipótese de aleatoriedade. • No caso de pontos é usual utilizar a distribuição de Poisson. Estatística Espacial - Análise de Padrões de Distribuição de Pontos
Caracterização de Distribuição de Pontos • Processo de análise de pontos pode ser descritos em termos de : • Efeitos de Primeira Ordem • considerados globais ou de grande escala. • correspondem a variações no valor médio do processo. • Neste caso estamos interessados na intensidade do processo (No Eventos / Unidade de Área). • Efeitos de Segunda Ordem • denominados locais ou de pequena escala. • representam a dependência espacial no processo • A maior parte das técnicas de análise de distribuição de pontos supõe um comportamento isotrópico. Estatística Espacial - Análise de Padrões de Distribuição de Pontos
Caracterização de Distribuição de Pontos • Técnicas a serem abordadas : • Para Efeitos de Primeira Ordem • Estimador de Intensidade (“Kernel Estimation”) • Para Efeitos de Segunda Ordem • Vizinho mais Próximo • Função K Estatística Espacial - Análise de Padrões de Distribuição de Pontos
Estimador de Intensidade (“Kernel Estimation”) • Segundo (Bailey e Gatrell, 1995): Onde: • A função I( ) -> FDP, escolhida de forma adequada para construir uma superfície contínua sobre os dados. • O parâmetro denominado “largura de faixa”, controla o amaciamento da superfície gerada. • Srepresenta uma localização qualquer na área de estudo e Si são as localizações dos eventos observados. • n representa o número de eventos. Estatística Espacial - Análise de Padrões de Distribuição de Pontos
Estimador de Intensidade (“Kernel Estimation”) • Uma função muito utilizada para I() é: onde: • h representa a distância entre a localização em que desejamos calcular a função e os eventos observados. • Assim o estimador de intensidade pode ser expresso como: onde: • hi é a distância entre o ponto a calcular S e o valor observado Si. Estatística Espacial - Análise de Padrões de Distribuição de Pontos
Estimador de Intensidade (“Kernel Estimation”) • A Figura abaixo ilustra a idéia do estimador de intensidade kernel S t Si hi Estatística Espacial - Análise de Padrões de Distribuição de Pontos
Estimador de Intensidade (“Kernel Estimation”) Observações • Efeito da Largura de Faixa (t) Banda estreita t Banda larga Estatística Espacial - Análise de Padrões de Distribuição de Pontos
Estimador de Intensidade (“Kernel Estimation”) • Uma visão do Kernel no Sistema SPRING Plano de Informação (PI) Grade de Intensidade Superfície de saída Observações kernel Ponto a ser estimado Estatística Espacial - Análise de Padrões de Distribuição de Pontos
Estimador de Intensidade (“Kernel Estimation”) • Exemplo: Mapeando a violência na cidade de Porto Alegre - RS. Kernel Santos,S.M., 1999 Estatística Espacial - Análise de Padrões de Distribuição de Pontos
Vizinho mais próximo • Kernel • explorar a variação da média do processo na região de estudo - propriedade de primeira ordem • Propriedades de segunda ordem • distâncias entre os eventos • Dois tipos de distâncias: • evento-evento (W) e ponto aleatório-evento (X) • Função empírica • histograma das distâncias para o vizinho mais próximo - cada classe do histograma é uma contagem de eventos que ocorrem até aquela distância Estatística Espacial - Análise de Padrões de Distribuição de Pontos
Vizinho mais Próximo • O método do vizinho mais próximo estima a função de distribuição • cumulativa ( ) baseado nas distâncias entre eventos em uma • região de análise. • Pode ser estimado empiricamente por: onde: • w distância de entrada • wi distância entre eventos • n número de eventos • A plotagem dos resultados de em relação as distâncias, pode ser • utilizado como um método exploratório para verificar se existe evidência • de interação entre os eventos. Estatística Espacial - Análise de Padrões de Distribuição de Pontos
Método - Vizinho mais Próximo Baseado na distância mínima entre os pontos 1 distância distância mínima 2 distância 3 distância Estatística Espacial - Análise de Padrões de Distribuição de Pontos
Método - Vizinho mais Próximo w mín. máx. 1 2 3 4 5 6 7 8 9 no intervalos 1 Distância entre eventos 0 w 0 • Na prática a distância de entrada w está compreendida entre um valor • mínimo e máximo estabelecido pelo usuário.Além disso, deve-se definir • também o número de intervalos desejados (Ex: com 9 intervalos). Estatística Espacial - Análise de Padrões de Distribuição de Pontos
Método - Vizinho mais Próximo • Análise exploratória de padrões de distribuição de pontos utilizando 1 0 w 0 1 0 w 0 Estatística Espacial - Análise de Padrões de Distribuição de Pontos
Teste de Significância • Teste de Significância • comparar com distribuições teóricas ou simulações querepresentem a “Completa Aleatoriedade Espacial” • A hipótese de CAE • evento segue um processo de Poisson homogêneo sobre a região estudada, • Outras modelos • processo de Poisson heterogêneo, processo de Cox, etc. Estatística Espacial - Análise de Padrões de Distribuição de Pontos
Método - Vizinho mais Próximo • A significância do resultado da análise exploratória, do padrão de • distribuição de pontos, utilizando o método vizinho mais próximo pode ser • avaliada através de um modelo teórico denominado Aleatoriedade Espacial • Completa ( “Complete Spatial Randomness - CSR” ). • Na realidade o que se faz é comparar a distribuição dos eventos observados • com o que se esperaria na hipótese CSR. • Esta metodologia consiste em se criar envelopes de simulação para a • distribuição CSR, afim de acessar a significância dos desvios. • Na hipótese de CSR, a função de distribuição G(w) seria dada por um • processo de Poisson, como segue (Bailey e Gatrell, 1995): Estatística Espacial - Análise de Padrões de Distribuição de Pontos
Método - Vizinho mais Próximo • A estimação simulada para a distribuição G(w) assumindo-se CSR é • calculada como (Bailey e Gatrell, 1995): onde: • , i =1, 2, ..., m são funções de distribuição empíricas, estimadas a • partir de m simulações independentes dos n eventos, na hipótese • CSR (n eventos independentes e uniformemente distribuídos). Estatística Espacial - Análise de Padrões de Distribuição de Pontos
Método - Vizinho mais Próximo • Para calcular a condição de aleatoriedade, calcula-se os envelopes de • simulação superior e inferior, definidos como segue (Bailey e Gatrell, 1995): • Envelope superior • Envelope inferior Estatística Espacial - Análise de Padrões de Distribuição de Pontos
Método - Vizinho mais Próximo • A plotagem x , com adição dos envelopes, permite medir a • significância dos desvios relativo a aleatoriedade. Envelope Inferior Estimado Envelope Superior • Se a condição de CSR for válida para os dados observados, a plotagem • x deve ser praticamente linear com um ângulo de 45o Estatística Espacial - Análise de Padrões de Distribuição de Pontos
Método - Vizinho mais Próximo • Se o dado apresenta tendências para agrupamento, os traçados no gráfico • estarão acima da linha de 45o. • Por outro lado, se o dado apresenta padrões de regularidade os traçados • ficarão abaixo da linha de 45o. Estatística Espacial - Análise de Padrões de Distribuição de Pontos
Método - Vizinho mais Próximo • O exemplo abaixo refere-se a crimes juvenis na região de Cardiff, UK • (Herbert, 1980). Neste caso percebe-se a posição dos envelopes e • da distribuição acima da linha de 45o, o que caracteriza agrupamento • para as distâncias em análise. Distância mín.=0. máx.=16 #intervalos=10 #simulações=10 Estatística Espacial - Análise de Padrões de Distribuição de Pontos
Função K • Vizinho mais próximo • pequena escala • Função K • propriedades de segunda ordem de um processo isotrópico • Definição (Bailey e Gatrell, 1995): K(h) =E[#(eventos a distância hde um evento arbitrário)] onde: - No eventos / área E() - operador esperança. Estatística Espacial - Análise de Padrões de Distribuição de Pontos
Função K • K(h) =E[#(eventos a distância hde um evento arbitrário)] R # eventos = 7 h Lembrando que: denominado de intensidade ou =no eventos/R R = área # eventos = 3 h Estatística Espacial - Análise de Padrões de Distribuição de Pontos
Função K • Necessitamos agora, definir um estimador para a função k • K(h) =E[#(eventos a distância hde um evento arbitrário)] • K(h) =, onde: dijé a distância entre os eventos i e j. Ih(dij)= 1 sedij <=h, 0 sedij > h. R = n = # eventos em R. • Resultando • O estimador de lambda , então: Estatística Espacial - Análise de Padrões de Distribuição de Pontos
Função K R h=5 # eventos=7 # eventos=7 h=5 # eventos=3 h=5 • Uma idéia gráfica do que está embutido na notação do estimador da função K Estatística Espacial - Análise de Padrões de Distribuição de Pontos
Função K Tipo de Processo K(h) Randômico = h2 Ordenação regular < h2 Agregação espacial > h2 • Para um processo aleatório o # esperado de eventos a uma distância h • de UMevento escolhido aleatoriamente é lk(h)=lph2(Bailey e Gatrell, 1995) h Processo aleatório h h Área=ph2 h h h Estatística Espacial - Análise de Padrões de Distribuição de Pontos
Função K Tipo de Processo L(h) K(h) Randômico = 0 = h2 Ordenação regular < 0 < h2 Agregação espacial > 0 > h2 • Uma vez obtido, este pode ser plotado e examinado. • O gráfico da função K não é tão intuitivo quanto a do gráfico do vizinho • mais próximo. Portanto utiliza-se uma função auxiliar L, para facilitar a • interpretação. • O estimador da função L é: Estatística Espacial - Análise de Padrões de Distribuição de Pontos
Função K • Interpretação da plotagem de • extremos positivos: mais agrupamento • em torno de zero aleatório 0 • extremos negativos: mais regularidade h Estatística Espacial - Análise de Padrões de Distribuição de Pontos
Função K • Exemplo :- O exemplo abaixo refere-se ao município Bood Moor, situado no condado de Cornwall, Inglaterra. Dados geomorfológicos com 36 localizações de rochas de granito. Neste caso percebe-se que para distâncias entre aproximadamente 2.5 a 3 (extremo positivo do gráfico) há evidências de agrupamento. Distância mín.=0.5 máx.=4 #intervalos=10 Estatística Espacial - Análise de Padrões de Distribuição de Pontos
Função K • Uma abordagem similar a do vizinho mais próximo pode ser feita para se • estimar a significância dos desvios da distribuição em relação a aleato- • riedade (CSR). • Idéia realizar simulações CSR sobre a região R e computar os envelopes • superior e inferior. • O envelope superior é definido como (Baley e Gratel, 1995): • O envelope inferor é definido como (Baley e Gratel, 1995): Estatística Espacial - Análise de Padrões de Distribuição de Pontos
Função K 1.5 - 1.0 - 0.5 - 0.0 - -0.5 - -1.0 - -1.5 - • Análise do gráfico com os envelopes Upper(h) e Lower(h). Upper(h) aleatório Lower(h) h Estatística Espacial - Análise de Padrões de Distribuição de Pontos
Função K • Exemplo :- mudas de Sequoia, Califórnia. Dados representam 62 mudas distribuídas numa região de 23m2. Estatística Espacial - Análise de Padrões de Distribuição de Pontos
AULA PRÁTICA NO SISTEMA SPRING • BANCOS DE DADOS: • PORTO ALEGRE: eventos de violência (homicídios, acidentes de transito e suicídios) na cidade de Porto Alegre - RS. • BoodminMoor: refere-se ao município Bood Moor, situado no condado de Cornwall, Inglaterra. Dados geomorfológicos com 36 localizações de rochas de granito. • Cardiff: estado em Wales, UK. Dados representam localizações das 168 residências de infratores juvenis no estado de Cardiff. • Redwood: mudas de Sequoia, Califórnia. Dados representam 62 mudas distribuídas numa região de 23m2. Estatística Espacial - Análise de Padrões de Distribuição de Pontos