500 likes | 688 Views
Sistemas. de. Informações. Geográficas. SIGs. Captura e Estruturas de Dados Espaciais Capítulo 6 – Parte 02. Antonio P. Drumond Neto Doutorando PPGPV – UFES/CCA. Avaliador: Prof. Dr. Alexandre Rosa dos Santos. Novembro 2013 – Alegre , ES. BANCO DE DADOS.
E N D
Sistemas de Informações Geográficas SIGs
Captura e Estruturas de Dados Espaciais Capítulo 6 – Parte 02 Antonio P. Drumond Neto Doutorando PPGPV – UFES/CCA Avaliador: Prof. Dr. Alexandre Rosa dos Santos Novembro 2013 – Alegre, ES
BANCO DE DADOS Banco de dados do SIG é composto por: A, B, C, D ... • Dados Textuais • Dados Numéricos 1, 2, 3, 4 ... • Dados matriciais (raster) • Dados Vetoriais
ESTRUTURAS DE DADOS EM SIG O SIG possui a capacidade de armazenar atributos descritivos e formas geométricas dos diferentes tipos de dados geográficos. (CAMARA, 2005)
ESTRUTURAS DE DADOS EM SIG A estrutura dos dados são formas padrões para armazenar dados no computador, sendo um intermediário entre o modelo da realidade e um formato de arquivo Dados espaciais - Dados relacionados a superfícies contínuas, contendo três coordenadas denominadas de amostra 3D Dados geográficos -necessários para definir onde as feições cartográficas ocorrem; Atributos -que registrem o que as feições cartográficas representam. Coordenadas X, Y e o atributo Z
PRINCIPAIS ESTRUTURAS DE DADOS NO SIG Representação matricial: o espaço é representado como uma matriz composta de colunas e linhas. Cada célula possui um número de linha, um número de coluna e um valor correspondente ao atributo estudado. • Mundo Real • Representação vetorial: o fenômeno pode ser abstraído em três elementos gráficos: • ponto (dimensão zero), • linha (uma dimensão), e • área ou polígono (duas dimensões).
Dados matriciais É à representação gráfica do mundo real por meio de pixel (pictureelement) ou células, com forma poligonal regular, geralmente quadradas, que são definidos pelas suas posições em relação às colunas e linhas de uma malha. Dependendo do que se quer representar a célula poderá ter um valor quantitativo ou qualitativo. • Cada célula armazena um valor de atributo de um determinado tema. Cria-se uma cobertura (ou plano de informação) para cada tema (uso da terra, tipo de solo, cobertura vegetal, tipos de rocha, entre outros).
-3,4 3,8 5 1,5 30 8 3 5 1 5 2,3 -3 1 10 5 1 -12,3 5 2,5 9 5 5 4 9 b) Imagem contínua a) Imagem codificada 2n c) Imagem binária d) Imagem ternária Tipo de Arquivos raster
Estruturas matriciais • São estruturados em modelos simples e compacta. • Principais Estruturas Raster: • CÓDIGO DE CADEIAS • RUN-LENGTH ENCODING (RLE) • VALUE POINT ENCODING (VPE) • MODELOS HIERÁRQUICOS, (QUADTREE eBLOCOS MÁXIMOS).
1 1 1 1 1 2 2 2 1 1 1 1 1 2 2 2 1 1 1 2 2 2 2 2 1 1 1 2 2 2 2 2 1 1 1 2 2 2 2 2 2 2 2 2 2 3 3 2 2 2 2 2 2 3 3 2 2 2 2 2 2 2 2 2 DADO MATRICIAL DE 3 DIFERENTES TIPOS DE SOLO Exemplo
1 1 1 1 1 2 2 2 1 1 1 1 1 2 2 2 1 1 1 2 2 2 2 2 1 1 1 2 2 2 2 2 1 1 1 2 2 2 2 2 2 2 2 2 2 3 3 2 2 2 2 2 2 3 3 2 2 2 2 2 2 2 2 2 Códigos: 0= ESTE - 1= SUL - 2= OESTE - 3= NORTE Categoria 1= 15, 03, 35, 23. A partir linha 1 e coluna 1, no sentido anti-horário, os dados são organizados segundo determinada categoria. A estruturação em código de cadeias reduziu o tamanho do arquivo em 8 unidades de bytes. CÓDIGO DE CADEIAS
1 1 1 1 1 2 2 2 1 1 1 1 1 2 2 2 1 1 1 2 2 2 2 2 1 1 1 2 2 2 2 2 LINHA COLUNA ATRIBUTO CODIFICAÇÃO 1 1 1 2 2 2 2 2 1 1 1 15, 03, 35, 23 2 2 2 2 2 3 3 2 1 4 1 11, 01, 31, 21 2 2 2 2 2 3 3 2 1 6 2 15, 03, 35, 23 2 2 2 2 2 2 2 2 3 4 2 16, 02, 36, 22 6 1 2 13, 03, 33, 23 6 6 3 11, 01, 31, 21 8 6 2 10, 02, 30, 20 8 8 2 13, 00, 30, 20 Códigos: 0= ESTE 1= SUL 2= OESTE 3= NORTE CÓDIGO DE CADEIAS
1 1 1 1 1 2 2 2 1 1 1 1 1 2 2 2 1 1 1 2 2 2 2 2 1 1 1 2 2 2 2 2 1 1 1 2 2 2 2 2 2 2 2 2 2 3 3 2 2 2 2 2 2 3 3 2 2 2 2 2 2 2 2 2 O principio consiste em pixels adjacentes tendo o mesmo atributo, combinados em faixa, representada por um par de números. Cada linha inicia uma nova faixa • EXEMPLO: Para a nossa matriz temos: • LINHA 1: (5,1), (3,2); • LINHA 2: (5,1), (3,2); • LINHA 3: (3,1), (5,2); • LINHA 4: (3,1), (5,2); • LINHA 5: (3,1), (5,2); • LINHA 6: (5,2), (2,3), (1,2); • LINHA 7: (5,2), (2,3), (1,2); • LINHA 8: (8,2). RLE (Run-LengthEncoding)
1 9 1 17 1 1 1 2 2 2 1 1 2 1 10 1 18 1 1 2 2 2 3 1 1 11 19 1 2 2 2 2 2 1 4 1 12 1 21 2 2 2 2 2 1 5 1 13 22 1 2 2 2 2 2 6 2 14 2 2 2 2 3 3 2 7 2 2 15 2 2 2 3 3 2 8 2 2 16 2 2 2 2 2 2 A codificação dos dados é a partir da linha 1 e coluna 1, continuamente, associando o atributo ao número de pixels. A cada mudança de atributo tem-se um determinado número de pixels. Exemplo: 5(1); 2(8); 1(13); 2(16); 1(21); 2(24); 1(26); 2(32); 1(35); 2(45); 3(47); 2(53); 3(55); 2(64). VPE (Value Point Encoding)
O modelo de Blocos Máximos é uma variante do quadtree, cujo objetivo é eliminar possíveis redundâncias. • A matriz é subdividida em polígonos regulares, não necessariamente quadrados, e cada polígono contém um único atributo. 1 1 1 1 1 2 2 2 1 1 1 1 1 2 2 2 1 1 1 2 2 2 2 2 1 1 1 2 2 2 2 2 1 1 1 2 2 2 2 2 2 2 2 2 2 3 3 2 2 2 2 2 2 3 3 2 2 2 2 2 2 2 2 2 • O princípio fundamental é a divisão do dado raster a partir de múltiplos polígonos regulares. • O primeiro quadrado compreende toda a matriz, contém 3 categorias. Este é dividido em sucessivos quadrados, até a unidade fundamental (pixel). DADO RASTER EM ESTRUTURA QUADTREE
Uso do modelo matricial • Variáveis físicas: como precipitação (quantidade de chuva) ou elevação (valor da elevação); • Regiões administrativas: códigos para distritos urbanos; • Uso da terra: definidas a partir de um sistema de classificação; • Distância de um dado objeto a um alvo: cada célula do modelo tem um valor que representa a distância do objeto em estudo.
Dados vetoriais Neste modelo as coordenadas são consideradas matematicamente exatas. • O que existe de mais importante no modelo vetorial é a entidade ponto. • Engloba todas as entidades geográficas e gráficas que são posicionadas por um simples par de coordenadas (x,y) 7 5 3 1 4 7
Dados vetoriais • É à representação gráfica do mundo real por meio de coordenadas x, y para definir as feições de dados discretos representados por pontos, linhas e polígonos • Na representação vetorial, o mundo é dividido em elementos com sua própria geometria de pontos, linhas e áreas permitindo que todas as posições sejam definidas exatamente.
Estruturas Vetoriais As entidades poligonais podem ser estruturadas em diferentes formatos: • MODELO TOTAL • DUAL INDEPEDENT MAP ENCODING – DIME • MODELO RELACIONAL E DIGITAL LINE GRAFHS - DGL Os mais usuais são: • MODELO TOPOLÓGICO • MODELO ESPAGUETE
Fácil entendimento e boa adequação para representação de mapas. • Apresenta dados redundantes, uma vez que as linhas comuns a dois polígonos são armazenadas duas vezes e a relações espaciais não são arquivadas. Arcos ausente de contiguidade Poligonoaberto (ausente de area) Arcos semconectividade (cruzamento) Poligonosadjacentes com sobreposição (buracos) O SIG IDRISI utiliza este modelo para arquivar e representar os PIs Estrutura espaguete (desusado)
É um conjunto de regras e comportamentos que estipulam como pontos, linhas e polígonos partilham geometrias coincidentes. É definido como a relação espacial entre feições vizinhas ou adjacentes topologia
Constitui a estrutura mais comum para os dados vetoriais • Apresenta uma estrutura compacta. • Garante a integridade e qualidade dos dados • As relações matemáticas entre os objetos são mantidas • Permite a execução de algumas funções de análise espacial (por exemplo, a operação dissolução). Topologia no sig
Vetorial x Raster • Algum tempo atrás estes modelos eram incompatíveis. • Os sistemas comerciais de SIG preferem implementar o modelo vetorial. • Sistemas atuais manipulam ambos os modelos de dados. • Os dois modelos são passíveis de conversão entre si. • A conversão do sentido vetorial para matricial é mais fácil • A conversão no sentido matricial para vetorial é complexa
Tipos de Dados em Geoprocessamento IMAGENS Obtidas por: • Satélites, • Fotografias aéreas • Scanners aerotransportados • São armazenadas como matrizes e representam formas de captura da informação espacial. Cada elemento de imagem, denominado pixel, tem um valor proporcional à energia eletromagnética refletida ou emitida pela área da superfície terrestre correspondente.
Tipos de Dados em Geoprocessamento MAPAS TEMÁTICOS • Descrevem de forma qualitativa, a distribuição espacial de uma grandeza geográfica. . Mapa de reconhecimento dos solos da região de Inhamuns, Salgado (Assad & Sano, 1998)
Tipos de Dados em Geoprocessamento MAPAS CADASTRAIS • cada elemento é considerado como um objeto geográfico • possui atributos e pode estar associado a várias representações gráficas. LIMITES CENSITÁRIOS DO DISTRITO DE ARACÊ, DOMINGOS MARTINS, ES
Tipos de Dados em Geoprocessamento MAPAS POLITEMÁTICOS • Quando as informações, qualitativa e quantitativa estão presentes em um mesmo mapa
Tipos de Dados em Geoprocessamento REDES armazenam os elementos geográficos em modelo vetorial com topologia de rede (arco-nó), Os arcos armazenam atributos sobre o sentido dos fluxos e os nós sobre a capacidade Malha rodoviária do Estado do Paraná
Tipos de Dados em Geoprocessamento MAPAS NUMÉRICOS DE TERRENO: O termo é utilizado para denotar a representação quantitativa de uma grandeza que varia continuamente no espaço.
Resolução Espacial Célula grande Menor resolução Menor precisão na localização da feição espacial Apresentação mais rápida Processamento mais rápido Arquivo de armazenagem menor Célula pequena • Maior resolução • Maior precisão da feição espacial • Apresentação mais lenta • Processamento mais lento • Arquivo de armazenagem maior
SPOT 5 Colorida – resol. 10 m Pancrom. – resol. 2,5 m
Qualidade de Dados e Erros • Época que os dados foram coletados. • Fonte dos dados • Formato original dos dados • Área coberta dos dados. • Escala dos mapas • Sistema de coordenadas (projeção, datum) • Densidade de observações do dado • Acurácia das feições (posição e atributos) • Consistência logica dos atributos • Como os dados foram testados?
Qualidade de Dados e Erros Exatidão Valor verdadeiro Precisão
Elementos e sub-elementos de qualidade de dados geográficos Acurácia posicional ou Geométrica • Qualidade externa ou absoluta – Proximidade dos valores em função dos dados ditos “reais”. • Qualidade relativa ou interna - Proximidade das posições relativas com respectivas posições aceitas como reais. • Qualidade da posição da grade de coordenadas – Proximidade da grade de coordenadas com a localização real. Metadados • Linhagem – Parâmetros e dados que construíram o conjunto de dados.
Coeficientes de Concordância para a avaliação da acurácia total.
Coeficientes de Concordância para avaliação da acurácia para classes individuais
Elementos e sub-elementos de qualidade de dados geográficos Consistência Lógica • Consistência de formato – Nível de armazenamento em acordo com a estrutura física do conjunto de dados. • Consistência topológica - Características topológicas dos dados. • Consistência de domínio – Conformidade com os valores de domínio dos dados. Acurácia temporal • Exatidão das medidas do tempo – Correção na medida temporal. • Consistência temporal – Correção de eventos ordenados ou em sequencia, caso registrada. • Validade temporal – Validade dos dados em relação ao tempo (atualização).
Elementos e sub-elementos de qualidade de dados geográficos Qualidade temática • Correção da classificação – Comparação da classe associada á feições ou seus atributos em relação a um conjunto de dados de controle. • Verificação dos atributos não qualitativos. • Exatidão dos atributos quantitativos. Completude • Comissão – Excesso de dados no conjunto, tanto para as feições como para seus atributos. • Omissão - Dados faltantes no conjunto.
TABELA DE VALIDAÇÃO CRUZADA PARA CÁLCULO DE EC E EQ Mapa Real Variável(1) Variável(2) Variável(3) Variável(4) TOTAL Erro de Comissão Variável (1) 9 0 0 4 13 (1 - 9/13) 0,31 Variável(2) 4 20 0 2 26 (1 - 20/23) 0,13 Variável(3) 1 3 8 5 17 (1 - 8/17) 0,53 Mapa Interpretado Variável(4) 0 0 1 7 8 (1 – 7/8) 0,13 TOTAL 14 23 9 18 64 - Erro de Omissão (1 - 9/14) 0,36 (1 - 20/23) 0,13 (1 - 8/9) 0,11 (1 - 7/18) 0,61 - (1 - 44/64) 0,31 Exemplo para verificar a completitude O menor ERRO DE OMISSÃO refere-se a VARIÁVEL 3 (0,11), ou seja, somente 1 pixel encontrado no mapa real não correspondeu ao seu equivalente no mapa interpretado. Percebe-se que o menor ERRO DE COMISSÃO refere-se a VARIAVEL 2 e 4, ou seja, em cada um deles, somente 1 pixel encontrado no mapa interpretado não correspondeu ao seu equivalente no mapa real (no campo).
RMS (x): erro médio quadrático, eixo x Enquadramento feito pela mesa Enquadramento original do mapa RMS (y): erro médio quadrático, eixo y RMS(x) RMS(y) RMS (t): erro médio quadrático total A quantificação do erro operacional é feita pelos eixo das ordenadas e abscissas onde o cálculo do RMS total será representado graficamente como a hipotenusa de um triângulo retângulo • O RMS calculado pode ser calculado segundo três perspectivas diferentes: • Escala do mapa; • Probabilidade de erro de um objetivo ser alcançado; • Produto final esperado. ERRO MÉDIO QUADRÁTICO (ROOT MEAN SQUARE) RMS
Se tivermos um mapa com escala de 1:25.000: • 1/50 polegadas para mapas com escalas 1:20.000 ou menores • 1/60 polegadas para mapas com escalas maiores que 1:20.000. • A conversão para padrões de acurácia é feita baseada em estatística. • RMS permitido requer 90% de erros acidentais menores que 1,64% do RMS calculado. Ou seja, 1,64 desvios padrões assumindo uma distribuição normal dos erros. Se tivermos um mapa com escala de 1:15.000, o erro aceitável ou o RMS permitido será o erro aceitável multiplicado pela conversão da escala, multiplicado pela conversão da unidade, dividido por 1,64,ou seja: