330 likes | 367 Views
www.piatam.fua.br. Uso de Regras de Associação Fuzzy na Base de Dados Integrada PIATAM/SIPAM. Fábio Roque da Silva Moreira Orientação: Alexandre Evsukoff Fernando Pellon de Miranda. Agosto/2005. APRESENTAÇÃO. Introdução;
E N D
www.piatam.fua.br Uso de Regras de Associação Fuzzy na Base de Dados Integrada PIATAM/SIPAM Fábio Roque da Silva Moreira Orientação: Alexandre Evsukoff Fernando Pellon de Miranda Agosto/2005
APRESENTAÇÃO • Introdução; • Projeto PIATAM e a Base de Dados Integrada BDI PIATAM/SIPAM; • Motivação e Objetivo; • Fundamentação Teórica: • Regras de associação Fuzzy; • Conjuntos de Dados de Limnologia do PIATAM; • Avanços Futuros: • (Regras de Associação Fuzzy Temporais e Espaciais)
INTRODUÇÃO • As atuais iniciativas de construção de grandes repositórios centralizados de dados sócio-ambientais (e.g. SIPAM) demostram uma mudança de filosofia no trato com as informações sócio-ambientais; • Um bom exemplo de Base Integrada de Dados (BDI) é a base PIATAM/SIPAM (Dados sócio-ambientais); • Essa nova filosofia de integração das informações ambientais sinaliza com novas possibilidades de extração de conhecimento (interrelações entre as variáveis (atributos);
INTRODUÇÃO • Entretanto, a aquisição desse conhecimento demanda o emprego de técnicas matemáticas adequadas; • Dentre as diversas técnicas de data mining empregadas a técnica regras de associação aparece em destaque (Motivos: facilidade de compreenção e alta capacidade de manipulação de massívas quantidades de informação); • Regras de associação apresentam uma abordagem booleana(item presente ou não). Entretanto, em casos naturais as relações naturais são fuzzyao invés de booleanas, o que traz a tona o conceito de regras de associação fuzzy.
MOTIVAÇÃO E OBJETIVO • Necessidade de extração de conhecimento da BDI PIATAM/SIPAM que auxilie e forneça subsídios para processos de tomada de decisão durante planos de contigência (transporte de óleo e gás na região amazônica). • Apresentar uma proposta de extração de conhecimento da Base de Dados Integrada PIATAM/SIPAM, através da aplicação de um modelo baseado em Regras de Associação Fuzzy.
PIATAM Potenciais Impactos Ambientais no Transporte Fluvial de Gás Natural e Petróleo na Amazônia
PROJETO PIATAM • Idealizado para minimizar os possíveis impactos ambientais relacionados a industria do petróleo na Amazônia; • Ajuda a promover a produção e o transporte de óleo e gás de forma sustentável, contribuindo também para a ampliação do conhecimento científico sobre a região; • Dispõe Base de Dados de natureza ambiental e sócio-econômica, consistindo de dados de trabalho de campo coletados periodicamente por pesquisadores de diferentes áreas, assim como arquivos de imagens individuais de satélites e aeroportadas, além de mosaicos georreferenciados;
PROJETO PIATAM ÁREA DE ESTUDO MOSAICO JERS-1 SAR
PROJETO PIATAM 11 Localidades (9 Comunidades) Mosaico GRFM Época Seca Outubro 1995 Mosaico GRFM Época Cheia Maio 1996
MOSAICO JERS-1 COARI - MANAUS • LOW FLOOD • 19 OCT 95 – 24 OCT 95
MOSAICO JERS-1 COARI - MANAUS • LOW FLOOD • RISING WATER • 19 OCT 95 – 24 OCT 95 • 28 FEB 96 – 04 MAR 96
MOSAICO JERS-1 COARI - MANAUS • LOW FLOOD • RISING WATER • HIGH FLOOD • 19 OCT 95 – 24 OCT 95 • 28 FEB 96 – 04 MAR 96 • 26 MAY 96 – 31 MAY 96
MOSAICO JERS-1 COARI - MANAUS • LOW FLOOD • RISING WATER • HIGH FLOOD • RECEDING WATER • 19 OCT 95 – 24 OCT 95 • 28 FEB 96 – 04 MAR 96 • 26 MAY 96 – 31 MAY 96 • 22 AUG 96 – 27 AUG 96
BDI PIATAM/SIPAM Base de Dados Integrada PIATAM/SIPAM (BDI): - Repositório centralizado de informações de natureza sócio-ambiental identificadas como de interesse para o projeto PIATAM. Vantagem da BDI: - Oportunidade de mineração de dados no auxilio de processos de tomada de decisão (planos de contingência mais adequados às variações sazonais do ambiente amazônico (seca, enchente, cheia e vazante). Clientes: INFOPAE e Mapa de Sensibilidade
BDI PIATAM/SIPAM Classificação dos dados disponíveis na BDI: • Dados de campo; • Modelos Digitais de Elevação do SRTM; • Dados de imagens originais do PIATAM ou do SIPAM; • Dados de Base (Cartografia básica/temática do IBGE e Modelos Digitais de Elevação da UFV) originais do SIPAM; • Dados de Sensores do SIPAM; • Dados Socioeconômicos do IBGE e Previsão de Tempo, originais do SIPAM.
Arqueologia Crustáceos Documentação Entomologia Flora Herpetofauna Ictiofauna IDH-C Limnologia Macrófitas Aquáticas Malária Socioeconomia Solos Varzeometria BDI PIATAM/SIPAM Dados de Campo
BDI PIATAM/SIPAM Dados de Campo: Marco PIATAM Ponto de Coleta
FUNDAMENTAÇÃO TEÓRICA • Regras de Associação Fuzzy • As pesquisas iniciais relacionadas com Regras de Associação concentravam-se em regras booleanas, as (presença ou não), desconsiderando atributos quantitativos. • Regras de associação são empregadas em tabela de dados com dados binários. Onde, um registro X na tabela de dados representa uma transação, enquanto os atributos representam itens que podem ter sido adquiridos ou não. Desse modo, para cada atributo A, A(x) é tanto 1 ou 0 indicando se o item foi ou não comprado na transação X. (Hong, et al. 1999)
FUNDAMENTAÇÃO TEÓRICA • Um modo de tratar com atributos quantitativos é substituí-los por outros atributos que formam uma partição discreta (e.g. baixo [0,100 [, médio [100, 300 [ e alto [300, + [ ); • A teoria dos conjuntos fuzzy ajuda a lidar melhor com atributos quantitativos, representando uma ótima ferramenta para modelar termos e relações imprecisas comumente empregados por seres humanos em comunicação e compreensão. Além do mais, é vastamente aceito que muitas relações naturais no mundo real são intrinsicamente fuzzy ao invés de booleana.
FUNDAMENTAÇÃO TEÓRICA Conjunto de dados:
FUNDAMENTAÇÃO TEÓRICA Primeiro Passo: Transformação dos atributos em conjuntos Fuzzy:
FUNDAMENTAÇÃO TEÓRICA Conjuntos Fuzzy pH:
FUNDAMENTAÇÃO TEÓRICA Conjuntos Fuzzy:
FUNDAMENTAÇÃO TEÓRICA Segundo Passo: Calculo da cardinalidade escalar de cada conjunto Fuzzy:
FUNDAMENTAÇÃO TEÓRICA Terceiro Passo: Encontrar a região fuzzy por atributo de maior valor de cardinalidade: Assume-se a região fuzzy para o atributo j
FUNDAMENTAÇÃO TEÓRICA Quarto Passo: Verificar-se o valor de de cada região fuzzy é maior ou igual ao suporte pré-definido : Caso o valor seja maior considere este atributo no conjunto de itens 1-itemset (L1)
FUNDAMENTAÇÃO TEÓRICA Quinto Passo: Fixe r=1 Encontre todos os candidatos do conjunto Cr+1através do Lrde um modo semelhante ao algoritmo apriore
FUNDAMENTAÇÃO TEÓRICA Quinto Passo: • Considere um itemsetI que não satisfaça ao limiar de suporte: • Caso um item A seja adicionado ao itemset I o conjunto resultante não pode ocorrer mais freqüentemente do que I,
FUNDAMENTAÇÃO TEÓRICA Regras de Associação:
FUNDAMENTAÇÃO TEÓRICA Regras de Associação:
FUNDAMENTAÇÃO TEÓRICA Regras de Associação:
FUNDAMENTAÇÃO TEÓRICA Teoria dos conjuntos Fuzzy: Função característica Função petinência -cut
FUNDAMENTAÇÃO TEÓRICA Teoria dos conjuntos Fuzzy: Cardinalidade escalar Complemento