1 / 27

Generalização de Regras de Associação Utilizando Taxonomias Após Pós-Processamento Prévio.

Generalização de Regras de Associação Utilizando Taxonomias Após Pós-Processamento Prévio. Jackson D. N. Mourão Pietrângelo V. Ferronato. Processo de Extração de Padrões em Bases de Dados. Para que serve? Quem utiliza? Qual o problema?. Trabalhos Relacionados.

agatha
Download Presentation

Generalização de Regras de Associação Utilizando Taxonomias Após Pós-Processamento Prévio.

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Generalização de Regras de Associação Utilizando Taxonomias Após Pós-Processamento Prévio. Jackson D. N. Mourão Pietrângelo V. Ferronato

  2. Processo de Extração de Padrões em Bases de Dados • Para que serve? • Quem utiliza? • Qual o problema?

  3. Trabalhos Relacionados • Descrição de um Algoritmo para Generalização de Regras de Associação (DOMINGUES, 2004) • Objetivo: filtrar conjunto de regras; • Método Adotado: taxonomias; • Resultados: redução entre 14,61% e 50,11%; • Influência da Imputação de Valores Ausentes nos Classificadores Descobertos (CALIL, 2008) • Objetivo: imputação de valores ausentes; • Método Adotado: árvores de decisão; • Resultados: redução na quantidade de regras e na taxa de erro do classificador;

  4. Trabalhos Relacionados • Um Método de Pós-processamento de Regras de Associação com Base nas Relações de Dependência entre os Atributos (BÜRKLE, 2006) • Objetivo: eliminar regras redundantes; • Método Adotado: relações de dependência entre atributos; • Resultados: bons percentuais de redução nas quatro bases de dados testadas; • Análise do Conhecimento Extraído de Classificadores Simbólicos Utilizando Medidas de Avaliação e de Interessabilidade (GOMES, 2002) • Objetivo: medir os padrões descobertos; • Método Adotado: medidas qualitativas e quantitativas; • Resultados: algumas regras potencialmente mais interessantes.

  5. Trabalhos Relacionados • Identificação de Regras de Associação Interessantes por meio de Análises com Medidas Objetivas e Subjetivas (SINOARA, 2006) • Objetivo: identificar regras potencialmente mais interessantes; • Método Adotado: medidas objetivas e subjetivas; • Resultados: demonstrou-se que a combinação proposta auxilia na avaliação das regras;

  6. Conceitos Regras de Associação • “Um cliente que compra os produtos (X1,X2, ..., Xn) também irá comprar os produtos (Y1, Y2, ..., Ym) com probabilidade c%” • Padrão Apriori • Y  X Z (50.5%, 80.2%)

  7. Conceitos Avaliação e Poda de Regras • Objetivos • Avaliar regras geradas; • Reduzir o tamanho do conjunto de regras; • Método • Medidas objetivas e subjetivas; • Medidas quantitativas e qualitativas; • Identificar regras redundantes ou potencialmente não interessantes;

  8. Conceitos Convicção • Domínio: de zero a infinito; • Caso for 1: existe a independência completa entre A e B; • Caso for infinito: A nunca aparece sem B (confiança de 100%);

  9. Conceitos Generalização de Regras • Aplica-se conhecimento de domínio para gerar regras mais representativas e informativas. • “5% dos clientes que compram pão-pullman-light, também compram leite-parmalat-desnatado” • “30% dos clientes que comprar pão, também compram leite”

  10. Conceitos Técnica da Taxonomia

  11. Método Proposto • Avaliar e eliminar regras através da medida objetiva Convicção; • Generalizar as regras: • Agrupar por Conseqüente; • Generalizar em Linha; • Agrupar por Antecedente/Taxonomia; • Generalizar em Coluna; • Desfazer Generalizações Não Repetidas; • Concatenar Taxonomias aos Dados • Calcular Suporte e Confiança para as Regras Generalizadas; • “Desgeneralizar” Regras de Baixa Confiança; • Gerar Arquivo de Saída;

  12. Método Proposto Agrupar por Conseqüente

  13. Método Proposto Generalizar em Linha

  14. Método Proposto Agrupar por Antecedente

  15. Método Proposto Agrupar por Antecedente

  16. Método Proposto Generalizar em Coluna

  17. Método Proposto Generalizar em Coluna

  18. Método Proposto Desfazer Generalizações não Repetidas

  19. Método Proposto Concatenar Taxonomias aos Dados

  20. Método Proposto Calcular Suporte e Confiança • Dados com Taxonomias • Roupas_leves acessorios calcados_abertos • Bermuda bone chinelo • Calcados_abertos ? Acessorios • Chinelobrinco bone • Varre a base de dados buscando itens nos registros duplos (linha das respectivas taxonomias e linha original);

  21. Método Proposto “Desgeneralizar” Regras com Baixa Confiança

  22. Método Proposto Gerar Arquivo de Saída

  23. Resultados 1062 Regras Podadas (50,8% menor) 1285 Registros 2091 Regras 958 Regras (7% menor)

  24. Conclusão • A eficácia do método depende: • Do quão generalizáveis são os dados; • De quanto conhecimento de domínio está disponível; • Da configuração das taxonomias confeccionadas;

  25. Trabalhos Futuros • RegrasGeneralizadas • Roupas_banhoentraNoMar • SungaentraNoMar • BiquinientraNoMar • MaiônaoEntraNoMar • Generalizar conseqüente da regra; • Agrupar no arquivo de saída as regras que possuem antecedentes de mesma taxonomia;

  26. Referências • BÜRKLE, Paula Yamada. Um Método de Pós-processamento de Regras de Associação com Base nas Relações de Dependência entre os Atributos. Universidade Federal Fluminense, Niterói, 2006. • CALIL, Leonardo Aparecido de Almeida. Influência da imputação de valores ausentes nos classificadores descobertos. Universidade Tuiuti do Paraná, Curitiba, 2008. • CARVALHO, Veronica Oliveira de. Generalização de regras de associação utilizando conhecimento de domínio e avaliação do conhecimento generalizado. Universidade de São Paulo, São Carlos, 2007. • DOMINGUES, Marcos Aurélio. Generalização de regras de associação. Universidade de São Paulo, São Carlos, 2004. • GOMES, Alan Keller. Análise do Conhecimento Extraído de Classificadores Simbólicos Utilizando Medidas de Avaliação e de Interessabilidade. Universidade de São Paulo, São Carlos, 2001. • GONÇALVES, Eduardo Corrêa. Regras de Associação e suas Medidas de Interesse Objetivas e Subjetivas. Universidade Federal Fluminense, Niterói, 2005. • MELANDA, Edson Augusto. Pós-processamento de Regras de Associação. Universidade de São Paulo, São Carlos, 2004. • REZENDE, Solange Oliveira. Sistemas Inteligentes – Fundamentos e Aplicações. 1a edição. Barueri – SP Editora Manole, 2003. • SINOARA, Roberta Akemi. Identificação de regras de associação interessantes por meio de análises com medidas objetivas e subjetivas. Universidade de São Paulo, São Carlos, 2006. • SOUZA, Viviane Dal Molin; CARVALHO, Deborah Ribeiro. Avaliando a relação entre quão corretas e interessantes podem ser as regras de associação descobertas. Tuiuti: Ciência e Cultura, Curitiba, n.37, p. 9-19, 2005. Disponível em: http://www.utp.br/tuiuticienciaecultura/TCC%5Fonline/. Acesso em: 19 out. 2009.

  27. Nova Versão no Site • http://code.google.com/p/generalizer/downloads/list

More Related