1 / 15

Sistema de Recuperação de Informação baseado em Mapas de documentos para a BDTD-UFPE

Sistema de Recuperação de Informação baseado em Mapas de documentos para a BDTD-UFPE. Bruno Florencio Pinheiro Orientador: Renato Fernandes Corrêa. Roteiro. Introdução Objetivo Motivação Coleção de Documentos Aplicação Trabalhos Futuros. Introdução.

connor
Download Presentation

Sistema de Recuperação de Informação baseado em Mapas de documentos para a BDTD-UFPE

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Sistema de Recuperação de Informação baseado em Mapas de documentos para a BDTD-UFPE Bruno Florencio Pinheiro Orientador: Renato Fernandes Corrêa

  2. Roteiro • Introdução • Objetivo • Motivação • Coleção de Documentos • Aplicação • Trabalhos Futuros

  3. Introdução • Sistemas de Recuperação da Informação (SRI) são aplicações com o objetivo de satisfazer a necessidade de informação do usuário através de consultas. • Mapas de documentos são redes neurais artificiais do tipo Mapas Auto-organizáveis treinados com vetores documentos.

  4. Objetivo • Agregar um mapa de documento ao SRI com o intuito de auxiliar o usuário em suas buscas. • Disponibilizar a consulta tanto através de palavras-chaves, como através da navegação pelo mapa.

  5. Motivação • Crescente número de documentos (teses e dissertações) em meio digital. • Tornar universal o acesso a esses documentos. • Dificuldade do usuário em expressar a sua necessidade da informação através de palavras-chaves.

  6. Coleção de Documentos • Biblioteca Digital de Teses e Dissertações da UFPE (BDTD-UFPE) • Acervo do material produzido nos programas de pós-graduação da universidade. • Cerca de 6 mil documentos. • Vinculada a BDTD nacional e ao NDLTD (Networked Digital Library of Theses and Dissertations)

  7. Aplicação • Arquitetura

  8. Aplicação • Aquisição dos documentos • Através do protocolo OAI-PMH • Colheita de arquivos XMLs contendo metadados dos documentos • Extração dos dados através da biblioteca JColtrane

  9. Aplicação • Indexação • Uso da biblioteca em Java, Lucene. • Operações de Stemming, eliminação de pontuação, dígitos e stopwords. • Geração do índice invertido através do modelo espaço vetorial.

  10. Aplicação • Construção do Mapa • Representação dos documentos como vetores compondo uma matriz esparsa. • Treinamento do mapa auto-organizável com essa matriz. • Rotinas de treinamento realizadas em MATLAB, resultado do trabalho de (CORRÊA, 2008).

  11. Aplicação • Construção da Interface • Terminado o treinamento, rotula-se os neurônios com as palavras-chaves mais significativas. • Geração de uma imagem representando o mapa no formato 10 x 12 • Relação das áreas da imagem com a lista de documentos pertencentes a mesma.

  12. Aplicação

  13. Trabalhos Futuros • Comparar e analisar o desempenho de variantes do SOM, além de outros modelos aplicados ao sistema.

  14. Referências • CARDOSO JUNIOR, M. J. M. Clio-i: Interoperabilidade entre repositórios digitais utilizando o protocolo OAI-PMH. 2007. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife. • JCOLTRANE. Portal de informações e tutoriais da ferramenta JColtrane. Disponível em: <http://jcoltrane.sourceforge.net/> • WIKI LUCENE. Enciclopédia digital da ferramenta Lucene. Disponível em:<http://wiki.apache.org/jakarta-lucene/>. • CORRÊA, R. F. Sistemas Baseados em Mapas Auto-organizáveis para Organização Automática de Documentos Texto. Tese de Doutorado. Centro de Informática da UFPE, Recife, 2008.

  15. Agradecimentos • À FACEPE pelo fomento através da bolsa PIBIC e o apoio financeiro ao projeto “Mapeador de Teses e Dissertações da UFPE (MTD-UFPE)”. • À atenção de todos. OBRIGADO!

More Related