220 likes | 356 Views
NEScrawler. Aércio Cavalcanti – acmf@cin.ufpe.br Afonso Ferreira - agaf@cin.ufpe.br Vilmar Santos - vvf@cin.ufpe.br. Roteiro. Introdução Para que serve o NEScrawler? Por que usar o NEScrawler? Estrutura do Sistema Funcionamento Alguns Resultados Conclusão. Introdução (I). NESCoFE
E N D
NEScrawler Aércio Cavalcanti – acmf@cin.ufpe.br Afonso Ferreira - agaf@cin.ufpe.br Vilmar Santos - vvf@cin.ufpe.br
Roteiro • Introdução • Para que serve o NEScrawler? • Por que usar o NEScrawler? • Estrutura do Sistema • Funcionamento • Alguns Resultados • Conclusão
Introdução (I) • NESCoFE • Pouca informação para ser utilizada pelo NESCoFE • Busca manual da informação • Solução? Automatização
Introdução (II) • O que foi feito pra automatizar? • NEScrawler • A automatização foi uma boa saída?
Para que serve o NEScrawler? • Adquirir grande quantidade de páginas com informações de músicas • Extrair informação sobre as músicas • Integrar essas informações
Por que usar o NEScrawler? • Falta de dados para NESCoFE • Modo eficiente de recuperar e integrar informação • Resultados bastante satisfatórios • Facilidade de uso
Alguns Resultados • Grande quantidade de dados... Aproximadamente 25.000 músicas na base de dados, extraídas de barnesandnoble.com • Estrutura bem definida
MUSICore www.cin.ufpe.br/~acmf/musicore
Conclusão • Apesar de dificuldades, automatizar foi uma boa saída • Bastante informação, de apenas uma fonte • Da seca a enxurrada • Necessidade de abordagem híbrida?
Referências • Barnes and Noble – www.bn.com.br • Data Mining: Concepts and techniques – Han & Kamber • Modern Information Retrieval. Baeza-Yates & Ribeiro-Neto. Addison-Wesley, 1999. • Salgado, A. C., Lóscio, B. F., Integração de Dados na Web