1 / 16

Aplicações dos Modelos de Recuperação da Informação na Extração de Conteúdos na Web

Aplicações dos Modelos de Recuperação da Informação na Extração de Conteúdos na Web. Metodologia de Ciência da Computação Professora: Odette Mestrinho Passos Alunos: André Porto Letícia Santos Marcelo Henrique. WEB. Grande quantidade de informação não-estruturada.

minda
Download Presentation

Aplicações dos Modelos de Recuperação da Informação na Extração de Conteúdos na Web

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Aplicações dos Modelos de Recuperação da Informação na Extração de Conteúdos na Web Metodologia de Ciência da Computação Professora: Odette Mestrinho Passos Alunos: André Porto Letícia Santos Marcelo Henrique

  2. WEB Grande quantidade de informação não-estruturada. Necessidade do usuário filtrar informações relevantes. Bancos de Dados para várias funções.

  3. WEB Importância dos sistemas IETS CRF (estado-da-arte)

  4. Fundamentação teórica Definição Sistemas que lidam com representação, armazenamento,organização e acesso as informações. Objetivo Encontrar objetos de diferentes tipos de estruturas que satisfacam um conjunto de informações dentro de uma grande coleção.

  5. Modelos Vetorial Booleano Probabilístico

  6. Modelovetorial Representação como vetores de termos A cada termo é possível associar um peso: TF : caracterisitcas em comum IDF : distinguir O termo cos(q) determina a proximidade da ocorrência. Similar: mesma região

  7. Modelobooleano Baseado na teoria dos conjuntos Cada documento está associado a um conjunto de palavras-chave Cada consulta é na forma de uma expressão booleana. Termos de índice na combinação especificada pela consulta.

  8. Modeloprobabilístico Probabilidade de relevância ou incerteza Pesar dinamicamente os termos da consulta em relação ao documento Termos relevantes já obtidos recebem peso maior dos que não apareceram nos documentos relevantes.

  9. Aplicações Web semântica

  10. Aplicações ONDUX On Demand Unsupervised Extraction

  11. ONDUX Método baseado em Recuparação de Informação para realizar tarefas de EIST. Sem fase de treinamento ajustada por usuários. Possibilidade de criação de modelos não específicos. Obteve resultados iguais ou melhores.

  12. ONDUX Três fases principais:

  13. ONDUX Coroado R$100,000 1010 Rua Novo Lar.; 3 quartos; 2 banheiros. 8199-7654 Blocking Coroado R$100,900 1010 Novo Lar.; 3 quartos 2 Banheiros 8199-7654

  14. ONDUX B0 B1 B2 B3 B4 B5 B6 B7 Matching Rua Preço No. ??? Rua Coroado R$100,00 1010 Novo Lar 3 Quartos 2 Banheiros 8199-7654 Qtos. Banh. Telefone

  15. ONDUX Rua Preço No. ???? Rua Coroado R$100,00 1010 Novo Lar 3 Quartos 2 Banheiros 8199-7654 Qtos. Banh. Telefone Reinforcement Bairro Preço No Rua Coroado R$100,00 1010 Novo Lar 3 Quartos 2 Banheiros 8199-7654 Qtos. Banh. Telefone

  16. Dúvidas? Obrigado!

More Related