1 / 58

Agentes em Recuperação da Informação

Agentes em Recuperação da Informação. Equipe. Daniel Penaforte (dap4) Daniel Julião (dvsj) Davi Pires (dpr) Ernani Azevedo (ema3) Everton Marques (egm2) Farley Millano ( XXXXXXXXXX ) Guilherme Carvalho (ggc) Guilherme Moura (gsm) Nitai Bezerra (nbs) Pedro Montenegro (pmr). Roteiro .

rimona
Download Presentation

Agentes em Recuperação da Informação

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Agentes em Recuperação da Informação

  2. Equipe • Daniel Penaforte (dap4) • Daniel Julião (dvsj) • Davi Pires (dpr) • Ernani Azevedo (ema3) • Everton Marques (egm2) • Farley Millano (XXXXXXXXXX) • Guilherme Carvalho (ggc) • Guilherme Moura (gsm) • Nitai Bezerra (nbs) • Pedro Montenegro (pmr)

  3. Roteiro • Introdução a RI • Papel dos Agentes em RI • Agentes na WEB • Recomendação • Filtragem • Notificadores • E-commerce • Chatterbots

  4. Recuperação de Informação Motivação Usuário Web Pages 1870 found. “Morrendo ignorante num mar de informações” - Dificuldade de localizar documentos relevantes !! Como funciona? Necessidade de Informação Representação Consulta Documentos Indexação Formulação Casamento

  5. Tarefa típica de Recuperação de Informação (RI) • Dados • Um corpus de documentos (itens de dados) & • Uma consulta do usuário (representada por palavras-chave) • Encontrar • Um conjunto ordenados de documentos que são relevantes para a consulta

  6. Usuário Consulta 1. Doc1 2. Doc2 3. Doc3 . . Documentos ordenados Sistemas de RI Corpus de documentos Sistema de RI

  7. Recuperação de InformaçãoDefinição • Área de pesquisa e desenvolvimento que • investiga métodos e técnicas • para a representação, a organização, o armazenamento, a busca e a recuperação de itens de informação • Objetivo principal • facilitar o acesso a documentos (itens de informação) relevantes à necessidade de informação do usuário • Geralmente representada através de consultas baseadas em palavras-chaves

  8. Papel dos Agentes em RI(A Internet) • Informações diversificadas • Usuários diversificados • Desafios • informação aos usuários não-técnicos; • libertar os usuários das tarefas repetitivas da WEB; • envio de informações relevantes aos usuários. • Formato, Conteúdo.

  9. Papel dos Agentes em RI(Motivação) • Rápido crescimento do volume de informações disponível na Internet • Velocidade em encontrar informação é diferencial competitivo • Dificuldade em localizar documentos relevantes • Alto consumo de tempo • Síndrome da Nau perdida TOO MUCH INFORMATION = NO INFORMATION

  10. Agentes na Web • Objetivos: • Obter uma quantidade de informações razoável ao usuário. • Trazer as informações que correspondam ao perfil e necessidade do usuário. • Fazer com que estas informações sejam de qualidade.

  11. Agentes em Sistemas de Recomendação • Recomendam itens de informação ao usuário de acordo com o seu perfil • Exemplos • WebMate • Letizia • InfoAgent

  12. WebMate 1/5 • Agente de busca pessoal (assistente digital). • Acompanha o usuário enquanto ele navega na Internet: • Recomenda novas URLs; • Oferece os documentos web mais relevantes; • Responde ao feedback do usuário; • Compila um jornal pessoal diário com links para documentos de interesse do usuário.

  13. WebMate 2/5 • A arquitetura do WebMate consiste em: • um proxy autônomo que monitora as ações do usuário; • um controlador applet que interage com o usuário.

  14. WebMate 3/5

  15. WebMate 4/5

  16. WebMate 5/5

  17. Letizia 1/3 • H.Lieberman-MIT. • Imita o comportamento do usuário, baseado em preferência, não em relevância. • Segue o usuário e tenta antecipar o que é de interesse, com heurísticas simples e metas. • HP dinâmica e acessível, com sugestões. • Aproveita o tempo inútil e é ético.

  18. Letizia 2/3 • Behavior-BR - justificativas • Interesse: seguir um link ou revisitá-lo, ou acessar muitas páginas sobre um assunto. • Desinteresse: desprezar um link ou retornar. • Persistência de interesse e “esquecimento”. • Achados ao acaso: tenta descobrir interesses não-óbvios.

  19. Letizia 3/3

  20. Info Agent 1/4 • Info Agent é composto de 3 componentes principais: • Webwatcher • SearchEngine UI • Bookmark Manager

  21. Info Agent 2/4 • Webwatcher • Procura por alterações em páginas web • Avisa ao usuário sobre tais alterações • Pode ser configurado da maneira desejada.

  22. Info Agent 3/4 • SearchEngine UI • SearchEngine Dmoz searchAndBrowse: 'Squeak‘ • SearchEngine Dmoz searchAndManage: 'Squeak‘ • Varre os resultados da Busca por URLs e insere no Bookmark Manager

  23. Info Agent 4/4 • Bookmark Manager • Documentos do WebWatcher: “Webwatched Documents” • Documentos resultantes de buscas: “Search Results”

  24. Agentes em Sistemas de Filtragem Motivações • Crescimento do volume de informações em ambientes distribuídos • Dificuldade em localizar documentos relevantes • Consumo de tempo Ferramentas que automatizam a recuperação de informações

  25. Mail News BIndex ... Filtragem Introdução • Definição Agentes que filtram colhem informações de várias fontes e selecionam documentos baseados em determinados critérios • Existem vários exemplos de filtragem de informações Foco em Informações na Internet

  26. Técnica de Representação de Textos • Extração de conceitos importantes em documentos • Heurística de frequência de palavras • EX: Term Frequency-Inverse Document Frequency (TFIDF) • Fórmula: • TFIDF(W) = TF(W) * log |D|/ DF(W) • onde |D| é o número total de documentos do conjunto • Maior frequência no documento e rara presença nos outros indica maior relevância • Palavras com maiores pesos são selecionadas formando um vetor de representação do documento

  27. EXEMPLOS • BORGES ( A . F. SMEATON , 1996 ) • Usuário especifica palavras ou frases • Destaca palavras polisemânticas, mostrando significados alternativos, para que o usuário escolha • O sistema expande o perfil do usuário, incluindo termos relacionados

  28. EXEMPLOS • WebWatcher (http://cs.cmu.edu/afs/Web/People/webwatcher) • Usuário especifica palavras-chaves • Duas páginas estão relacionadas, se alguma terceira página apontar para ambas • O algoritmo usa “informação mútua” como uma medida de similaridade para comparar links

  29. EXEMPLOS • LAW (D. Bayer, 1995) • Monitora ações do usuário (bookmarking, impressão de páginas, etc...) • Características dos documentos Modelar o perfil do usuário • Um robô autônomo busca páginas relevantes, de acordo com este perfil

  30. EXEMPLOS • SAMURAI (H. Leong, S. Kapur, O de Vel, 1997) • É composto de 5 módulos: • Sumarização do texto • Monitoração e modelagem do usuário • Máquina de busca • Filtragem de links • Compilação dos resultados • WEBSOM (http://websom.hut.fi/websom/) • SYSKILL (http://www.ics.uci.edu/pazzani/Syskill.html)

  31. EXEMPLOS • Bullseye • Desktop software • Utiliza cerca de 600 search engines • NewsHound • Busca notícias de diversos jornais a partir do perfil do usuário. • Envia estas informações através de e-mail ou páginas html. • Utiliza critérios de relevância.

  32. EXEMPLOS • NewsWeeder (uso experimental Carnegie Mellon University) • Usuário visita cada NewsGroup e avalia artigos com notas de 1 a 5 • Perfil do usuário a partir das notas • 50 melhores artigos selecionados de acordo com seu perfil • A classificação Técnicas de medidas de similaridade

  33. EXEMPLOS • Pefna (Universidade de Estocolmo - Kilander) • Categorias em ordem de importância • Bom exemplo da categoria é assinalado para seu treinamento • Categoria pode conter um ou mais exemplos • Comparação Medidas de similaridade com categorias existentes

  34. Notificadores WEB • Serviço automático ativado por algum evento ocorrido dentro de um critério; • Critérios são geralmente definidos por termos; • Agentes enviam mensagens (e-mail, SMS...) para usuários registrados;

  35. Como funcionam? • Trabalham em conjunto com outro serviço de informação • Acionado quando o critério é atingido • Exemplos: • Google Alert • ChangeDetect

  36. Google Alert 1/2 • Cadastra termos de busca no google • Classificação: • News (Artigos) • Web (Internet “top20”) • News and Web (Artigos e Internet “top20”) • Groups (Google Groups) • Envia e-mail quando o termo combina com novos resultados

  37. Google Alert 2/2 • Forma ‘Google’ de criar e gerenciar as entradas • Simples • Intuitivo

  38. ChangeDetect 1/3 • Notifica sobre modificações em páginas cadastradas para usuários; • Destaca as modificações nas páginas por códigos de cor; • Muito “completo”: • detecções constantes ou programadas • filtragem extra • categorias personalizadas • várias formas de notificação • detecta modificações em vários formatos de arquivo

  39. ChangeDetect 2/3 • É extremamente configurável • pode ser um problema...

  40. ChangeDetect 3/3

  41. Agentes em Sistemas de E-Commerce • Automatizar parte do processo -> economia • Comparar produtos de diferentes vendedores • Quão fácil é expressar suas preferências para a tarefa? • Comprar um presente • Decisões sub-ótimas -> riscos • Comprar um carro, vender e comprar ações

  42. Consumer Buying Behaviour • Identificação da necessidade • Busca pelo produto • Busca pelo vendedor • Negociação • Compra e entrega • Avaliação Estágios “agent-centric”!

  43. Tecnologias • Sistemas de recomendação • Filtragem baseada em conteúdo • Filtragem colaborativa • Filtragem baseada em restrições • Negociação • Constraint Satisfaction Problem • Teoria da utilidade multi-atributo

  44. Identificação da Necessidade • Fornecer nova informação que possa motivar o usuário a comprar algo. • Filtragem • Resolução de constraints • Filtragem colaborativa • Agentes monitores

  45. Escolha do produto • Definir "o que" comprar • "Serendipity“ • Estratégia • Resolução de constraints • Filtragem colaborativa • Função de utilidade multi-atributo

  46. Escolha do Vendedor • Definir "de quem" comprar • Consultar vários sites de vendas on-line • Dificuldade: criar "wrappers" para cada site • Solução: Web Semântica = XML + RDF + OWL • Exemplo • BargainFinder • Jango • Tete-a-tete

  47. Negociação • Tecnologias • Constraint Satisfaction Problem • Teoria da utilidade multi-atributo • Leilões • Exemplos: • Kasbah • AuctionBot • Tete-a-tete

  48. Chatterbots • Sistemas capazes de dialogar com os usuários em linguagem natural restrita • Agentes inteligentes • Simular uma conversa • Troca de mensagens de texto • Tornar mais familiar a interação entre o homem e a máquina • Impressão de que o computador possui uma personalidade

  49. Exemplos de Aplicações • Uma “recepcionista” em um site comercial • Responder a FAQs (Frequently Asked Questions) • Atuar na área educacional dando suporte ao estudo e pesquisa • Entretenimento

  50. Exemplo de Diálogo Vendedor: “Olá! O que você está procurando?” Usuário: “Um notebook para meu negócio de consultoria.” Vendedor: “Por favor descreva se você tem alguma restrição de preços.” Usuário: “Não é muito importante. Estou interessado em alta performance.” Vendedor: “Você está procurando algum notebook topo-de-linha?” Usuário: “Sim, exatamente!” Vendedor: “Acredito que temos o produto certo para você. Clique aqui para ver o MacBook Pro 2.16Ghz”

More Related