1 / 24

INQUER Interacção Pessoa-Máquina em Linguagem Natural

INQUER Interacção Pessoa-Máquina em Linguagem Natural. MÓDULO II Inferência e Extracção de Informação.  Ricardo Santos, 2003. Tópicos. INQUER. WordNet.PT. Módulo II - Inferência e Extracção de Informação. Extracção e Tratamento da Base de Dados.

derica
Download Presentation

INQUER Interacção Pessoa-Máquina em Linguagem Natural

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. INQUERInteracção Pessoa-Máquina em Linguagem Natural MÓDULO II Inferência e Extracção de Informação  Ricardo Santos, 2003

  2. Tópicos • INQUER • WordNet.PT • Módulo II - Inferência e Extracção de Informação • Extracção e Tratamento da Base de Dados • Alg. de Consulta e Extracção de Informação • Inferência e Extraccão de Informação • Interface (site do INQUER)

  3. MÓDULO I Analisador MÓDULO II Motor de Inferência MÓDULO III Gerador Arquitectura Geral do INQUER Pergunta (Português) INQUER Base de Dados Lexical Forma Lógica Base de Dados Léxico-Conceptual (WordNet.PT) Forma Lógica Resposta Resposta (Português)

  4. WordNet.PT • Base de Dados do Conhecimento Linguístico • Rede Léxico-Conceptual • Capta padrões da organização do léxico mental

  5. {animal} {mamífero} {cão} ... {gato} Relações entre conceitos lexicalizados • Relações estruturantes • Sinonímia ex. borrego-cordeiro; rabanada-fatia dourada • Hiperonímia / Hiponímia ex. gato-mamífero; mamífero-animal hiperonímia/ generalização • Cada conceito tem uma glosa associada hiponímia/ especialização

  6. Relações de Todo-Parte • Holonímia / Meronímia ex. açorda-pão; sangria-açúcar • Holo-parte / Mero-parte ex. árvore-tronco; leão-juba • Holo-membro / Mero-membro ex. enxame-abelha; pinhal-pinheiro • Holo-porção / Mero-porção ex. bolo-fatia; melão-talhada • Holo-matéria / Mero-matéria ex. carne de porco-fiambre • Holo-localização / Mero-localização ex. cidade-baixa

  7. Relações internas à estrutura do evento • Role / Involved ex. gordura-fritar • Agente / Envolve Agente ex. cão-ladrar; gato-miar • Paciente (Objecto) / Envolve Paciente (Objecto) ex. vaca-ordenhar; almoço-almoçar • Resulta / Tem Resultado ex. bolo-cozer; fumado-fumar

  8. Arquitectura Geral - Módulo II Representação Semântica (Forma Lógica - LPO) INFERÊNCIA e EXTRACÇÃO de INFO. Processamento da FL PERG. POLARES PERG. SOBRE ARG. Alg. Satisf. da FL Alg. Segm. da FL INFERÊNCIA Base de Dados Léxico-Conceptual (WordNet.PT) Alg. de Consulta Alg. de Extracção Resposta (em linguagem artificial)

  9. Extracção e Tratamento da BD • Construção de ficheiros consultáveis pelo Prolog WordNet.PT Ficheiros de Texto Extracção de Dados Polaris Geração de Ficheiros Prolog Detonador Base de Dados INQUER Ficheiros Prolog Ordenação e Remoção de redundâncias

  10. Algoritmos de Consulta e Extracção de Informação • Correspondência entre Termos/Expressões em LN e relações da WN.PT

  11. Correspondências LN-WN.PT (cont.)

  12. Algoritmos de Consulta e Extracção de Informação • Implementação dos algoritmos usando predicados que representam relações da WN.PT • Predicados: • has_hyponym/2 • has_meronym/2 • gloss/2 • etc.

  13. Inferência & Extracção de Info. • Dois tipos de pergunta • Polares (consulta) • Sobre argumentos (consulta e extracção) • Inferência (Porquê?) • A Base de Dados não contém todo o conhecimento de forma explícita • Necessário mecanismo capaz de inferir informação implícita

  14. has_hyponym(gato,'gato siamês'). has_hyponym(felino,gato). has_mero_part(felino,pata). x (gato_siamês(x)  gato(x)) x (gato(x)  felino(x)) x (felino(x)  (y (pata(y)  ter(x,y))) felino pata gato gato siamês Inferência Factos Prolog Forma Lógica

  15. Perguntas Polares • Uma Forma Lógica é verdadeira ou falsa num determinado modelo (WN.PT) • Pressuposto de Mundo Fechado • Satisfação da Forma Lógica A sse B - A é satisfazível em WN.PT se e só se a condição B se verifica • Todos os felinos miam? - Não | -Alguns felinos miam? - Sim

  16. Perguntas sobre Argumentos Algoritmo: 1- Segmenta a FL devolvendo uma lista com os predicados executáveis que a compõem 2- Executa os predicados extraindo conjuntos de conceitos 3- Faz a intersecção desses conjuntos 4- Devolve resultado

  17. Exemplo Quais são os carnívoros que têm focinho? [qual(A)*>d(o,plu,B,carnívoro(B)&d(exi,sing,C,felino(C) &ter(B,C))>ser_v(A,B)))] 1- [ter(D,focinho), ser_v(E,carnívoro)] 2-conj1 (ter_focinho) [canídeo, marsupial, coelho, lebre, doninha, felino, equídeo, urso, roedor, ruminante, toupeira, ...] conj2 (ser_carnívoro) [canídeo, ave de rapina, fuínha, furão, marta, orca, felino, crocodilo, jacaré, tubarão branco, ...]

  18. Exemplo (cont.) 3- [canídeo, diabo da Tasmânia, felino, fuínha, furão hiena, marta, ouriço-cacheiro] 4- canídeo, diabo da Tasmânia, felino, fuínha, furão hiena, marta, ouriço-cacheiro Resposta à pergunta: Quais são os carnívoros que têm focinho?

  19. Processamento da Forma Lógica • Integração dos Módulos (Perg. Polares e Perg. Sobre Argumentos) • Análise da FL e reencaminhamento para o respectivo Módulo • Perguntas Ambíguas • Uma resposta para cada interpretação • Coordenações (ex. Os gatos e os cães são animais?) • Aplicação do processo de inferência e extracção de informação a cada componente da coordenação

  20. Interface • Site do INQUER - Arquitectura Prolog-CGI Script  Pergunta Form HTML Pedido HTTP Página HTML Página HTML Resposta Web Browser Servidor CLUL

  21. Demonstração do site http://www.clul.ul.pt/clg/inquer

  22. Em síntese • Estudo da WordNet.PT • Extracção e Tratamento da Base de Dados • Implementação dos Algoritmos de Consulta e Extracção • Implementação dos mecanismos de obtenção de resposta para os dois tipos de pergunta • Construção do site do INQUER

  23. Trabalho Futuro – Módulo II • Melhorar a rapidez dos algoritmos de busca e extracção de info. • Cobrir todas as relações semânticas utilizadas pela WN.PT • Considerar: • Interrogativas de Alternativa - ex. os gatos são felinos ou canídeos? • Interrogativas sobre Adjuntos Causais - ex. por que é que os peixes têm guelras? • Interrogativas que envolvem comparação - ex. o que têm em comum um gato e um cão?

  24. Trabalho Futuro - INQUER • Desenvolvimento do Módulo III – Geração em LN  • Módulo de Fala (Reconhecimento e Síntese)  Rumo ao HAL9000...

More Related