240 likes | 342 Views
INQUER Interacção Pessoa-Máquina em Linguagem Natural. MÓDULO II Inferência e Extracção de Informação. Ricardo Santos, 2003. Tópicos. INQUER. WordNet.PT. Módulo II - Inferência e Extracção de Informação. Extracção e Tratamento da Base de Dados.
E N D
INQUERInteracção Pessoa-Máquina em Linguagem Natural MÓDULO II Inferência e Extracção de Informação Ricardo Santos, 2003
Tópicos • INQUER • WordNet.PT • Módulo II - Inferência e Extracção de Informação • Extracção e Tratamento da Base de Dados • Alg. de Consulta e Extracção de Informação • Inferência e Extraccão de Informação • Interface (site do INQUER)
MÓDULO I Analisador MÓDULO II Motor de Inferência MÓDULO III Gerador Arquitectura Geral do INQUER Pergunta (Português) INQUER Base de Dados Lexical Forma Lógica Base de Dados Léxico-Conceptual (WordNet.PT) Forma Lógica Resposta Resposta (Português)
WordNet.PT • Base de Dados do Conhecimento Linguístico • Rede Léxico-Conceptual • Capta padrões da organização do léxico mental
{animal} {mamífero} {cão} ... {gato} Relações entre conceitos lexicalizados • Relações estruturantes • Sinonímia ex. borrego-cordeiro; rabanada-fatia dourada • Hiperonímia / Hiponímia ex. gato-mamífero; mamífero-animal hiperonímia/ generalização • Cada conceito tem uma glosa associada hiponímia/ especialização
Relações de Todo-Parte • Holonímia / Meronímia ex. açorda-pão; sangria-açúcar • Holo-parte / Mero-parte ex. árvore-tronco; leão-juba • Holo-membro / Mero-membro ex. enxame-abelha; pinhal-pinheiro • Holo-porção / Mero-porção ex. bolo-fatia; melão-talhada • Holo-matéria / Mero-matéria ex. carne de porco-fiambre • Holo-localização / Mero-localização ex. cidade-baixa
Relações internas à estrutura do evento • Role / Involved ex. gordura-fritar • Agente / Envolve Agente ex. cão-ladrar; gato-miar • Paciente (Objecto) / Envolve Paciente (Objecto) ex. vaca-ordenhar; almoço-almoçar • Resulta / Tem Resultado ex. bolo-cozer; fumado-fumar
Arquitectura Geral - Módulo II Representação Semântica (Forma Lógica - LPO) INFERÊNCIA e EXTRACÇÃO de INFO. Processamento da FL PERG. POLARES PERG. SOBRE ARG. Alg. Satisf. da FL Alg. Segm. da FL INFERÊNCIA Base de Dados Léxico-Conceptual (WordNet.PT) Alg. de Consulta Alg. de Extracção Resposta (em linguagem artificial)
Extracção e Tratamento da BD • Construção de ficheiros consultáveis pelo Prolog WordNet.PT Ficheiros de Texto Extracção de Dados Polaris Geração de Ficheiros Prolog Detonador Base de Dados INQUER Ficheiros Prolog Ordenação e Remoção de redundâncias
Algoritmos de Consulta e Extracção de Informação • Correspondência entre Termos/Expressões em LN e relações da WN.PT
Algoritmos de Consulta e Extracção de Informação • Implementação dos algoritmos usando predicados que representam relações da WN.PT • Predicados: • has_hyponym/2 • has_meronym/2 • gloss/2 • etc.
Inferência & Extracção de Info. • Dois tipos de pergunta • Polares (consulta) • Sobre argumentos (consulta e extracção) • Inferência (Porquê?) • A Base de Dados não contém todo o conhecimento de forma explícita • Necessário mecanismo capaz de inferir informação implícita
has_hyponym(gato,'gato siamês'). has_hyponym(felino,gato). has_mero_part(felino,pata). x (gato_siamês(x) gato(x)) x (gato(x) felino(x)) x (felino(x) (y (pata(y) ter(x,y))) felino pata gato gato siamês Inferência Factos Prolog Forma Lógica
Perguntas Polares • Uma Forma Lógica é verdadeira ou falsa num determinado modelo (WN.PT) • Pressuposto de Mundo Fechado • Satisfação da Forma Lógica A sse B - A é satisfazível em WN.PT se e só se a condição B se verifica • Todos os felinos miam? - Não | -Alguns felinos miam? - Sim
Perguntas sobre Argumentos Algoritmo: 1- Segmenta a FL devolvendo uma lista com os predicados executáveis que a compõem 2- Executa os predicados extraindo conjuntos de conceitos 3- Faz a intersecção desses conjuntos 4- Devolve resultado
Exemplo Quais são os carnívoros que têm focinho? [qual(A)*>d(o,plu,B,carnívoro(B)&d(exi,sing,C,felino(C) &ter(B,C))>ser_v(A,B)))] 1- [ter(D,focinho), ser_v(E,carnívoro)] 2-conj1 (ter_focinho) [canídeo, marsupial, coelho, lebre, doninha, felino, equídeo, urso, roedor, ruminante, toupeira, ...] conj2 (ser_carnívoro) [canídeo, ave de rapina, fuínha, furão, marta, orca, felino, crocodilo, jacaré, tubarão branco, ...]
Exemplo (cont.) 3- [canídeo, diabo da Tasmânia, felino, fuínha, furão hiena, marta, ouriço-cacheiro] 4- canídeo, diabo da Tasmânia, felino, fuínha, furão hiena, marta, ouriço-cacheiro Resposta à pergunta: Quais são os carnívoros que têm focinho?
Processamento da Forma Lógica • Integração dos Módulos (Perg. Polares e Perg. Sobre Argumentos) • Análise da FL e reencaminhamento para o respectivo Módulo • Perguntas Ambíguas • Uma resposta para cada interpretação • Coordenações (ex. Os gatos e os cães são animais?) • Aplicação do processo de inferência e extracção de informação a cada componente da coordenação
Interface • Site do INQUER - Arquitectura Prolog-CGI Script Pergunta Form HTML Pedido HTTP Página HTML Página HTML Resposta Web Browser Servidor CLUL
Demonstração do site http://www.clul.ul.pt/clg/inquer
Em síntese • Estudo da WordNet.PT • Extracção e Tratamento da Base de Dados • Implementação dos Algoritmos de Consulta e Extracção • Implementação dos mecanismos de obtenção de resposta para os dois tipos de pergunta • Construção do site do INQUER
Trabalho Futuro – Módulo II • Melhorar a rapidez dos algoritmos de busca e extracção de info. • Cobrir todas as relações semânticas utilizadas pela WN.PT • Considerar: • Interrogativas de Alternativa - ex. os gatos são felinos ou canídeos? • Interrogativas sobre Adjuntos Causais - ex. por que é que os peixes têm guelras? • Interrogativas que envolvem comparação - ex. o que têm em comum um gato e um cão?
Trabalho Futuro - INQUER • Desenvolvimento do Módulo III – Geração em LN • Módulo de Fala (Reconhecimento e Síntese) Rumo ao HAL9000...