400 likes | 533 Views
UM MODELO DE EXTRAÇÃO DE PROPRIEDADES DE TEXTOS USANDO PENSAMENTO NARRATIVO E PARADIGMÁTICO. Ana Teresa Contier Prof. Dr. Marcio Lobo Netto Escola Politécnica-USP Dissertação de Mestrado- 2007. Agenda. Ciência Cognitiva: inspiração teórica para o desenvolvimento de software Objetivos
E N D
UM MODELO DE EXTRAÇÃO DE PROPRIEDADES DE TEXTOS USANDOPENSAMENTO NARRATIVO E PARADIGMÁTICO Ana Teresa Contier Prof. Dr. Marcio Lobo Netto Escola Politécnica-USP Dissertação de Mestrado- 2007
Agenda • Ciência Cognitiva: inspiração teórica para o desenvolvimento de software • Objetivos • Conceitos fundamentais – pensamento narrativo, paradigmático e gêneros do discurso • Aplicação dos conceitos reavaliados no software “Aristóteles” • Implementação • Resultados • Considerações finais • Trabalhos futuros
Ciência Cognitiva: inspiração teórica para o desenvolvimento de software • O que é o pensamento? • Organiza dados em categorias; • É expresso por signos; • Estabelece conexões semânticas entre os signos. • Pensamento lingüístico: • Voz interna; • Expresso por narrativa e por sentenças lógicas .
Objetivos • Analisar e ampliar as definições de pensamento paradigmático e narrativo feitas por Bruner (1986); • Mostrar como o pensamento narrativo e o paradigmático atuam de forma conjunta; • Criar o software “Aristóteles” em que proposições sejam extraídas de narrativas.
Pensamento Paradigmático conforme Bruner • Base da definição: Ciências Exatas; • Busca a verdade universal; • Convence o interlocutor fornecendo provas empíricas; • Segue a causalidade (se x, então y); • Forma proposições; • Regido pela consistência • Preenche um ideal de um sistema formal e matemático de descrição e explicação. Ele emprega a categorização ou a conceituação;
Pensamento narrativo conforme Bruner • Base da definição: Teoria Literária; • Busca a verossimilhança; • Apresenta condições prováveis entre dois eventos; • Transgride a consistência podendo ser contraditório; • Busca a abstração, transcende o particular; • Existência de gatilho para mudança de um plano para o outro. • Construção de mundos possíveis
Gênero conforme Bakhtin • Adquirido durante comunicação verbal • Padrões de discurso • Reflete na construção do pensamento
Comparação entre os conceitos de Bruner e os aplicados em “Aristóteles”
Comparação entre os conceitos de Bruner e os aplicados em “Aristóteles”
“Aristóteles”: implementação • Classifica narrativas em dois gêneros: policial e romântico. • Extrai proposições das narrativas. • Escrito em Java • Inspirado em Inteligência Artificial Simbólica (IAS) • Simplificação de Sistema Especialista Simbólico (SES)
“Aristóteles”: implementação • Serão admitidas somente orações simples: SUJEITO + VERBO + OBJETOS + ADVÉRBIO DE TEMPO + ADVÉRBIO DE ESPAÇO. • Histórias são narradas em 3ª pessoa. As personagens são observadas pelo narrador, ou seja, o usuário do programa.
“Aristóteles”: interface Sujeito Verbo Objeto1 Objeto2 Advérbio de tempo Advérbio de espaço Contador de gênero Narrativa digitada Proposições aparecem neste campo
“Aristóteles”: ImplementaçãoGramática de entrada • Sujeito : quem faz a ação. Na narrativa se for nome próprio exerce o papel de personagem. • Verbo: indica a ação da narrativa. Aceita somente verbo no infinitivo. • Objetos 1 e 2: complemento do verbo. Na narrativa, se for nome próprio representa o personagem.
“Aristóteles”: ImplementaçãoGramática de entrada • Advérbio de tempo: quando a ação ocorre. Representa o tempo da narrativa. Aceita somente a forma dd/mm/yyyy. • Advérbio de lugar: onde ocorreu a ação. Representa o cenário da narrativa.
Como usar “Aristóteles” Juliana | estar | assustada | | 7/11/2001 | Juliana | ouvir | tiros | | 7/11/2001 | na sala Juliana | ligar | para polícia | | 7/11/2001 | A luz | ser | cortada | | 7/11/2001 | Juliana | não completar | a ligação | | 7/11/2001 | Juliana | pegar | lanterna | | 7/11/2001 | Juliana | ver |dois corpos | | 7/11/2001 | na sala Juliana | ver | vulto | | 7/11/2001 | no sótão Ricardo | ter | arma | | 7/11/2001 | Juliana | correr | | | 7/11/2001 |
Como usar “Aristóteles” Juliana | estar | assustada | | 7/11/2001 | Juliana | ouvir | tiros | | 7/11/2001 | na sala Juliana | ligar | para polícia | | 7/11/2001 | A luz | ser | cortada | | 7/11/2001 | Juliana | não completar | a ligação | | 7/11/2001 | Juliana | pegar | lanterna | | 7/11/2001 | Juliana | ver |dois corpos | | 7/11/2001 | na sala Juliana | ver | vulto | | 7/11/2001 | no sótão Ricardo | ter | arma | | 7/11/2001 | Juliana | correr | | | 7/11/2001 | Ricardo | atirar | | | 7/11/2001 | Juliana | estar | | ensangüentada | 7/11/2001| Juliana | morrer | | | 7/11/2001 | Assassino é ricardo.
“Aristóteles”: ImplementaçãoArquitetura do Programa Categoria (regras de sintaxe e parsing) Conceito (palavras) Nome (nomes femininos/ masculinos) Sujeito Verbo Objetos Tempo Lugar PensamentoNarrativo (lista sentenças narrativas) SentencaNarrativa (sujeito,verbo,objetos,advérbios)
“Aristóteles”: ImplementaçãoArquitetura do Programa Genero (classe pai abstrata) Romantico (algoritmos de reconhecimento) Policial (algoritmos de reconhecimento) Peso (pesos associados às palavras) AssociacaoNota (notas associadas às sentenças) AdministradorGenero (armazena os gêneros)
“Aristóteles”: ImplementaçãoArquitetura do Programa - Gênero • Simplificação de Sistema Especialista Simbolista. • Define se a narrativa pertence ao gênero policial ou romântico. • Faz a pergunta correspondente ao gênero classificado: Romântico: o mocinho conquista o amor da mocinha? Policial: quem é o assassino? • Busca a resposta.
“Aristóteles”: para definir o gênero • Consulta de um dicionário com palavras-chave de cada gênero. Estas palavras possuem um valor correspondente. Aquele gênero que possuir maior valor absoluto é o gênero escolhido. • Pontuação: 0 = muito pouco provável 1 = pouco provável 3 = provável 5 = muito provável
“Aristóteles”: gênero policial Para descobrir o morto • Localizar nomes próprios que estejam associados às seguintes orações: Ser (mort, esfaquead,envenenad, ensanguentad); Estar (mort, esfaquead,envenenad, ensanguentad); Morrer; Receber tiro.
“Aristóteles”: gênero policial Juliana | estar | assustada | | 7/11/2001 | Juliana | ouvir | tiros | | 7/11/2001 | na sala Juliana | ligar | para polícia | | 7/11/2001 | A luz | ser | cortada | | 7/11/2001 | Juliana | não completar | a ligação | | 7/11/2001 | Juliana | pegar | lanterna | | 7/11/2001 | Juliana | ver |dois corpos | | 7/11/2001 | na sala Juliana | ver | vulto | | 7/11/2001 | no sótão Ricardo | ter | arma | | 7/11/2001 | Juliana | correr | | | 7/11/2001 | Ricardo | atirar | | | 7/11/2001 | Juliana | estar | | ensangüentada | 7/11/2001 | Juliana | morrer | | | 7/11/2001 |
“Aristóteles”: gênero policial Para descobrir quem é o assassino • Localizar nomes próprios que estejam relacionados às orações do diário. • Somar os valores referentes à sentença. • Aquele(a) que tiver maior pontuação é o assassino(a).
“Aristóteles”: gênero policial • Cada sentença possui um valor 1, 3 ou 5. • Exemplos: Possuir arma; faca; revólver – 1 Pesquisar (química; medicina; biologia) – 1 Não gostar do morto - 3 Desejar (herança, esposa, marido, imóvel, imóveis, bens, ações, dinheiro, fortuna do morto) – 3 Possuir (digitais, arma, copo, faca) – 5 Ser encontrado/a (sangue, mancha de sangue) - 5
“Aristóteles”: gênero policial • Juliana | estar | assustada | | 7/11/2001 | • Juliana | ouvir | tiros | | 7/11/2001 | na sala • Juliana | ligar | para polícia | | 7/11/2001 | • A luz | ser | cortada | | 7/11/2001 | • Juliana | não completar | a ligação | | 7/11/2001 | • Juliana | pegar | lanterna | | 7/11/2001 | • Juliana | ver |dois corpos | | 7/11/2001 | na sala • Juliana | ver | vulto | | 7/11/2001 | no sótão • Ricardo | ter | arma | | 7/11/2001 | • Juliana | correr | | | 7/11/2001 | • Ricardo | atirar | | | 7/11/2001 | • Juliana | estar | | ensangüentada | 7/11/2001 | • Juliana | morrer | | | 7/11/2001 | • Assassino é ricardo.
“Aristóteles”: gênero romântico Para descobrir quem é a mocinha: • Procurar nomes femininos nos campos “sujeito” e “objetos”. • Verificar se a ação relacionada ao nome se encontra no diário. • Dar o valor correspondente para o nome encontrado. • Aquela que tiver maior valor absoluto é o mocinha.
“Aristóteles”: gênero romântico • As sentenças relacionadas à mocinha possuem uma nota que pode ser 1, 3 ou 5. • Exemplos: (ser/estar)apaixonada - 3 Amar - 5 Dar presente - 1
“Aristóteles”: gênero romântico Paula | ser | amiga | Fabiana | 14/10/2000 | Fabiana | gostar | Caio | | 14/10/2000 | Paula | conhecer | Fabiana | | 7/7/1990 | Caio| beijar | Fabiana | | 10/12/1995 | Fabiana | estar | apaixonada | Caio | 11/02/1999 | Caio | trair | Fabiana | | 14/10/2000 | no parque Paula | ver | traição | Caio | 14/10/2000 | no parque Paula | contar | Fabiana | | 15/10/2000 | na casa Fabiana | chorar | | | 15/10/2000 | na casa Fabiana Fabiana | brigar | Caio | | 17/10/2000 | restaurante Caio | mentir | Fabiana | | 17/10/2000 | restaurante Fabiana | perder | confiança |Caio | 17/10/2000 | restaurante
“Aristóteles”: gênero romântico Para descobrir quem é o mocinho: • Procurar nomes masculinos nos campos “sujeito” e “objetos”. • Verificar se a ação relacionada ao nome se encontra no diário. • Dar o valor correspondente para o nome encontrado • Aquele que tiver maior valor absoluto é o mocinho.
“Aristóteles”: gênero romântico • As sentenças relacionadas ao mocinho possuem uma nota que pode ser 1, 3 ou 5. • Exemplos: Beijar - 3 Lutar - 5 Dar presente - 1
“Aristóteles”: gênero romântico Paula | ser | amiga |Fabiana| 14/10/2000 | Fabiana | gostar | Caio | | 14/10/2000 | Paula | conhecer | Fabiana | | 7/7/1990 | Caio| beijar | Fabiana | | 10/12/1995 | Fabiana | estar | apaixonada | Caio | 11/02/1999 | Caio | trair | Fabiana | | 14/10/2000 | no parque Paula | ver | traição | Caio | 14/10/2000 | no parque Paula | contar | Fabiana | | 15/10/2000 | na casa Fabiana | chorar | | | 15/10/2000 | na casa Fabiana Fabiana | brigar | Caio | | 17/10/2000 | restaurante Caio | mentir | Fabiana | | 17/10/2000 | restaurante Fabiana | perder | confiança |Caio | 17/10/2000 | restaurante
“Aristóteles”: gênero romântico Para saber se o mocinho conquista ou não a mocinha • Buscar sentenças do diário relacionadas ao mocinho. Somar os pontos, se a soma for positiva, o mocinho conquista a mocinha; se a soma for negativa, o mocinho não conquista a mocinha.
“Aristóteles”: gênero romântico • As notas podem ser: 1, -1, 3, -3 ou 5, -5 . • Exemplos: Ser perdoado: 5 Contar mentira(s): (-3) Amar: 5 Trair: (-5)
“Aristóteles”: gênero romântico Paula | ser | amiga | Fabiana | 14/10/2000 | Fabiana | gostar | Caio | | 14/10/2000 | Paula | conhecer | Fabiana | | 7/7/1990 | Caio| beijar | Fabiana | | 10/12/1995 | Fabiana | estar | apaixonada | Caio | 11/02/1999 | Caio | trair | Fabiana | | 14/10/2000 | no parque Paula | ver | traição | Caio | 14/10/2000 | no parque Paula | contar | Fabiana | | 15/10/2000 | na casa Fabiana | chorar | | | 15/10/2000 | na casa Fabiana Fabiana | brigar | Caio | | 17/10/2000 | restaurante Caio | mentir | Fabiana | | 17/10/2000 | restaurante Fabiana | perder | confiança |Caio | 17/10/2000 | restaurante caio não conquista amor de fabiana.
“Aristóteles”: suas ações Assim os dados de entrada formam sentenças e seu conjunto representa o Pensamento Narrativo. A narrativa criada será classificada em policial ou romântica de acordo com suas características. A saída do programa é uma proposição (pensamento paradigmático) que responde a uma pergunta típica do gênero determinado.
“Aristóteles”: saída - pensamento paradigmático • Respostas dadas às perguntas pré-definidas pelo gênero ao qual pertence à narrativa . • Para o gênero romântico estas são as possíveis respostas: • “(nome do mocinho) conquista o amor de (nome da mocinha)”; ou • “(nome do mocinho) não conquista o amor de (nome da mocinha)”; ou • “Não foi possível encontrar o mocinho”; ou • “Não foi possível encontrar a mocinha”.
“Aristóteles”: saída - pensamento paradigmático • Para o gênero policial estas são as possíveis respostas: • “O assassino é (nome do assassino)”; ou • “Não foi possível encontrar o assassino”.
“Aristóteles”: resultados e considerações finais • Testadas 10 narrativas • É possível criar narrativas coerentes a partir de uma gramática de entrada muito simples; • A classificação do gênero e as proposições encontradas foram adequadas. • As informações da interface gráfica estão bem claras, garantindo que o usuário não tenha dificuldade em usá-la. • O usuário, se desejar, pode usar o Test Run. • O usuário pode modificar os pesos, acrescentar palavras ao dicionário e orações ao diário. • Usando uma base lógica muito simples, pode-se extrair proposições a partir de narrativas.
Trabalhos futuros • Fazer o levantamento de outros gêneros que pertençam ao discurso do cotidiano e sejam expressos em forma de narrativa. E a partir disto estabelecer quais são as questões essenciais a tais gêneros, assim como, o formato das respostas. • Inserir na classe gênero um sistema de aprendizado para que seja possível a criação de novas regras e a exclusão das antigas. • Permitir que sejam criados pelo próprio sistema sub-gêneros, ou gêneros híbridos. • Aceitar períodos compostos e reconhecer as diversas flexões dos verbos. Criar história em primeira pessoa.