500 likes | 594 Views
TOTh’2014, 12/06/2014. Méthodologie d’ingénierie des connaissances pour la représentation des définitions lexicographiques dans le cadre de la théorie Sens-Texte. Maxime Lefrançois, Fabien Gandon , Alain Giboin Inria. Pourquoi étudier la Théorie Sens-Texte ?.
E N D
TOTh’2014, 12/06/2014 Méthodologie d’ingénierie des connaissances pour la représentation des définitions lexicographiques dans le cadre de la théorie Sens-Texte • Maxime Lefrançois, Fabien Gandon, Alain Giboin • Inria
Pourquoi étudier la Théorie Sens-Texte ? • Approches en sémantique lexicale • 1. Sémantique décompositionnelle • 2. Sémantique componentielle3. Sémantique relationnelle Richesse de description • Besoin de formalisation • Besoin de plus de couverture • Besoin pour le TALN • Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
Postulats de base • - Différents niveaux de représentation • - Des règles de transformation entre les niveaux • Le lexique tient une place centrale • Le Dictionnaire Explicatif et Combinatoire (DEC) Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
Informatisation du DEC et DEC informatisé ex: éditeur DECID (Sérasset, 1997) Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
Informatisation du DEC et DEC informatisé • recherche intelligente d’information • mise à jour et vérification automatique • déduction logique • paraphrasage • déduction du premier ordre Ingénierie des connaissances représenter, manipuler, échanger, interroger, raisonner avec les connaissances,... Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
Question de recherche et méthodologie Quel formalisme de représentation des connaissances serait adapté à la représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte ? « Formalisation de la conceptualisation d’un domaine » 1. La conceptualisation est-elle adaptée à une formalisation ? 2. Quel formalisme est adapté à cette conceptualisation ? 3. Comment peut-on opérationnaliser ce formalisme ? Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
Plan de la présentation 1. La conceptualisation est-elle adaptée à une formalisation ? 1.a. Conceptualisation des prédicats linguistiques 1.b. Conceptualisation des représentations linguistiques et des définitions lexicographiques 2. Quel formalisme est adapté à cette conceptualisation ? 2.a. Formalismes existants 2.b. Construction du formalisme des Graphes d’Unités 3. Comment peut-on opérationnaliser ce formalisme ? 3.a. Etude du raisonnement logique 3.b. Opérationnalisation sur le web des données t Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
1.a. 1. La conceptualisation est-elle adaptée à une formalisation ? 1.a. Conceptualisation des prédicats linguistiques 1.b. Conceptualisation des représentations linguistiques et des définitions lexicographiques 2. Quel formalisme est adapté à cette conceptualisation ? 2.a. Formalismes existants 2.b. Construction du formalisme des Graphes d’Unités 3. Comment peut-on opérationnaliser ce formalisme ? 3.a. Etude du raisonnement logique 3.b. Opérationnalisation sur le web des données t Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
Exemple d’extension de conceptualisation Langage : Types d’ (instances d’) Unités linguistiques & Unités linguistiques Usage : Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
Introduction au DEC • zone phonologique • zone morphologique • zone sémantique • zone de combinatoire • zone de stylistique, • zone d’exemple, • zone phraséologique, • zone de nota bene 4 volumes papier = environ 500 entrées seulement principal sujet d’étude des linguistes de la Théorie Sens-Texte Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
Zone sémantique du DEC> les définitions lexicographiques • Travaux de conceptualisation existant • choix des composantes selon les catégories d’unités lexicales (ex: sentiments) • la structuration est importante pour le TAL (Wanner, MTT’ 2003) • composantes suggérées par des étiquettes sémantiques • symboles de PosASém choisies dans un petit ensemble (à la FrameNet) • structuration en XML (projet Definiens) Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
Zone sémantique du DEC> les définitions lexicographiques Degré de formalisation non atteint aujourd’hui Conceptualisation espérée (dans la littérature): Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
Prédicats linguistiques • Type d’unité sémantique Positions actancielles • Type d’unité lexicale • Structure actancielle sémantique Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
Prédicats linguistiques • Type d’unité sémantique Positions actancielles • Type d’unité lexicale • Structure actancielle sémantique Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
Prédicats linguistiques • Type d’unité sémantique • Structure actancielle = Extension de la conceptualisation • Type d’unité lexicale • Structure actancielle sémantique Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
Prédicats linguistiques • Type d’unité sémantique • Structure actancielle = Positions actantielles sémantiques: = Les participants de la situation linguistique dénotée par L qui ont une position privilégiées auprès de L dans les phrases + critères linguistiques ! • Type d’unité lexicale • Structure actancielle sémantique Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
Prédicats linguistiques • Type d’unité sémantique • Structure actancielle = • Type d’unité lexicale • Structure actancielle sémantique Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
Héritage du sens • et spécialisation • des structures actancielles ? Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
Héritage du sens • et spécialisation • des structures actancielles ? contre-exemple 1. • (outil) • PosA 1 – personne qui utilise l’outil • PosA 2 – une activité ou une profession • (ciseaux) • PosA 1 – personne qui utilise l’outil • PosA 2 – l’objet à couper Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
Héritage du sens • et spécialisation • des structures actancielles ? contre-exemple 2. • (ustensile) • PosA 1 – personne qui utilise l’ustensile • PosA 2 – une activité • (bouilloire) • PosA 1 – personne qui utilise l’outil • PosA 2 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
Le niveau Sémantique Profond Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
Le niveau Sémantique Profond • introduction d’une notation /outil\ • définition de la structure actancielle sémantique profonde • choix des Symboles d’Actants: des rôles sémantiques lexicalisés • introduction des positions actancielles interdites SémP SémS • Héritage du sens • et spécialisation • des structures actancielles Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
1.b. 1. La conceptualisation est-elle adaptée à une formalisation ? 1.a. Conceptualisation des prédicats linguistiques 1.b. Conceptualisation des représentations linguistiques et des définitions lexicographiques 2. Quel formalisme est adapté à cette conceptualisation ? 2.a. Formalismes existants 2.b. Construction du formalisme des Graphes d’Unités 3. Comment peut-on opérationnaliser ce formalisme ? 3.a. Etude du raisonnement logique 3.b. Opérationnalisation sur le web des données t Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
Définitions lexicographiques ? Application au projet RELIEF (Lux-Pogodalla et Polguère, WoLeR’2009) Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
Repositionnement> 1. au niveau sémantique profond Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
Repositionnement> 2. au niveau du dictionnaire Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
Prototype d’éditeur de définitionslexicographiques avec la conceptualisationétendue Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
Prototype d’éditeur de définitionslexicographiques avec la conceptualisationétendue Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
Prototype d’éditeur de définitionslexicographiques avec la conceptualisationétendue Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
Prototype d’éditeur de définitionslexicographiques avec la conceptualisationétendue Offre une première base de discussion essentielle Confirme les attentes des lexicographes pour un tel outil Permet d’identifier des directions d’amélioration possible Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
2.a. 1. La conceptualisation est-elle adaptée à une formalisation ? 1.a. Conceptualisation des prédicats linguistiques 1.b. Conceptualisation des représentations linguistiques et des définitions lexicographiques 2. Quel formalisme est adapté à cette conceptualisation ? 2.a. Formalismes existants 2.b. Construction du formalisme des Graphes d’Unités 3. Comment peut-on opérationnaliser ce formalisme ? 3.a. Etude du raisonnement logique 3.b. Opérationnalisation sur le web des données t Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
Formalismes candidats Théorie Linguistique Sens-Texte Grammaires de dépendance 65 Graphes Conceptuels Web Sémantique & Logiques de description • Critères de choix de (Gruber, 1995) • clarté • cohérence • extensibilité • minimalité de la déformation d’encodage • minimalité de l’engagement ontologique Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
Le Formalisme des Graphes d’Unités • un formalisme à base de graphes • inspiré des Graphes Conceptuels • construit pour la théorie Sens-Texte Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
2.b. 1. La conceptualisation est-elle adaptée à une formalisation ? 1.a. Conceptualisation des prédicats linguistiques 1.b. Conceptualisation des représentations linguistiques et des définitions lexicographiques 2. Quel formalisme est adapté à cette conceptualisation ? 2.a. Formalismes existants 2.b. Construction du formalisme des Graphes d’Unités 3. Comment peut-on opérationnaliser ce formalisme ? 3.a. Etude du raisonnement logique 3.b. Opérationnalisation sur le web des données t Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
Hiérarchie des types d’unités> Objectif • Un type d’unité hérite la structure actancielle de ses parents • et peut la spécialiser • PosA optionnelle obligatoire • PosA optionnelle interdite • spécialisation des signatures Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
Hiérarchie des types d’unités> Solution: types primitifs d’unités hiérarchie des types primitifs = superposition intriquée de telles structures • Pour un symbole d’actant s • le radix de s introduit une PosAs • l’obligat de s rend la PosAsobligatoire • le prohibet de s rend la PosAsinterdite Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
Graphes d’Unités Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
Règles de graphes d’unités une hypothèse une conclusion des nœuds frontière Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
Définitions de types d’unités= deux règles contraposées Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
3.a. 1. La conceptualisation est-elle adaptée à une formalisation ? 1.a. Conceptualisation des prédicats linguistiques 1.b. Conceptualisation des représentations linguistiques et des définitions lexicographiques 2. Quel formalisme est adapté à cette conceptualisation ? 2.a. Formalismes existants 2.b. Construction du formalisme des Graphes d’Unités 3. Comment peut-on opérationnaliser ce formalisme ? 3.a. Etude du raisonnement logique 3.b. Opérationnalisation sur le web des données t Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
Objectifs du raisonnement • Critères de choix de (Gruber, 1995) • clarté • cohérence • extensibilité • minimalité de la déformation d’encodage • minimalité de l’engagement ontologique ? Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
Sémantique logique Théorie des modèles & Algèbre relationnelle G implique H = pour tout modèle M qui satisfait G, il existe un modèle qui satisfait H Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
Déduction logique Règles d’inférence & Dérivation logique H peut être déduit de G = H peut être projeté sur un graphe d’unité dérivé de G Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
Décidabilité de la déduction logique Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST • Condition suffisante: Expansion finie • des conditions d’acyclicité • sur la hiérarchie des types d’unités • sur les définitions lexicographiques • Les lexicographes de la Théorie Sens-Texte s’imposaient déjà ces conditions par intuition
3.b. 1. La conceptualisation est-elle adaptée à une formalisation ? 1.a. Conceptualisation des prédicats linguistiques 1.b. Conceptualisation des représentations linguistiques et des définitions lexicographiques 2. Quel formalisme est adapté à cette conceptualisation ? 2.a. Formalismes existants 2.b. Construction du formalisme des Graphes d’Unités 3. Comment peut-on opérationnaliser ce formalisme ? 3.a. Etude du raisonnement logique 3.b. Opérationnalisation sur le web des données t Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
Standards du web sémantique Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
Modèle: OWL 2 RL, deux modèles différents, • mais interopérables Alignement avec ontolex Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
Conclusions Théorie Sens-Texte Ingénierie des connaissances représenter, manipuler, échanger, interroger, raisonner avec les connaissances,... Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
Conclusions Conceptualisation Représentation Opérationnalisation t Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
Perspectives Choisir le formalisme Le Peupler L’Appliquer t Conceptualisation Représentation Opérationnalisation t Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST