1 / 59

Cours sur le traitement automatique des langues La sémantique

Cours sur le traitement automatique des langues La sémantique. Violaine Prince Université de Montpellier 2 LIRMM-CNRS. Plan de l’exposé. Introduction Les principes Les applications recherche d’information interprétation de requêtes dialogues finalisés

nikita
Download Presentation

Cours sur le traitement automatique des langues La sémantique

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Cours sur le traitement automatique des languesLa sémantique Violaine Prince Université de Montpellier 2 LIRMM-CNRS

  2. Plan de l’exposé • Introduction • Les principes • Les applications • recherche d’information • interprétation de requêtes • dialogues finalisés • le contrôle de l’interprétation morphosyntaxique • Conclusion et perspectives Introduction

  3. Introduction • Qu ’est-ce que la sémantique ? • affectation d ’un (ou plusieurs) sens à des formes • A quoi sert la sémantique ? • l ’utilité dépend du domaine • Domaines de la sémantique • linguistique • logique • langages Introduction

  4. Définitions de la sémantique (I) • Autant de définitions que de domaines • en logique : affectation d’une interprétation à • un prédicat, une formule, un énoncé • en logique classique : évaluation à vrai, faux • en logique multivaluée : évaluation à une des valeurs autorisées • en logique floue : calcul de la valeur (numérique) de la fonction de « fitness » Introduction

  5. Exemples (I) • objet (ballon, rouge) évalué à vrai si et seulement si : • objet(x,y) et « ballon » appartient au domaine de validité de x • et « rouge » appartient au domaine de validité de y • sémantique vériconditionnelle • ne traite pas du rapport avec le monde Introduction

  6. Exemples (II) • objet( ballon, rouge) évalué à « inconnu » en logique non monotone • si on n ’a pas, dans la base, objet(ballon, rouge), comme une connaissance vraie. Introduction

  7. Définitions de la sémantique (II) • langages de programmation : • intervient après la vérification morpho- syntaxique • la sémantique est réalisée par le compilateur ou l ’interpréteur • interpréter une instruction revient à • vérifier les contraintes d ’intégrité • produire un exécutable Introduction

  8. Définitions de la sémantique (III) • linguistique : il existe plusieurs définitions • ordonner les significations d ’un mot (sens du dictionnaire) • exemple : pompe • 1. appareil permettant l ’aspiration d’un liquide, ex : « une pompe de relevage » • 2. par extension de 1, dispositif de fourniture d ’essence pour automobile , « la pompe à essence » • 3. par extension de 2, représente les propriétés de l ’essence, « le prix à la pompe »  • 4. par extension de 2, représente le lieu de fourniture d ’essence , « il y a une pompe pas loin  ». Introduction

  9. mais aussi , • 5.faste, luxe , « cérémonie en grande pompe » • 6. (familier) chaussures « des pompes en simili-crocodile ». • 7. Exercice physique, parfois d ’aspect punitif « vous me ferez 100 pompes » • retrouver le (ou les sens) en contexte : • Je me suis arrêté à la première pompe que j ’ai pu trouver. J’en ai profité pour nettoyer au jet mes pompes boueuses, d’autant plus que je devais assister ensuite à une cérémonie en grande pompe à la mairie. Introduction

  10. Qu’est-ce qu’un contexte ? • En linguistique : • groupe de mots • phrase • paragraphe • texte • mais aussi : • le sous-ensemble des hypothèses de l’auditeur sur le monde (Latraverse, 1987) • les objets et individus présents dans la situation d’énonciation ou évoqués par elle (Lyons, 1977) Introduction

  11. Langue référent : objet linguistique objet référé: objet du monde référé: objet mental monde individu triangle aristotélicien Le contexte d’un objet linguistique est composé : 1.du co-texte (autres objets linguistiques dans l ’entourage) 2.du contexte mental (base de connaissances) où se trouve le référé 3.du contexte externe (le monde) où se trouve l ’objet référé. Introduction

  12. En logique • les prédicats du même énoncé • les variables liées • les valeurs de variables proposées • En logique, les contextes mental et externe sont confondus avec le co-texte • En programmation : • il existe un « contexte mental » qui pourrait correspondre à : • l’état de la base de connaissances • l’état de la machine Introduction

  13. A quoi sert la sémantique • En linguistique : • mise en rapport des objets de langue avec le monde • les enfants de Pierre et Marie sont blonds • La génération soixante-huit, ce sont les enfants de Marx et du Coca-Cola • En traitement automatique des langues • mise en rapport des objets de langue et d’une « forme » calculable Introduction

  14. Les principes • Les modèles • de la linguistique • de l ’intelligence artificielle • autres modèles en informatique • Les modes de résolution • Les architectures les principes

  15. Les modèles • Modèles linguistiques pour la sémantique • sémantique compositionnelle • sémantique différentielle • sémantique « interprétative » les principes

  16. Modèles linguistiques pour la sémantique • Sémantique compositionnelle • Le sens de la phrase est une composition (plus ou moins formelle) des sens des mots • si un mot a plusieurs sens, cela génère autant de combinaisons possibles • le « bon » sens est celui dont la combinaison est plausible les principes

  17. Sémantique compositionnelle • Exemple « Je me suis arrêté à la première pompe que j’ai pu trouver. » lieu appareil chaussure La condition de « plausibilité » exclut : « faste », et « exercice physique ». les principes

  18. Sémantique compositionnelle • Exemple « Je me suis arrêté à la première pompe que j ’ai pu trouver. » • trois « phrases -sens » générées. QUI DÉTERMINE LA PLAUSIBILITÉ ? UN PROCESSEUR HUMAIN UNE CONNAISSANCE FORTE DU MONDE les principes

  19. Sémantique compositionnelle • Exemple « Je me suis arrêté à la première pompe que j ’ai pu trouver. » • Une deuxième « passe » de plausibilité supprimera le sens « chaussure ». EST PLAUSIBLE CE QUI : N ’EST PAS INCONGRU N ’EST PAS RIDICULE les principes

  20. Sémantique différentielle • Parmi tous les sens d ’un mot, c ’est le plus spécifique qui doit être choisi en premier. • S ’appuie sur une représentation très fine des sens des mots dans le dictionnaire • Pottier, Greimas (sémantique structuraliste), Barwise et Perry (sémantique des situations) les principes

  21. Sémantique différentielle « Je me suis arrêté à la première pompe que j ’ai pu trouver. » • 1. appareil permettant l’aspiration d’un liquide, ex : « une pompe de relevage » • 2. par extension de 1, dispositif de fourniture d ’essence pour automobile , « la pompe à essence » • 3. par extension de 2, représente les propriétés de l’essence, « le prix à la pompe »  • 4. par extension de 2, représente le lieu de fourniture d ’essence , « il y a une pompe pas loin  ». les principes

  22. Sémantique différentielle « Je me suis arrêté à la première pompe que j ’ai pu trouver. » 1. appareil aspiration liquide 2. appareil à essence les propriétés de l’essence 3. essence automobile lieu consacré à la vente station d’essence 4. les principes

  23. Sémantique différentielle • Les règles de différentiation qui s ’appliquent sont : • compatibles avec le co-texte • arrêter, trouver • forcées par le co-texte (coercitive rules de Pustejovsky) Introduction

  24. Sémantique interprétative Le sens le plus spécifique garde en mémoire tous les sens génériques, et la récurrence du terme peut s ’appuyer sur le fond commun. Rastier (1986) Fonctionne pour les mots à sens multiples et dépendants. . les principes

  25. Sémantique interprétative « Je me suis arrêté à la première pompe que j ’ai pu trouver. » 1. appareil aspiration liquide 2. appareil à essence les propriétés de l’essence 3. essence automobile lieu consacré à la vente station d’essence 4. les principes

  26. Les modèles • Les modèles de l’intelligence artificielle • Les schémas (frames) • Les scénarios (scripts) • Les ontologies arborescentes (issues des réseaux sémantiques) • Les graphes conceptuels les principes

  27. Les modèles de l ’intelligence artificielle • Les schémas (Minsky 1974) • Un schéma (frame) est un ensemble de connaissances autour d’un sujet donné (ici, un mot). • L ’usage des schémas en sémantique se fait de la manière suivante : • sur une chaîne de classification donnée, on associe à chaque terme son schéma. les principes

  28. valeurs par défaut pour C1n sous forme d ’{attribut (facette, valeur)} C11 Schéma de C11 Schéma de C1n-1 C1n-1 Schéma de C1n lien « is-a » C1n les principes

  29. Exemple fait en : matière (organique, minérale) type (naturelle, artificielle) prix: origine : • Chaise : composé de: pieds (3, 4) dosseret (oui, barreaux : oui,non non) assise :matière meuble chaise fauteuil chaise-à-porteur 17ème siècle mode de transport les principes

  30. Beaucoup de connaissances à intégrer • Problème des sens figurés du mot: • jouer aux chaises musicales • mener une vie de bâton de chaise • Et de certains de ses dérivés : • ambitionner le fauteuil présidentiel. • Les schémas sont adaptés en sémantique lorsqu ’il s ’agit d ’applications très limitées. • A éviter en recherche d’information ou indexation les principes

  31. Les modèles de l ’intelligence artificielle • Les scénarios (Schank 1978) • Un scénario (script) est un ensemble de connaissances autour d ’une situation donnée. • Le scénario comprend : • des conditions initiales (de déclenchement) • des actions (possibles) • un résultat • des exceptions (anomalies) • A chaque élément est associé un schéma. les principes

  32. Les scénarios pour l ’interprétation du LN • Les scénarios s’appliquent à l ’interprétation du langage naturel en fournissant les conditions pragmatiques d ’interprétation. • Les conditions initiales peuvent être exprimées par du texte • Les actions sont des prédicats verbaux • Le résultat est ce qui est attendu • Les anomalies sont répertoriées lors qu ’elles sont connues. les principes

  33. COMPRENDRE ce que l ’on sait déjà Ce qui est dit événement Schémas actions élémentaires référence à d ’autres schémas les principes

  34. Exemple • Scénario : « réviser une voiture » • ELEMENTS : • voiture • ACTEURS : • client, garagiste • CONDITIONS INITIALES • le client amène sa voiture au garage • il possède un moyen de paiement • la voiture est dans un état donné les principes

  35. Exemple : réviser une voiture • RESULTAT(ESCOMPTE) • le client reprend sa voiture au garage • il a de l ’argent en moins • la voiture est révisée • ANOMALIES • le client ne reprend pas sa voiture • la voiture n ’est pas révisée • la voiture est révisée mais elle n ’est pas en bon état les principes

  36. Exemple : réviser une voiture • ACTIONS • Origine : CLIENT • AMENER (voiture, garage) • LAISSER-A (voiture, clés, papiers, garagiste) • CONVENIR-AVEC (rendez-vous, garagiste) • PARTIR • REVENIR • PAYER(facture) • PRENDRE (voiture, clé, papiers) les principes

  37. Exemple : réviser une voiture • Origine : GARAGISTE • pour chaque partie de Voiture (schéma VOITURE) faire : • VERIFIER (partie) • si partie à changer alors CHANGER(partie) • si partie à réparer alors REPARER (partie) • fin • pour tous les éléments changés et réparés, MARQUER (partie) • FACTURER (partie) • DONNER (facture, client). les principes

  38. Les difficultés • Des situations stéréotypées • Ambiguïté du déclenchement • Jean est allé chez le garagiste. réviser une voiture acheter une voiture louer une voiture réparer une voiture les principes

  39. Extensions : plans et thèmes • Repérer le thème du texte • acteurs, éléments • premiers prédicats verbaux • Considérer un scénario comme un plan possible, modifiable (déroutable) planification Introduction

  40. Conclusion sur les schémas et les scénarios • Essaient d ’intégrer des connaissances « contextuelles » de type pragmatique • Mais • lourdeur des structures • rigidité • aspect trop détailliste par certains côtés pas assez par d ’autres • énorme quantité de connaissances • structuration dépendant fortement des concepteurs les principes

  41. Les modèles de l ’intelligence artificielle • Les « ontologies » arborescentes • après l ’échec d’une structuration trop importante et trop large • restriction des années 90 • à une application • à un domaine, de préférence technique et défini • à une structure arborescente • plusieurs « arbres de connaissance » plutôt qu ’un seul réseau les principes

  42. Exemple • domaine : chimie • application : enseignement secondaire de la chimie atomique: • agrégats « partie-de » substance molécule atome particule les principes

  43. Exemple • domaine : chimie • application : enseignement secondaire de la chimie atomique: • agrégat « sorte-de » particule particule chargée particule neutre proton électron neutron les principes

  44. relations typées • sorte-de selon un critère • sorte-de : inclusion de classe • sorte-de : membre-de • partie-de • Les ontologies arborescentes supposent : • un mot un sens • ce qui correspond qu ’à un sous-ensemble très faible du langage naturel les principes

  45. Les modèles de l ’intelligence artificielle • Les graphes conceptuels (Sowa 1984) • l ’idée que l ’esprit et le langage s ’organisent de la même manière (ressemblance des contextes linguistique et mental) • il existe une représentation en lambda-calcul du contexte mental • application à la langue objet du prochain cours les principes

  46. Les applications Recherche d’information recherche d ’une information I représentée par un texte T, dans une base de documents D Indexation par un texte T d ’une information I, applicable à toute base de documents Dk Les deux problèmes ne sont pas exactement symétriques les applications

  47. Recherche d ’information les Ij sont des sens possibles de T, ou contenus dans des sens de T I1 texte T I2 In base de documents (corpus) recherche d’occurrences l ’algorithme de recherche d ’occurrence est celui d ’un motif M/ M◊ T d ’un sous-motif K de M/ MÇ T = K les applications

  48. Problèmes • L ’information I recherchée • n ’est pas représentée par un unique texte T • n ’est pas le seul sens possible de T • n ’est pas la composition des sens des éléments de T • Les occurrences de T récupérées, sont, au mieux des sur-textes de T, parfois des sous-textes. • La recherche d ’information est donc parasitée par la non unicité sémantique. les applications

  49. Exemple • L ’information I recherchée concerne « l ’Hôtel de Ville », c ’est-à-dire, la mairie principale du lieu (s ’il s ’agit d ’une ville à arrondissements). • La séquence « hôtel de ville » a pour sens : • I1 :mairie • I2:sorte d ’hôtel • I3:sorte d ’hôtel en milieu urbain. • Sont récupérées dans le corpus des chaînes : • rue de l ’Hôtel de Ville • l ’hôtelde Mussy est dans la ville de Gordes les applications

  50. Exemple (suite) • Si, de manière sophistiquée, un analyseur accepte les formes accordées, on récupère en plus : • tous les hôtelsde la ville de Paris sont chers. • l ’hôtel est en dehors de la ville. • au métro Hôtel-de-Ville, vous trouverez le bazar de l ’Hôtel-de-Ville. • mais aussi, avec un pourcentage affaibli de concordance, tout ce qui va contenir « hôtel » et « ville », dans la fenêtre donnée. les applications

More Related