440 likes | 642 Views
FrameNet. Théorie, Produit, Processus, Multilingualité et Connexio ns. FrameNet. Théorie: Frame Semantics Produit: Base de Frames Processus: Construction et utilisation d’un FrameNet Multilinguisme: Autres versions de FrameNet Connexions: Liens avec WordNet, VerbNet, PropBank.
E N D
FrameNet Théorie, Produit, Processus, Multilingualité et Connexions Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC
FrameNet • Théorie: Frame Semantics • Produit: Base de Frames • Processus: Construction et utilisation d’un FrameNet • Multilinguisme: Autres versions de FrameNet • Connexions: Liens avec WordNet, VerbNet, PropBank Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC
Frame Semantics • (Fillmore, 1982), dérivée de la Case Grammar de Fillmore (1968) • Une Frame est • une structure d’arguments appelés Frame Elements (≈rôles sémantiques) ou FEs • associée à une description textuelle • reliéeà d’autres Frames dans un graphe annoté par un nombre limité de relations • Les types de FEs ne sont pas en nombre finis Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC
Frame Semantics • Un peu la même idée que la Grammaire de Construction: • la langue n’est pas régie par quelques principes généraux, • mais par de nombreux/ses constructions/cadres qui sont mis en relations • 1 unité lexicale (LU) évoque 1 unique frame • 1 LU = 1 lemme associé à 1 sens (Cruse, 1986) • Chaque frame peut être associée à plusieurs LU, de plusieurs types (nom, adj, verbe) Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC
Frame Semantics • Relations entre Frames • Inheritance • Using (point de vue, présupposition) • Subframe (partie d‘une frame complexe) • Causative • Inchoative (début d‘un événement) • SeeAlso (lien non spécifié) Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC
Frame Semantics • Inheritance • Une frame enfant est l’élaboration de la frame parent • Une enfant doit posséder au minimum tous les subframes, FEs, et types sémantiques de son parent. • Exemple: Rewards and Punishment est le parent de Revenge Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC
Frame Semantics • Using • Point de vue • Une perspective spécifique sur une frame • Ex : Commerce_Sell et Commerce_Buy sont 2 points de vue sur Commerce_Goods_Transfer • Présupposition • Un lien plus “encyclopédique”, un arrière-plan nécessaire pour comprendre la frame, même s’il n’y a pas de lien • Ex: Volubility et Communication Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC
Frame Semantics • SubFrame • Pour les frames décrivant des scénarios complexes, dont les sous-éléments existent en tant que frame. Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC
Frame Semantics • Causative_of • Le parent dénote la cause de l’état décrit par l’enfant • Inchoative_of • Le parent dénote l’entrée dans l’état décrit par l’enfant • SeeAlso • Quand un groupe de frames relativement similaires doit être différencié avec précaution, chaque élément du groupe a un lien SeeAlso avec un représentant “central” Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC
Frame Semantics Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC
Frame Semantics • Exemple : Commerce_Sell • Description :These are words describing basic commercial transactions involving a buyer and a seller exchanging money and goods, taking the perspective of the seller. The words vary individually in the patterns of frame element realization they allow. For example, the typical patterns for SELL: SELLER sells GOODS to BUYER for MONEY. Robin sold a car to Abby for $5,000. • Core FEs :SELLER, GOOD, BUYER • Non-Core FEs : DURATION(Duration), MANNER, MEANS, MONEY, PLACE(Location), PURPOSE, PURPOSE_OF_GOODS, RATE, REASON, RELAY, RESULT, REVERSIVE, Time(Time), UNIT • Relations : • Inherits From: Giving • Is Used By: Exporting • Perspective on: Commerce_goods-transfer Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC
Frame Semantics • Unités Lexicales : lease.v, rent.v, retail.v, retailer.n, sale.n, sell.v, vend.v, vendor.n • Voisinage : Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC
Frame Semantics • Types de FEs • Core: arguments conceptuellement nécessaires • Peripheral: arguments précisant le concept • ex: MONEY, MEANS, PLACE • Extra-Thematic: arguments qui sont liés au Frame complet, pas uniquement au concept « central » • ex: PURPOSE, REASON,RESULT • Difficile de choisir dans certains cas (ex MONEY pourrait être Core) Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC
Frame Semantics • Pour résumer • Frame = connaissance encyclopédique liée au lexique • Frame+FEs = comment cette connaissance met en relation les arguments des unités lexicales qui “implémentent” la frame • Graphe de Frames = liens de généralisation entre connaissances Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC
Construction d’un FrameNet • Construire une base de donnée lexicale FrameNet, • il faut d’abord avoir le graphe de Frames avec les FEs (modifier les frames coûte très cher) • Trouver ensuite les unités lexicales qui sont liées à chaque Frame (on peut le faire progressivement) • relier à chaque unité lexicale (LU) des informations sur les instanciations grammaticales Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC
Construction d’un FrameNet • Technique originale (FN Anglais, Espagnol, Japonais): • Choisir une LU, et chercher dans son corpus des exemples à partir de motifs imaginés par le lexicographe • Annoter les phrases ainsi choisies avec les FEs Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC
Construction d’un FrameNet • Technique systématique (Allemand) • Prendre phrases d’un corpus les unes après les autres • Trouver la Frame “centrale” • Annoter • Autres techniques (recherches en cours) • Projection à partir d’annotation de traductions ? • Projection interlingue à partir d’un entraînement sur les FEs ? • Recherche des LU à partir de ressources bilingues ? Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC
Construction d’un FrameNet • Annotation des anaphores, ellipses, etc. • Les core FEs étant nécessaires, on ne peut pas ne pas les annoter, pourtant ils sont parfois absents de la phrase (soit dans le contexte linguistique, soit dans le contexte implicite) • FrameNet introduit 3 étiquettes : CNI, DNI, INI Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC
Construction d’un FrameNet • CNI - Constructional Null Instanciation • le FE est porté par la construction syntaxique • “Get even[with herOFFENDER][for thisINJURY]. [CNIAVENGER]” • DNI - Definite Null Instanciation • le FE est porté par le discours ou le contexte de l’énonciation • “[The monkeyAVENGER] avenged[himselfINJURED_PARTY] [by growing to the size of a giant and setting fire to the cityPUNISHMENT]. [DNIOFFENDER]” Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC
Construction d’un FrameNet • INI - Indefinite Null Instanciation • le FE est porté par une valeur implicite, connue encyclopédiquement • “He takes and never gives back. [INITHEME] Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC
Construction d’un FrameNet • Types de lemmes intéressants dans FrameNet • Verbes • Adjectifs • Noms • Expressions mots multiples • Seuls sont utiles à décrire les LU ayant un aspect prédicatifs, c’est-à-dire qui décrivent un sens par composition d’arguments. Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC
Construction d’un FrameNet • Pas intéressant pour les choses et les genres naturels (cf. WordNet) • Sémantiquement, FrameNet décrit les événements, les états, les relations et les propriétés Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC
Construction d’un FrameNet Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC
Utilisation de FrameNet • La Frame Semantics a de forts liens avec la Grammaire de Construction • Les informations constructionnelles (Valence, Cadres de sous-catégorisation) servent de base à une GC. • Les liens entre Frames et le graphe de Frames peuvent partiellement être transformés en hiérarchies de constructions. Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC
Utilisation de FrameNet • Annotation automatique • Entraînement à partir d’annotations manuelles (Gildea & Jurafsky, 2000) • Techniques de classification (clusterisation sémantique + informations grammaticales) • Segmentation automatique des FEs Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC
Utilisation de FrameNet • Utilisation pour la résolution d’anaphores • Riche description des rôles sémantiques • Fonctionne aussi parfois pour les anaphores nulles… • Mais ne décrit pas la compatibilité sémantique comme peut le faire WordNet Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC
Utilisation de FrameNet • Autres applications • Questions/Réponses • Systèmes de Dialogue (suffisamment générique pour “traiter” le hors-domaine, mais facilement spécifiable, cf. SoccerFN & NukeFN) • Résumés (à vérifier..) Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC
Statistiques sur FrameNet • Version anglaise (développée depuis 1997) • 739 Frames + 6054 Fes / 135000 phrases annotées Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC
Statistiques sur FrameNet • Utilisateurs principaux : • MIT, U Colorado*, Saarland U /DFKI* • CMU, Edinburgh, HK Polytechnic, Keio*, Nat U Singapore • Baylor, HKUST, Leipzig, U College Dublin, USC, U Sydney, U TX Dallas* & Austin*, Xiamen * collab. FrameNet Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC
Outils FrameNet • Création • FNDesktop (Berkeley) • SALSA (Sarrebruck) • Utilisation • Automatic Labeler (devel) Gildea&Jurafsky • Projection (devel) Pàdo • APIs • Stanford (limitée) • Berkeley (très récente) Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC
Semantics: Independent frames Trees of depth one One edge points to target, others to frame elements Outils FrameNet (They didn‘t want to pay the move back because the employee had quit.) TIGER Syntax: • Node labels: constituents • Edge labels: gramm. functions • Crossing edges • POS Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC
FrameNet Multilingue • 4 langues déjà traitées • Anglais américain • Japonais (Keio & U Tokyo) • Corpus propre, outils de recherche • Outils d’édition FN annotation/frame? • Espagnol (U A Barcelona) • Lexicographique • Corpus propre, FN software • 81 Frames, 585 LUs, ~6,900 phrases annotées • Allemand (U Saarlandes) • FN frames & FEs • corpus propre (TIGER) et soft annotation • Creation de LU “unknown” au besoin -> U Texas Austin • 20K phrases Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC
FrameNet Multilingue • Projets en gestation • Hebreux • Chinois (projection BiFrameNet avec Hownet) • Romance FrameNet • Projet lancé avril 2005 • Plusieurs partenaires intéressés • Besoin d’une structure dirigeante • Et d’un support financier • Français (c’est nous) • Recherche de techniques pour économiser du temps • Mi-parcours de la phase préliminaire • Susanne Alt, Benoît Crabbé, Laurent Romary Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC
FrameNet Multilingue • Graphe de Frames commun à plusieurs langues • Cas problématiques: • un frame existe qui devrait être divisé. Ex. driving = aller en voiture en conduisant OU en étant conduit (en Allemand) • deux frames qui n’ont pas de parent • Des FE peuvent être Core ou pas (même problème: raffinement) • Questions techniques: pour l’Allemand = mots collés, verbes disloqués (?). Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC
FrameNet Multilingue • Romance FrameNet • Conception collaborative et simultanée d’un FN pour plusieurs langues (romanes) • Idées proposées • Corpus traduit existant • Traduction “contrainte” par la frame à annoter • Plusieurs corpus traduits pour des sous-ensembles de langue, projections avec techniques bilingues. Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC
FrameNet Multilingue • FrameNet français • Annotation de 1000 phrases déjà annotées en Anglais et Allemand (Europarl) • Récupération des tables du LADL • Construction semi-automatisée de la base de frames françisées • Tentative d’annotation automatique en utilisant un entrainement LSA sur corpus bilingue - utilisable aussi pour projection Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC
FrameNet Multilingue • Perspectives • Plutôt un FN européen utilisant plusieurs techniques • récupération des travaux déjà effectués en Espagnol et Allemand • ne reposant pas sur une traduction N langues, mais autorisant plusieurs traductions existantes bilingues • Intégration de WordNet, • Lien avec les classes de Levin difficile car propre à l’Anglais Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC
Connexions • PropBank • Classification de Levin • 300000 mots (WS Journal) • Décrit les structures de valence pour chaque lemme • Pas de connaissance encyclopédique (notamment pas de liens entre frames) • Les rôles des structures de valence ne sont pas corrélés entre eux hors de la classe de Levin Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC
Connexions • VerbNet • Classes tirées des classes “intersectives” de Levin • Peuvent être plus ou moins corrélées à des frames • Dans Giuglea & Moschitti (2004), les classes de VerbNet (par exemple Judgment) sont projetées dans plusieurs frames (Rewards and Punishments, Judgment Communication, Pardon, Arraignment, etc.) • Les projections sont faites par similarité de LU liées aux classes et ensuite par les motifs d’ “alternation” Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC
Connexions • WordNet • Plusieurs synsets peuvent être reliés aux FEs • Potentiellement utile pour affiner les descriptions de frames (usages typiques) • Utilisation envisageable pour l’annotation automatique Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC
Connexions • Dans le cadre de LIRICS (prg e-Contents) • Développement d’un méta-modèle permettant d’intégrer les 4 approches • Outils d’annotation multilingue • Synchronisation des versions pour un développement collaboratif • Exportation d’anciennes données • Etude de l’intégration d’outils statistiques pour faciliter le développement • préannotation, • validation par annotation auto Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC
Journée d’étude • JE ATALA le 13 mai • Deadline le 13 mars • Ressources pour un FrameNet français Guillaume Pitel (LED/LORIA) - 28/02/06 au GREYC