1 / 28

TALN et RECITAL 2003

TALN et RECITAL 2003. Conférence TALN – 27 Posters TALN – 19 Conférence RÉCITAL – 8 Posters RÉCITAL – 8 Tutoriels – 2 Conférences associées – 3. Conférence Principale TALN. 17 laboratoires publics (dont 3 étrangers : Suisse, Canada, Roumanie)

kail
Download Presentation

TALN et RECITAL 2003

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. TALN et RECITAL 2003 Conférence TALN – 27 Posters TALN – 19 Conférence RÉCITAL – 8 Posters RÉCITAL – 8 Tutoriels – 2 Conférences associées – 3

  2. Conférence Principale TALN 17 laboratoires publics (dont 3 étrangers : Suisse, Canada, Roumanie) 4 industriels (Microsoft, France Télécom, Xerox, Sinequa) 8 Sessions pour 27 exposés 2 plénières 6 à thème : • Génération • Apprentissage • Discours • Désambiguïsation sémantique et formalismes • Analyse syntaxique : normalisation et outils • Recherche d'informations et Q/R

  3. Session plénière • Jean Véronis - DELIC, Université de Provence Cartographie lexicale pour la recherche d'information • Laura Monceaux et Anne Vilnat – LIMSI / CNRS MULTI-ANALYSE vers une analyse syntaxique plus fiable • Sylvain Kahane - LaTTICe, Université Paris 7 Les signes grammaticaux dans l'interface sémantique-syntaxe d'une grammaire d'unification

  4. Génération • Kim Gerdes (1) et Hi-Yon Yoo (2) - (1) LaTTICe & (2) ARP Univ. Paris 7 La topologie comme interface entre syntaxe et prosodie : un système de génération appliqué au grec moderne • Martine Smets, Michael Gamon, Simon Corston-Oliver and Eric Ringger - Microsoft Research French Amalgam: A machine-learned sentence realization system • Hélène Manuelian - LORIA/CNRS Une analyse des emplois du démonstratif en corpus • Pascal Vaillant - Université des Antilles-Guyane Une grammaire formelle du créole martiniquais pour la génération automatique

  5. Apprentissage • Antoine Rozenknop, Jean-Cédric Chappelier, Martin Rajman - Laboratoire d'Intelligence Artificielle, EPFL Apprentissage discriminant pour les Grammaires à Substitution d'Arbres • Armelle Brun, Kamel Smaili et Jean-Paul Haton - LORIA Nouvelle approche de la sélection de vocabulaire pour la détection de thème • Florence Duclaye, Olivier Collin, et François Yvon - France Télécom R&D et ENST Apprentissage Automatique de Paraphrases pour l’Amélioration d'un Système de Questions-Réponses • Vincent Claveau - IRISA Université de Rennes 1 Extraction de couples nom-verbe: une technique symbolique automatique

  6. Discours • Frédéric Landragin - LORIA/CNRS Une caractérisation de la pertinence pour les actions de référence • Laurence Danlos - LaTTICe, Université Paris 7 Représentation sémantique sous-spécifiée pour les conjonctions de subordination • Agata Jackiewicz et Jean-Luc Minel - LaLICC/CNRS Identification de structures discursives engendrées par les cadres organisationnels

  7. Désambiguïsation sémantique et formalismes • Laurent Audibert - DELIC Université de Provence Étude des critères de désambiguïsation sémantique automatique : résultats sur les cooccurrences • Didier Schwab, Mathieu Lafourcade et Violaine Prince - LIRMM/CNRS Université Montpellier 2 Amélioration de liens entre acceptions par fonctions lexicales vectorielles symétriques • Radu Gramatovici et Carlos Martin-Vide - University of Bucharest & Rovira i Virgili University Contextual grammars and Dependancy Tree

  8. Analyse syntaxique : normalisation et outils • Caroline Hagège, Claude Roux - Xerox Research Centre Europe Entre syntaxe et sémantique : Normalisation de la sortie de l'analyse syntaxique en vue de l'amélioration de l'extraction d'information à partir de textes • Benoit Crabbé, Bertrand Gaiffe et Azim Roussanaly - LORIA/INRIA Lorraine Une plate-forme de conception et d'exploitation d'une grammaire d'arbres adjoints lexicalisés • Jacques Chauché, Violaine Prince, Simon Jaillet et Maguelonne Teisseire - LIRMM/CNRS Université Montpellier 2 Classification automatique de textes à partir de leur analyse syntaxico-sémantique

  9. Recherche d'informations et Q/R • Salma Jamoussi, Kamel Smaïli et Jean-Paul Haton - LORIA/INRIA-Lorraine Vers la compréhension automatique de la parole : extraction de concepts par réseaux bayésiens • G. de Chalendar, F. El Kateb, O. Ferret, B. Grau, M. Hurault-Plantet, L. Monceaux, I. Robba et A. Vilnat - LIMSI/CNRS Confronter des sources de connaissances différentes pour obtenir une réponse plus fiable • Romain Vinot, Natalia Grabar, Mathieu Valette - ENST & INALCO & DIAM, CNRS Université Paris 10 Application d’algorithmes de classification automatique pour la détection des contenus racistes sur l'Internet

  10. Session plénière • Pierre Zweigenbaum, Fadila Hadouche, Natalia Grabar - DIAM Apprentissage de relations morphologiques en corpus • Jean-Yves Antoine, Jérôme Goulian et Jeanne Villaneau - VALORIA Quand le TAL robuste s'attaque au langage parlé : analyse incrémentale pour la compréhension de la parole spontanée • Eric Crestan, Marc El-Bèze et Claude de Loupy – LIA et Sinequa Peut-on Trouver la Taille de Contexte Optimale en Désambiguïsation Sémantique ? • Philippe Langlais et Michel Simard - RALI, Université de Montréal De la traduction probabiliste aux mémoires de traduction (ou l'inverse)

  11. Posters de TALN • Glenda B. Anaya et Leila Kosseim - CLaC Concordia University Generation of natural responses through syntactic patterns • Sébastien Barrier et Nicolas Barrier - LLF Université Paris 7 Une métagrammaire pour les noms prédicatifs du français • Denis Béchet* et Annie Foret** - *INRIA & **IRISA Université de Rennes1 Remarques et perspectives sur les langages de prégroupe d ordre 1/2, 1, ... • F. Bilhaut (1), M. Ho-Dac (2), A. Borillo (2), T. Charnois (1), P. Enjalbert (1), A. Le Draoulec (2), Y. Mathet (1), H. Miguet (2), M.-P. Péry-Woodley (2), L. Sarda (2) - (1) GREYC, Université de Caen & (2) ERSS, Université Toulouse Le Mirail Indexation discursive pour la navigation intradocumentaire : cadres temporels et spatiaux dans l’information géographique • Philippe Blache - LPL/CNRS Université de Provence Vers une théorie cognitive de la langue basée sur les contraintes • Marie Chagnoux, Slim Ben Hazez et Jean-Pierre Desclés - LaLICC/CNRS, Paris 4 Traitement automatique des temps et des aspects dans les textes

  12. Posters de TALN • Adil El Ghali et Laurent Roussarie - LaTTICe/CNRS Paris 7 Structuration automatique de preuves mathématiques : de la logique à la rhétorique • Chantal Enguehard - IRIN & Université de Nantes CoRRecT : Démarche coopérative pour l'évaluation de systèmes de reconnaissance de termes • Olivier Ferret - CEA & LIST Filtrage thématique d’un réseau de collocations • Núria Gala Pavia - XRCE & LIMSI/CNRS Une méthode non supervisée d apprentissage sur le Web pour la résolution d’ambiguïtés structurelles liées au rattachement prépositionnel • Laurent Gillard, Patrice Bellot, Marc El-Bèze - LIA Bases de connaissances pour asseoir la crédibilité des réponses d'un prototype de question réponse • André Jaccarini (1), Ghassan Mourad (1), Christian Gaubert (2) et Brahim Djioua (1) - (1) LaLICC/CNRS & (2) IFAO Egypte Mise au point de grammaires pour le filtrage d'information en arabe par l'utilisation du logiciel Sarfiyya

  13. Posters de TALN • Marisa Jiménez et Martine Pettenaro - Microsoft Research Using decision trees to learn lexical information in a linguistics-based NLP system • Guy Lapalme (1), Caroline Brun (2), Marc Dymetman (2) - (1) RALI, Université de Montréal Montréal & (2) Xerox Research Centre Europe MDA-XML : une expérience de rédaction contrôlée multilingue basée sur XML • Freddy Perraud (1), Emmanuel Morin (2), Christian Viard-Gaudin (3) et Pierre-Michel Lallican (1), (1) Vision Objects, (2) IRIN Univ. de Nantes, (3) IRCCyN/CNRS Apport d’un modèle de langage statistique pour la reconnaissance de l'écriture manuscrite en ligne • Martin Rajman, Andréa Rajman, Florian Seydoux, Alex Trutnev - EPFL Prototypage rapide et évaluation de modèles de dialogue finalisés • Thanopoulos Aristomenis, Nikos Fakotakis et George Kokkinakis - Electrical and Computer Engineering Department, University of Patras Text Tokenization for Knowledge-free Automatic Extraction of Lexical Similarities • Yannick Toussaint - LORIA/INRIA Le traitement automatique de la langue contre les erreurs judiciaires : une méthodologie d'analyse systématique des textes d'un dossier d'instruction • Chiraz Ben Othmane Zribi - RIADI, Université 7 Novembre Le contexte au service de la correction des graphies fautives arabes

  14. Conférence RÉCITALSession 1 • Cécile Frérot, ERSS – Univ. de Toulouse-Le Mirail Procédures d'apprentissage endogène doublées de ressources exogènes : résolution en corpus d'une ambiguïté sur "de" • Guillaume Jacquet- LaTTICe et ENS Montrouge Polysémie verbale et construction syntaxique • Guillaume Pitel - LIMSI Vers une Approche Fonctionnelle de la Résolution de la Référence dans le Dialogue Finalisé • Laurence Delort - LaTTICe, Univ. Paris 7 Structure communicative du discours : étude pour la génération automatique de textes

  15. Conférence RÉCITALSession 2 • Chafik Aloulou- LARIS, Université de Sfax, Tunisie Analyse syntaxique de l'Arabe: Le système MASPAR • Francis Brunet-Manquat, GETA-CLIPS-IMAG, Univ. J. Fourier Grenoble Fusionner pour mieux analyser : quelques idées et une première expérience • Sana-Leila Chaar - CEA-LIST – Univ. de Marne la vallée Extraction de segments thématiques pour la construction de résumé multi-documents orientée par un profil utilisateur • Didier Schwab - LIRMM, Université de Montpellier Société d'agents apprenants et sémantique lexicale : comment construire des vecteurs conceptuels à l'aide de la double boucle

  16. Posters RÉCITAL • Christophe Benzitoun - DELIC, Université de Provence Un "langage pivot" pour articuler description et formalisation : l'exemple des verbes introducteurs de "que-phrases" • Gaëlle Birocheau - Université de Franche-Comté Un étiquetage morphologique pour une résolution des ambiguïtés morphologiques en anglais • Marie Calberg - OSTERLITS Traitement de la morphologie du finnois par transducteurs à nombre fini d’états • Marie-Laure Guénot & Tristan Van Rullen - LPL, Univ. de Provence Un outil de représentation et de développement des Grammaires de Propriétés

  17. Posters RÉCITAL • Fabien Jalabert - LIRMM, Université Montpellier 2 Annotation sémantique hors-source à l’aide de vecteurs conceptuels • Yiping Li - CEA Fontenay-aux-Roses & Univ. de Marne la Vallée Un système de segmentation du chinois basé sur des triplets • Hoá Nguyen - CLIPS-IMAG, Université Joseph Fourier Vers une architecture générique de système de dialogue oral homme-machine • Omar Nouali - CERIST, Alger & LPL, Université de Provence Sélection de critères pour le filtrage automatique de messages

  18. Tutoriels • Michael CARL, IRO, Université de Montréal Introduction à la traduction guidée par l'exemple (Traduction par analogie) • Nathalie Aussenac-Gilles, IRIT, Univ. Paul Sabatier et Didier Bourigault, ERSS, Univ. Toulouse-Le Mirail Construction d'ontologies à partir de textes

  19. Conférences associées • Évaluation des analyseurs syntaxiques • TALN et multilinguisme • Traitement automatique des langues minoritaires et des petites langues

  20. TALN et multilinguisme • Multilinguisme et question-réponse : adaptation d'un système monolingue • Cross-Language Information Retrieval using Ontology • Repérage de traduction et commutation interlingue : intérêt et méthodes • Un outil d'extraction terminologique endogène et multilingue • Mise en place d'un Système de Recherche d'Informations en vietnamien • Une étude de cas pour l'étiquetage morpho-syntaxique de textes vietnamiens

  21. Traitement automatique des langues minoritaires et des petites langues Processus et ressources pour le traitement de l'Amharique (Ethiopie) Morphologie des verbes de l'Amharique dans le contexte de la traduction automatique Langue des signes (et langue des signes écrite) Génération automatique de thésaurus irlandais Classification automatique des cas grammaticaux en Basque Écriture en XML des résultats d'un analyseur en chunks du Portugais Étude des relations entre le traitement des langues minoritaires et le tal Traitement automatique du Basque Ressources linguistiques pour le traitement du Ladin(Dolomites, Italie) Construction d'un lexique pour le cornouaillais Kernewek (Sud-Ouest de l'Angleterre) Extraction de termes pour les langues minoritaires : application au Ladin (Dolomites, Italie)

  22. Extraction de couples nom-verbe sémantiquement liés : une technique symbolique automatiqueVincent Claveau - IRISA • Dans le lexique génératif (Pustejovsky 1995) chaque entrée lexicale est composée de 4 structures • L’une indique les différentes facettes sémantiques d’un mot à l’aide de prédicats verbaux livre / écrire livre / lire livre / contenir (information) • Chaque couple nom-verbe est appelé qualia Objectif : Acquérir automatiquement - les qualia d’un corpus - des patrons d’extractions de ces qualia En utilisant une méthode mixte : symbolique et statistique Apports : - interpréter en contexte des termes composés - accéder à des variantes de termes magasin de disques / vendre des disques

  23. Extraction de couples nom-verbe… V. Claveau Corpus : Manuels de maintenance d’hélicoptères Matra (700 ko) Cohérence du vocabulaire / des struct. synt. Utilisation fréquente de verbes associés à des termes concrets Étiquetage morphosyntaxique (- de 2 % d’erreurs, MULTEXT) Étiquetage sémantique (- de 15 % d’erreurs, WordNet, Claveau 01, Bouillon 02) Coût de l’étiquetage ? Approche mixte symbolique : par programmation logique inductive (PLI) non supervisée statistique : coefficient d’information mutuelle au cube (IM3) A l’initialisation tous les couples N-V présents dans les phrases du corpus sont des qualia protentiels. Mise en séquence des 2 approches : chaque approche utilisant en entrée la liste des qualia construite par l’autre approche.

  24. Extraction de couples nom-verbe… V. Claveau Évaluation Les patrons d’extraction sont analogues entre le système mixte et PLI Ils exploitent : • les info. morpho-syntaxiques de N et de V • des info. de proximité • peu d’info. sémantique pour les noms - la ponctuation (structurante et peu utilisée par les linguistes)

  25. bitexte briques traductionnelles SIM STS traduction texte à traduire évaluation De la traduction probabiliste aux mémoires de traduction (ou l’inverse)Philippe Langlais et Michel Simard – RALI, Montréal Ressource : la mémoire de traduction • Un bitexte franco-anglais de 100 M mots par langue, alignés au niveau de la phrase : textes parlementaires canadiens d’avril 1996 à déc. 2002

  26. De la traduction probabiliste… Langlais et Simard STS : Système de Traduction Statistique Modèle de traduction de type IBM2, entraîné sur 1,6 M de paires de phrases de la mémoire… SIM : Système d’Interrogation de la Mémoire de traduction • Sélection : elle extrait du matériel à traduire des séquences de mots (requêtes) pour interroger la MT, toute séquence de chunks présente dans la mémoire est une requête valide • Alignement : il identifie dans les paires de phrases de la MT contenant les requêtes leur traduction Requête / Matériel extrait = Brique traductionnelle • Filtrage : il sélectionne les briques proposées au traducteur

  27. De la traduction probabiliste… Langlais et Simard Évaluation de la qualité de la traduction • BLEU : compte les unigrammes, bigrammes, trigrammes et quadrigrammes que la traduction à évaluer partage avec une traduction de référence (valeurs entre 0 et 100, 100 pour une bonne traduction) • WER : une version normalisée de la distance d’édition, nb. d’opération d’édition minimum pour faire correspondre les 2 traductions (valeurs entre 0 et 100, 0 pour une bonne traduction) • SER :pourcentage de phrases de la traduction qui ne sont pas identiques à la référence, (mesure très sévère), 100 si aucune n’est identique

  28. De la traduction probabiliste… Langlais et Simard Les briques traductionnelles aident l’engin de traduction probabiliste à proposer des traductions de meilleure qualité. Cependant les résultats restent moins bons qu’avec un système non probabiliste.

More Related