1 / 18

Utiliser des traces de la dimension globale d’un corpus pour l’accès au contenu des documents

13 e journées de Rochebrune, 22-27 janvier 2006 « Traces, Enigmes, Problèmes : Emergence et construction du sens ». Utiliser des traces de la dimension globale d’un corpus pour l’accès au contenu des documents. Pierre Beust & Thibault Roy GREYC CNRS UMR 6072 – ISLanD Pôle ModeSCoS (MRSH Caen)

ciara
Download Presentation

Utiliser des traces de la dimension globale d’un corpus pour l’accès au contenu des documents

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 13e journées de Rochebrune, 22-27 janvier 2006 « Traces, Enigmes, Problèmes : Emergence et construction du sens » Utiliser des traces de la dimension globale d’un corpus pour l’accès au contenu des documents Pierre Beust & Thibault Roy GREYC CNRS UMR 6072 – ISLanDPôle ModeSCoS (MRSH Caen) Université de Caen Basse Normandie {pierre.beust, troy}@info.unicaen.fr

  2. 13e journées de Rochebrune Trace de l’exposé … • Introduction • Les méthodes d’accès au contenu • Quelles traces ? • Ancrage épistémologique • Le local / le global • La cartographie de corpus • Objectifs, Outil logiciel • Expériences réalisées • Perspectives • Conclusions

  3. 13e journées de Rochebrune 1. Introduction Cadre de nos recherches : - Informatique & Linguistique  Traitement Automatique des Langues - Sémantique des textes  Linguistique de corpus - Interactions Homme-Machines centrées utilisateur

  4. 13e journées de Rochebrune 1. Introduction • Traces en Informatique • fichiers de log, cookies, fichiers temporaires, balises XML • Principalement vues sous l’angle de la génération • Traces en Linguistique • phrases, énoncés, textes, dialogues • Principalement vues sous l’angle de l’identification (surtout dansle cas des approches endogènes) • Traces pour la Linguistique de corpus • Annotation de corpus, visualisation, traitements statistiques, accès au contenu • Besoin des 2 angles d’approches : génération / identification

  5. Tracesrhématiques  Tracesthématiques 13e journées de Rochebrune 1. Introduction • Les méthodes d’accès au contenu en TAL : • Extraction d’information Remplissage de formulaires préconstruits, de bases de données  On recherche les traces d’un contenu qu’on connaît déjà • Questions/Réponses Extraire une zone où peut se trouver la réponse à une question  On localise une trace plus ou moins proche de la question • Résumé automatique « condensation » de textes  Garder les phrases où on a des traces de ce qui semble important • Aide à la navigation • Indexation, extraction de terminologies, visualisation  Exploiter des traces pour savoir de quoi traite un ensemble de documents

  6. 13e journées de Rochebrune 2. Ancrage épistémologique • Sémantique Interprétative (François Rastier) • perception sémantique individuelle • dynamique sémique (notions d’isotopies, d’afférences, d’opérations interprétatives) • principe de la détermination du local par le global (alternative à la compositionnalité)

  7. 13e journées de Rochebrune 2. Ancrage épistémologique Global principe d’architextualité : tout texte placé dans un corpus en reçoit des déterminations sémantiques et modifie potentiellement le sens de chacun des textes qui le composent principe d’intertextualité : deux passages de textes différents sélectionnent réciproquement, dès qu’ils sont mis côte à côte, des éléments de signification (sèmes). principe decontextualité : deux signes ou deux passages d’un même texte mis côte à côte sélectionnent réciproquement des éléments de signification (sèmes). Local

  8. 13e journées de Rochebrune 2. Ancrage épistémologique • Sémantique Interprétative (François Rastier) • perception sémantique • dynamique sémique (notions d’isotopies, d’afférences, d’opérations interprétatives) • principe de la détermination du local par le global (alternative à la compositionnalité) • Approche interactionniste et expérimentale : • des logiciels d’étude pour expérimenter la sémantique des langues • des interactions, des traitements et ressources avant tout centrés sur l’utilisateur

  9. 13e journées de Rochebrune 2. Ancrage épistémologique Il en découle que : • le sens ne peut pas être objectivé • Il est préférable de viser une instrumentation du sens plutôt que la construction du sens • on distingue donc des interprétations humaines et des interprétations calculatoires. Elles sont complémentaires (l’une n’est pas le pâle reflet de l’autre).  on recherche dans les interprétations calculatoires des traces pour compléter, aider, assister des interprétations humaines.  on recherche dans les rapports d’intertextualité des traces pour enrichir les interprétations calculatoires

  10. 13e journées de Rochebrune 3. La cartographie de corpus Notre objectif : Visualiser un ensemble de documents pour donner à un interprétant une vision globale de la thématique de cet ensemble Visualisation sous forme de cartes  représentations graphiques topologiques (personnelles)  objets support d’interactions pour l’aide à la lecture rapide

  11. 13e journées de Rochebrune 3. La cartographie de corpus L’outil ProxiDocs : un logiciel d’étude de la dimension globale d’une collection (corpus, flux, listes d’URL) Ressources terminologiques personnelles (liste de graphies ou dispositifs différentiels) Vues globales Personnelles (cartes de documents, cartes de groupes, …)

  12. 13e journées de Rochebrune 4. Expériences réalisées Plusieurs expérimentations avec différents types de corpus, différents types de ressources terminologiques

  13. Santé Météo Guerre 4. Expériences réalisées : Exp. n°4 • Etude simultanée de trois métaphores conceptuelles : • La « météorologie boursière » • La « santé financière » • La « guerre économique » Bourse, Économie, Finances, Politique, Etc.

  14. Emplois surtout thématiques Emplois surtout métaphoriques Plutôt des dépêches Plutôt des bilans 13e journées de Rochebrune 4. Expériences réalisées : Exp. n°4 Analyses des cartes :

  15. Extrait 1 Extrait 2 Extrait 3 13e journées de Rochebrune 4. Expériences réalisées : Exp. n°4 Cartes d’évolution : fenêtre d’un mois, déplacement d’un jour • Quelques observations : • la métaphore guerrière a été très utilisée lors du minikrach boursier fin 1987 • la métaphore météorologique est plus employée lors de conditions climatiques • remarquables, hiver rude, forte chaleur…

  16. 13e journées de Rochebrune 5. Perspectives • Dynamique sémique et prise en compte du global : Extrait de l’article n°153 Ce krach était dû (…) à la chute vertigineuse et incontrôlée du dollar, signe que la tempête affecte dorénavant les marchés financiers. Isotopie 1 (générique) : bourse et économie Isotopie 2 (spécifique) : danger Comment rendre compte de l’importance relative locale de ces isotopies ? Pondérations des isotopies en fonction de : - nb de répétitions (trace locale) - variétés des lexies dans une même isotopie (trace locale) - rapport aux redondances principales du corpus (trace globale) -rapport aux candidats index du groupe (trace globale) - …

  17. 13e journées de Rochebrune 6. Conclusions La prise en compte de la dimension globale met en évidence : • Le besoin d’identifier des traces pour des d’analyses multi-échelles (paragraphe, document, groupe de documents, corpus …). • L’importance des études en synchro diachronie (là aussi quelles traces utiliser ?) Maintenant, il faut continuer à : • Contribuer à mieux appréhender les rapports entre local et global en linguistique de corpus • Contribuer à des approches interactionnistes où les interprétations des utilisateurs et des machines sont complémentaires • Affirmer une scientificité des TAL, spécialement dans un rapport à la sémiotique (et plus précisément la sémiotique des traces)

  18. 13e journées de Rochebrune Pour plus de traces sur ce que je viens de dire … http://www.info.unicaen.fr/~troy/proxidocs/

More Related