100 likes | 206 Views
Mamadou Dieye , Mohamed Rafik Doulache , Mustapha Floussi , Julie Chabalier , Isabelle Mougenot , Mathieu Roche Université Montpellier 2, Espace -Dev, Natural Solutions, LIRMM. Construction d’un dictionnaire multilingue de biodiversité à partir de dires d’experts. Plan. Introduction
E N D
MamadouDieye, Mohamed RafikDoulache, Mustapha Floussi, Julie Chabalier, Isabelle Mougenot, Mathieu Roche Université Montpellier 2, Espace-Dev, Natural Solutions, LIRMM Construction d’un dictionnaire multilingue de biodiversité à partir de dires d’experts
Plan • Introduction • Processus global de Fouille de Textes (FdT) • Résultats préliminaires • Perspectives / Conclusion
1. Introduction Objectifà long terme: Construction d’un glossairetrilingue(français, anglais, arabe) des termes de l'écologie Travail en cours : (1) Extraction de termesdans les articles scientifiques (2) Expertise des termes (3) Transfert lexical
2. Processus de FdT - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Corpusétiqueté Corpus brut Corpus nettoyé Nettoyage Etiquetage Conversion
2. Processus de FdT : Etiquetage The/DT processes/NNS of/IN domestication/NN of/IN plant/NN and/CC animal/NN ... The processes of domestication of plant and animal … Étiqueteur de Brill Utilisation de lexiques, règleslexicales, règlescontextuelles
2. Processus de FdT - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Corpus brut Corpus nettoyé Corpusétiqueté Termes Nettoyage Etiquetage Conversion Extraction de la terminologie
2. ProcessusFdT : Extraction des candidatstermes - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - EXIT (EXtractionItérative de la Terminologie) Termescandidats Corpus étiqueté • Types determes: • Nom-Nom • Adjectif-Nom • Nom-Préposition-Nom • ...
3. Résultatspréliminaires 200 termesévalués
4. Perspectives • Organisation de la terminologie: • (1) IHM pour la validation des termes • (2) Organisation de la terminologieacquise (SKOS) • Transfert lexical (anglais/français) : • (1) Extraction des candidatsà la traduction : • Mediterranean landscapes / PaysagesMéditerranéens✓ • Mediterranean landscapes / Andrea Navagero✗ • (2) Classement des candidats : • Dice(exp,cand) = 2 Xnb(exp, cand) / (nb(exp) + nb(cand))
Processus de FdT - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Corpus brut Corpus nettoyé Corpusétiqueté Termes Nettoyage Etiquetage Conversion Extraction de la terminologie