310 likes | 456 Views
WORK PACKAGE 1: MODELS AND TOOLS ALLOWING TO SPECIFY AND TO BUILD SEARCH ENGINES DEDICATED TO GEOGRAPHIC INFORMATION (SPATIAL, TEMPORAL ET THEMATIC FACETS). Equipe T2I Laboratoire LIUPPA, UPPA . Equipe IC3 Laboratoire IRIT, UPS . Marie- Noelle BESSAGNET. MOANO 16/12/ 2010. BnF.
E N D
WORK PACKAGE 1: MODELS AND TOOLS ALLOWING TO SPECIFY AND TO BUILD SEARCHENGINES DEDICATED TO GEOGRAPHIC INFORMATION (SPATIAL, TEMPORAL ET THEMATICFACETS) Equipe T2I Laboratoire LIUPPA, UPPA Equipe IC3 Laboratoire IRIT, UPS Marie-Noelle BESSAGNET MOANO 16/12/ 2010 BnF MOANO 16 Décembre 2010
MOANO Expertise LIUPPA
MOANO Information extraction/Information retrieval
Fonds Documentaire Chaîne de Traitement sémantique Index Niveau 1 Recherche d’Information Scénarios d’Usages Spatial Temporel Chaîne de Traitement sémantique et statistique Thématique
MOANO Expertise IRIT
MOANO Corpus de textes Ontologies à composanteterminologique Constructiond’ontologie Extraction d’information Ontologies, textes et web sémantique Ontologies Dynamiques Extraction de relations Aide à la décision Perspectives • Construction et évolution Terminae, ANR Dafoe et Dynamo, 1 thèse SMAC • Représentation des connaissances Autodiag, 1 thèse • Outils d’extraction de relations • Exploiter le langage : patrons lexico-syntaxique • Exploiter la structure XML et la mise en forme (projet GEONTO) • Relations sur plusieurs phrases : résolution d’anaphores Recherche en botanique
MOANO Expertise BnF Ressources • Thésaurus RAMEAU • Documents sur la botanique Expertise indexation documentaire
MOANO Les membres LIUPPA Marie-NoelleBESSAGNET, Christian SALLABERRY IRIT Nathalie AUSSENAC-GILLES, Mouna KAMEL BnF Michel MINGAM
MOANO Découpage du WP1 WP 1.0 – Preliminary study of corpus features, end-users requirements and existing botanical ontologies Preliminary work should focus on identifying the ontologies available in botany to encourage their reuse to accelerate the construction of a new ontology WP 1.1: Development of methods and tools to extract concepts and relationships Preliminary study of corpora and reusable ontology to be used for botanical document annotation
MOANO Découpage du WP1 WP 1.2: Development of a thematic process to index text documents based on the producedontology Tools for ontology-based indexing of botanical text
MOANO Découpage du WP1 WP 1.3 Development of a platform supporting the creation of descriptive notices (LIUPPA, BNF)
MOANO Place dans le projet : interactions
MOANO Ontologie Un exemple schématique d'ontologie : l'incontournable exemple des cubes. Source : http://interstices.info/jcms/c_17672/ontologies-informatiques
MOANO Etape 1 : création de l’ontologie Une ontologie pour quoi faire? favoriser l'indexation conceptuelle automatique et la recherche de documents textuels sur la botanique (e.g., comptes rendus botaniques) ; faciliter la compréhension de la botanique (objectif pédagogique). Une ontologie de domaine : botanique Un préalable : Phase d'identification des ressources disponibles
MOANO Etape 2 : un système de RI basé sur l’ontologie Une ontologie pour quoi faire? Améliorer la requête de l’utilisateur; Aide à la décision
----- -- --- ----- ----- -- --- ----- Indexing Analyse ---- --- ---- --- ---- --- ---- --- ---- --- ---- --- ---- --- ---- --- ---- --- -------- -------- -------- ---- --- ---- --- ---- --- -------- -------- -------- ---- --- ---- --- ---- --- -------- -------- -------- ---- --- ---- --- ---- --- ----- ----- ----- -------- -------- -------- ----- ----- ----- -------- -------- -------- ----- ----- ----- -------- -------- -------- -------- -------- -------- ----- ----- ----- -------- -------- -------- ----- ----- ----- -------- -------- -------- ----- ----- ----- -------- -------- -------- -------- -------- -------- -------- -------- -------- Ressource ontologique et processus de recherche d’information Concept hierarchy, thesaurus, ontology, ... Document gatheringCollection of documents Information need match Documents representation Query representation Retrieved documents Web sémantique - 3 - N. Aussenac-Gilles
MOANO Un système de RI basé sur l’ontologie Spatial Fonds Documentaire Chaîne de Traitement sémantique Index Requête Temporel Résultats Thématique
Corpus MOANO La botanique Compte-rendu de sortie botanique • Récit • Description de la flore vivant dans des biotopes à des périodes données « L’élément central est l’observation : c’est l’ensemble de données relatives à un ou plusieurs individus d’une même espèce observés sur un site à une certaine date par un observateur associé à un validateur / déterminateur, dans le cadre d’un ensemble d’observations appelé relevé. »
MOANO Extrait CR sortie botanique Espace Thème : taxon Thème
MOANO Extrait CR sortie botanique Espace : biotope Thème
MOANO Livres anciens « Le voyage de Tarbes, 1807 - Première grande traversée des Pyrénées", aux éditions Loubatières, de Augustin Pyramus de Candolle. » Comment donner accès à ce contenu scientifique? Augustin Pyramus de Candolle (1778-1841), botaniste.
MOANO Livres anciens En 2007, un groupe de botanistes a refait cette traversée en 70 jours • Evolution de la flore • http://www.terranoos.org/fr/de-candolle/actualite.html
MOANO Extrait de leur récit Le val d'EsquierryNous partons à 6H45 du refuge d'Espingo pour rallier les Granges d'astau et rejoindre le reste de l'équipe dont nous étions séparés suite aux péripétie de la veille au port d'OO. Dans la descente, sur une falaise humide, nous trouvons une station à Saxifrage de Cluse d'une dizaine de pieds. Plante assez rare, Gérard précise qu'une station aurait été détruite lors de l'élargissement du sentier. Heureusement, la nature semble avoir encore quelques ressources. 8H15, arrivée au bivouac, nous retrouvons l'équipe. Nous mettons rapidement les échantillons d'herbier récoltés depuis trois jours dans la grande presse. Nous repartons vers 10H00 pour le val d'Esquierry. La montée à travers la prairie et la hêtraie est raide, mais assez courte. À la sortie, nous débouchons sur un immense vallon couvert de fleurs. Nous trouvons une prairie montagnarde pas encore pâturée. Nous relevons, comme de Candolle avant nous, le Millepertuis des montagnes, la Serratule fausse-centaurée, plante remarquable par la taille de son port et de son inflorescence et formant une population de quelques dizaines de pieds très localisée.
MOANO Contexte : La botanique Ouvrir l’accès à la connaissance (grand public, étudiants, décideurs, ...) au travers d’interfaces de recherche/navigation en texte. Exploiter les connaissances des experts présentes au sein des descriptions textuelles L’image a une place prépondérante en botanique : de nombreux croquis….
MOANO Des images et des croquis Le Millepertuis des montagnes, la Serratule fausse-centaurée,
MOANO Un concept : Le millepertuisplusieurs termes Noms communs : Millepertuis, herbe de la Saint-Jean. Nom botanique : Hypericumperforatum, famille des hypéricacées ou clusiacées. Noms anglais : St. John’s Wort, SJW.
MOANO Des outils pour classer, indexer et rechercher Thésaurus : RAMEAU Des référentiels taxonomiques pour la faune et la flore : http://www.sciena.org/serena/ : logiciel de gestion de bases de données naturalistes
Une première base MOANO Une taxonomie existante – Thésaurus Rameau
MOANO 16 Décembre 2010 Des questions? pour votre attention