350 likes | 480 Views
IGN Laboratoire COGIT. Réunion de lancement GeOnto 18 janvier 2008. http://recherche.ign.fr/cogit. IGN. EPCA, 1700 personnes, budget 100M €. Recherche à l’IGN. Une des missions de l’IGN Pour la production ET l’intérêt général ~ 60 personnes ~ 7 thèses soutenues par an 4 laboratoires
E N D
IGN Laboratoire COGIT Réunion de lancement GeOnto 18 janvier 2008 http://recherche.ign.fr/cogit
IGN • EPCA, 1700 personnes, budget 100M€
Recherche à l’IGN Une des missions de l’IGN Pour la production ET l’intérêt général ~ 60 personnes ~ 7 thèses soutenues par an 4 laboratoires Géodésie (LAREG) Instrumentation (LOEMI) Traitement d’image (MATIS) Gestion et exploitation données géo (COGIT)
COGIT - Thèmes de recherche • Accès aux données et aux services • Aide à la conception de légendes • Aide à l’extraction de données • Description et spécification de traitements • Cartographie • Automatisation de la généralisation • Automatisation de l’amélioration des légendes • Risques et territoires • Modélisation 3D pour l’analyse des risques • Analyse des graphes et des zones urbains • Intégration de données • Description formelle des spécifications • Appariement de données • Modélisation de BD / représentation multiple
Objectif • Intégrer BD géographiques • Appariement de schémas • Appariement de données BD TOPO BD CARTO
Difficultés de l’appariement de schémas Aqueduc • Des schémas à la sémantique insuffisante Tronçon hydrographique Tronçon de cours d’eau Canalisation
Difficultés de l’appariement de schémas • Des schémas à la sémantique insuffisante Cap Carrière Cirque Col Crête Dépression Dune Escarpement Gorges Grotte Ile Isthme Montagne Pic Plage Plaine ou plateau Récifs Rochers Sommet Vallée Versant Volcan Cap, pointe Cirque Col, passage Volcan, cratère Sommet, crête, colline Coteau, Falaise Cuvette, dépression Vallée Ile Dune, plage Pic Plaine, plateau Récifs Rocher Espace marin Banc, haut fond BDCARTO BDTOPO
Difficultés de l’appariement de schémas • Des schémas à la sémantique insuffisante • Regroupements opérés dans les classes • Critères de sélection • Critères de découpage • … • Approche générale : • S’appuyer sur les spécifications des BDs, riches en information
Approche Ontologie 1 Ontologie 2 Specifications1 Specifications2 Schéma1 Schéma2
Approche Ontologie «Ent. géog.» Élt du réseau hydro Ontologie «Ent. géog.» Élt du réseau hydro 0..1 «Ent. géog.» «Ent. géog.» «Ent. géog.» Acc. parcours Cours d'eau Nœud réseau 0..1 «Ent. géog.» «Ent. géog.» «Ent. géog.» affluent de * Acc. parcours Cours d'eau Nœud réseau affluent de * «Ent. géog.» «Ent. géog.» «Ent. géog.» «Ent. géog.» «Ent. géog.» Rivière Diffluent Fossé Source «Ent. géog.» «Ent. géog.» Embouchure «Ent. géog.» «Ent. géog.» «Ent. géog.» Rivière Diffluent Fossé Source Embouchure «Ent. géog.» «Ent. géog.» «Ent. géog.» «Ent. géog.» «Ent. géog.» «Ent. géog.» «Ent. géog.» «Ent. géog.» «Ent. géog.» Cascade «Ent. géog.» Canal Barrage Aqueduc «Ent. géog.» «Ent. géog.» Perte Confluent Cascade Canal Barrage Aqueduc Perte Confluent «Ent. géog.» «Ent. géog.» Écluse «Objet de la base» Écluse «Objet de la base» Tronçon cours d’eau BD Topo Tronçon hydro «Objet de la base» «Objet de la base» Nœud hydro Point d’eau «Objet de la base» Cours d'eau BD Carto «Objet de la base» «Objet de la base» Z.O.S. «Objet de la base» Surface d’eau Cours d'eau nommé [Gesbert 2005]
Spécifications Extrait des spécifications BDCarto
Spécifications Extrait des spécifications BDCarto
Spécifications Extrait des spécifications BDTopo
Spécifications Extrait des spécifications BDTopo
Spécifications Extrait des spécifications BDTopo
Spécifications Extrait des spécifications BDTopo
Bilan sur les documents • Spécifications • Externes • De nombreuses BD différentes • Mais toutes issues de l’IGN • Besoin de spécifications étrangères? • Des documents: • Très riches en information • Très organisés / texte libre • Volumineux • Avec du langage naturel • Avec des organisations sensiblement différentes
Création des ontologies TALN TALN Ontologie 1 Ontologie 2 Specifications1 Specifications2 Schéma1 Schéma2
Création des ontologies1ers essais [Laurens 2006] Analyse de la structure du document Description de la structure (interactive) Analyse de texte Tokénisation / lemmatisation Dictionnaire (Morphalou) Dictionnaire Corpus non géographique Filtrage des expressions Sélection interactive Réorganisation Hiérarchisation interactive
Création des ontologies1ers essais [Laurens 2006] • ~500 concepts / taxonomie créée • Hiérarchisation insuffisante • Ex: pic, sommet, gorges, plage… • Trop proche de la BD • Ex: Bâtiment ponctuel, surfacique, linéaire • Un travail interactif est nécessaire • Pour filtrer (rapide) • Pour réorganiser (plus long)
Alignement d’ontologies Alignement Automatique Ontologie 1 Ontologie 2 Specifications1 Specifications2 Schéma1 Schéma2
Alignement d’ontologies 1ers essais [Abadie 2007] • Utilisation de Prompt (plug-in Protégé) • Prometteur • Alignement automatique possible • Inférences intéressantes • A affiner • Erreurs: termes proches • Modification de la hiérarchisation pas toujours pertinente • Fort travail interactif nécessaire
Bilan sur nosressources ontologiques • On dispose de • 2 taxonomies correspondant à deux BDGéo • Avec des formes assez différentes (+/- hiérarchiques) • 1 taxonomie issue de leur fusion • ~700 termes • Importante réorganisation interactive • Bilingue • Simples hiérarchies de termes • Pas de définitions, propriétés… • Sémantique des relations insuffisante, voire fausse
Appariement de schémas à partir del’appariement des données BDTOPO BDCARTO
Appariement schémas / données • Pas d’identifiants universels • Appariement géométrique • Difficultés : gestion des imprécisions, incomplétudes, incohérences… • Un processus imparfait • L’appariement de schémas guide celui des données… • …et inversement
Appariement de schémas / données1ers essais [Abadie, Olteanu, Mustiere 2007]
Attentes • Ontologie(s) géographique(s) • plus riche(s) • plus juste(s) • Méthodologies • constitution d’ontologies • alignement • comparaison • Analyses • des façons de décrire le monde • Différents points de vues, différentes échelles • des potentialités des ontologies • Pour l’intégration de bases de données • Pour l’accès aux bases de données