240 likes | 405 Views
Web Sémantique et Interopérabilité des Vocabulaires Conceptuels. Antoine ISAAC Projet STITCH Journée BNF 2 octobre 2007. Contexte. STITCH S eman T ic I nteroperability T o access C ultural H eritage Échange et intégration de méta-données
E N D
Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Antoine ISAAC Projet STITCH Journée BNF 2 octobre 2007
Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Contexte • STITCH • SemanTic Interoperability To access Cultural Heritage • Échange et intégration de méta-données • Projet de recherche appliqué au domaine patrimonial • Collaboration avec la BnF • 1 an (2006-2007)
Web Sémantique et Interopérabilité des Vocabulaires Conceptuels KB Illustrated Manuscripts
Web Sémantique et Interopérabilité des Vocabulaires Conceptuels KB Illustrated Manuscripts
Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Mandragore
Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Mandragore
Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Le problème: hétérogénéité des vocabulaires • Des objets conceptuels distincts avec des sens parfois comparables • “Sainte Marie” / “la Vierge Marie” • “ruines antiques” / “paysage avec ruines” • Des représentations différentes • Formats: XML ou pas, MARC, … • Des modélisations différentes: classes, concepts, termes, etc.
Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Le problème
Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Une solution en deux étapes 1. Homogénéiser la représentation des vocabulaires • Représentation standard • Représentation compatible avec l’alignement 2. Aligner les vocabulaires • Trouver des correspondances sémantiques entre les éléments de vocabulaires différents • “ruines antiques” ≈ “paysage avec ruines” • “Sainte Marie” = “la Vierge Marie”
Web Sémantique et Interopérabilité des Vocabulaires Conceptuels SKOS (Simple Knowledge Organisation System) • World Wide Web Consortium (W3C) • Modèle simple pour représenter des vocabulaires conceptuels (thesauri, classifications,…) sur le WS • Comparable à Dublin Core, au niveau des vocabulaires • SKOS propose des primitives pour créer des données XML/RDF • Concepts et ConceptSchemes • Propriétés lexicales (prefLabel, altLabel) • Liens sémantiques (broader, related) • Notes (scopeNote, definition)
Web Sémantique et Interopérabilité des Vocabulaires Conceptuels SKOS: exemple http://[...]/mandragore/descripteurs/c_230 skos:Concept rdf:type skos:broader http://[...]/mandragore/descripteurs/c_235 skos:prefLabel “saints et bienheureux”@fr • Attention; c’est un standard, tout n’est pas représenté • Publication et échange de données • Celles qui nous intéressent!
Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Alignement des vocabulaires • Trouver des correspondances sémantiques • “ruines antiques” ≈ “paysage avec ruines” • “Sainte Marie” = “la Vierge Marie” • Le faire (semi-)automatiquement • Inspiré de ce qui se fait pour le Web Sémantique • alignement d’ontologies
Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Approches pour l’alignement de vocabulaires • Lexicales • Structurelles • Statistiques • Utilisation de connaissances de contexte
Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Alignement lexical • Libellés des concepts, gloses broaderMatch Barque barque avancée à la perche
Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Après
Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Démo • http://prauw.cs.vu.nl/rp33333/MANDRA-SV-ICE-mandraNewNONE , amphibiens • Blé
Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Conclusions : Représentation • Il est possible de produire des représentations WS standardisées (SKOS) des vocabulaires conceptuels • Et des méta-données qui les utilisent • Les techniques existantes pour accéder aux méta-données et vocabulaires (OAI-PMH, XML) facilitent le travail • C’est utile • Réutilisation/interopérabilité des composants applicatifs utilisant les vocabulaires • Facilité de la représentation de liens avec des éléments extérieurs au vocabulaire représenté
Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Conclusions : Alignement • Les techniques simples permettent d'obtenir des résultats rapides • 12300 concepts de Mandragore “accessibles” depuis Iconclass • Leur fiabilité ne permet pas de les considérer comme sources uniques • Combinaison avec travail manuel (vérification, complétion) • L’alignement sémantique est toujours un problème de recherche difficile • Aucune technique n’est parfaite • Il faut sélectionner/combiner, en fonction des cas applicatifs
Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Merci !
Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Liens • STITCH http://stitch.cs.vu.nl • Projets d’intégration dans le domaine des bibliothèques: • MSAC http://sigma.nkp.cz • MACS http://macs.cenl.org • Liens Web Sémantique • au W3C http://www.w3.org/2001/sw/ • SKOS http://www.w3.org/2004/02/skos/ • Semantic Web projects dans le domaine patrimonial • MuseumFinland http://www.museosuomi.fi/ • eCulture http://e-culture.multimedian.nl/
Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Demo (1) Subject vocabulary, collection 1 Subjects
Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Demo (2) Hierarchical path from root to selected subject Possible specialization for selected subject
Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Demo (3) Semantic alignment of subjects activated Document from Collection 2
Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Demo (4) Subject from voc2 aligned to voc1:amphibians” Back