340 likes | 636 Views
Ontologies pour l’astronomie. Nathalie Hernandez Josiane Mothe Laurent Cardonner. Objectifs. Représentation des informations via des ontologies (indexation) Etude des thesaurus existants Adéquation aux collections Mise à jour de la connaissance du domaine Découverte de connaissances
E N D
Ontologies pour l’astronomie Nathalie Hernandez Josiane Mothe Laurent Cardonner
Objectifs • Représentation des informations via des ontologies (indexation) • Etude des thesaurus existants • Adéquation aux collections • Mise à jour de la connaissance du domaine • Découverte de connaissances • Ontologie du domaine de la tâche / du contenu
Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Exemple Analyses Plan • Résultats des analyses via Syntex • Définition de mesures d’adéquation d’une ontologie par rapport à un corpus • Techniques de mise à jour • Définition de différents types d’ontologies adaptés à l’usage des données • Exemple de l’exploration des publications
Analyses Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Exemple • A notre disposition : • thesaurus de l’astronomie IAU • résumés d’articles publiés dans les revues A&A et APJ sur plusieurs années.
Analyses Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Exemple Syntex : analyseur syntaxique de corpus • Intérêt : extraire syntaxiquement les expressions d’une collection documentaire [Bourigault & Fabre, 2000] • Deux phases • Pré-traitement par un étiqueteur • Analyse syntaxique • Originalité : apprentissage endogène [Bourigault & Lame, 2002]
Analyses Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Exemple Résultats • APJ • A&A
Analyses Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Exemple IAU • Thesaurus (représentation terminologique du domaine de l’astronomie) crée en 1995 • 2863 termes dont 2222 expressions (magnetic field, X ray,…) • 5000 relations entre termes de plusieurs natures : • t1 BT t2 : terme t2 plus spécifique t1 • t1 NT t2 : terme t2 plus générique t1 • t1 U t2 : utiliser le terme t1 plutôt le terme t2 • t1 UF t2 : utiliser le terme t2 à la place de t1 • t1 RT t2 : t1 et t2 sont liés
Analyses Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Exemple Recherche termes IAU / CORPUS • APJ • 1999 : 865 termes retrouvés • 2002 : 877 termes retrouvés • A&A • 1995 : 832 termes retrouvés • 2002 : 884 termes retrouvés • 588 termes communs aux 4 corpus IAU adapté à l’indexation de nos corpus? Mesures génériques (ontologie/thesaurus)
Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Exemple Analyses IAU en OWL • Ontology Web Language [http://www.w3.org/TR/owl-features/] recommandation du W3C • Transformation • Définition de concepts (différents labels)X Ray UF X-RayX Ray UF X-Ray radiationX Ray ; X-Ray, X-Ray radiation • Définition de relations (généricité/specificité, est lié à)
Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Exemple Analyses Analyse lexicale • Couverture ontologie / corpus • Pourcentage de termes de l’ontologie présents dans le corpus Choix ou non de l’ontologie comme point de départ • Couverture corpus / ontologie • Détection des concepts représentatifs des documents (tf.idf [Salton 71]) Proposition de nouveaux termes à ajouter
Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Exemple Analyses Analyse conceptuelle • Principe : « un concept est représentatif d’un domaine si il est en relation avec d’autres concepts du domaine » • Définition d’une mesure du pouvoir représentatif d’un concept • Définition d’une mesure du pouvoir représentatif d’une ontologie à partir de la mesure des concepts retrouvés dans les documents Validation du choix de l’organisation des concepts dans l’ontologie
Techniques de mise à jour Mesures d’adéquation Ontologies spécifiques à une tache Exemple Analyses Mise à jour des concepts • Ajout des termes représentatifs des documents dans l’ontologie • Nouveau label pour un concept • Nouveau concept utilisation des mesures de proximité sémantique de Syntex
Techniques de mise à jour Mesures d’adéquation Ontologies spécifiques à une tache Exemple Analyses Mise à jour des relations • Spécification sémantique de la relation « est lié a » : (« événement lié à », « objet lié a ») • Détection de nouvelles relations entre concepts utilisation des mesures de proximité sémantique de Syntex
Ontologies spécifiques à une tache Mesures d’adéquation Techniques de mise à jour Exemple Analyses • Nécessité de deux types ontologies : • Ontologie du domaine de la tâche : organisation des méta-données ou rôles des connaissances dans la réalisation d’une tâche • Ontologie du domaine abordé dans le corpus: représentation de la connaissance liée au domaine traité dans le contenu des documents optimiser les tâches
Ontologies spécifiques à une tache Mesures d’adéquation Techniques de mise à jour Exemple Analyses Architecture
Ontologies spécifiques à une tache Mesures d’adéquation Techniques de mise à jour Exemple Analyses Cadre applicatif • Tâche: Exploration des publications dans les revues A&A et APJ • Collection à notre disposition • Expérience à partir de Tétralogie
Ontologies spécifiques à une tache Mesures d’adéquation Techniques de mise à jour Exemple Analyses Travaille avec Travaille pour CHERCHEUR nom prénom LABORATOIRE adresse A pour domaine d’intérêt Rédige Travaille pour depuis Est situé en ARTICLE ref Ecrit en DATE PAYS Publié dans Traite de LITTERATURE DU DOMAINE OBJET DE RECHERCHE Est un Est un Est un REVUE OUVRAGE ACTES DE CONFERENCE Ontologie du domaine de la tache d’exploration Construction semi-automatique
Ontologies spécifiques à une tache Mesures d’adéquation Techniques de mise à jour Exemple Analyses CORPS CELESTE a un spectre Est un Est un Est un Partie de Partie de SYSTEME SOLAIRE COMET ASTEROIDE Synonyme ETOILE PLANETOIDE Partie de Est un SOLEIL Est un événement lié Partie de ECLIPSE SOLAIRE COURONNE SOLAIRE Ontologie du domaine abordé dans le corpus Échantillon construit à partir de IAU et Factguru
Ontologies spécifiques à une tache Mesures d’adéquation Techniques de mise à jour Exemple Analyses Echantillon de l’ontologie de tâche au niveau instance Travaille avec Rédige CHERCHEUR nom Dupont prénom Jean ARTICLE Ref : 1 Traite de objet de recherche A pour domaine d’intérêt ETOILE Est un Echantillon de l’ontologie de domaine SOLEIL Est un Evénement lié à Partie de COURONNE SOLAIRE ECLIPSE SOLAIRE Liens entre les deux ontologies
Exemple Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Analyses Prototype – interface de visualisation • Plusieurs niveaux de navigation • Niveau conceptuel : vue générale sur le corpus • Niveau instance : détails sur le corpus • Deux accès à la collection • À travers l’ontologie du domaine de la tâche • A travers l’ontologie du domaine abordé dans la collection
Exemple Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Analyses Aperçu de l’interface
Exemple Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Analyses Exploration via ontologie domaine tache
Exemple Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Analyses Connaissance établie pour instance Chercheur
Exemple Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Analyses Connaissance établie pour instance Article
Exemple Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Analyses Exploration via ontologie domaine abordé dans corpus
Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Exemple Analyses Conclusion • IAU • Intégration d ’autres éléments : instances des concepts ? • Instruments, • objets - Exemple objets Lien avec Simbad • FACTGURU ?? [http://www.site.uottawa.ca:4321/astronomy/index.html]
Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Exemple Analyses Travaux à faire • Évaluation • Cadre • Réalisable • Définition de tâches • Mise à jour - Mots clés (oui avec niveau souhaité - Ontologie - Web sémantique) • Lien avec UCD
Evaluation • Comparer l’adéquation d’échantillons de deux ontologies sur un même corpus, puis sur des différents (évolution du domaine) Proposer les corpus et les deux ontologies
particle photon particle wave pulsar psr radiation neutral particle electromagnetic wave high energy radiation celestial body Photon Electromagnetic radiation X ray X ray radiation X-ray X ray pulsar Background radiation celestial sphere X ray background X ray X-Ray X ray source X ray scattering X ray spectra X ray source X ray astronomy X ray binariesstar hard X ray wave soft X ray pulsar X ray pulsar Ontology A Ontology B Is related to Part of Is a Evaluation
Ontologie • Ontologie : « spécification explicite et formelle d’une conceptualisation partagée» [Studer 1998] • Deux niveaux sémiotiques : • Lexical (termes) • Conceptuel (concepts et relations entre concepts) base pour la communication entre les machines, entre humains et machines
Recherche d’information et ontologie • Intégration des ontologies dans un processus de recherche : • Réduction du silence : extension des requêtes à partir des termes et concepts de l’ontologie • Réduction du bruit : désambiguïsation des termes contenus dans la requête
Recherche d ’information et Ontologie • Indexation des documents à partir des concepts de l’ontologie • Descripteurs choisis dans l’ontologie • Indexation à partir de concepts et non plus à partir de mots souvent ambigus Choix d’une ontologie reflétant le ou les domaines de connaissance relatifs aux corpus
Météorite Extrait d’une hiérarchie de concepts Météorite……………….chondrule Achondrite Chondrite Extraits des documents Chondrite carbonnée Chondrule Chondrule…….. Chondrule Exploration de collections documentaires à partir d’ontologies • Objectifs : • Aide à l’indexation des documents par un procédé de catégorisation automatique des documents au niveau des concepts d’ontologies