270 likes | 561 Views
Mod é lisation des connaissances pour le Web sémantique. Olivier.Corby@sophia.inria.fr Alain Giboin Brigitte Trousse “Knowledge is Power”. PLAN. Introduction Web s é mantique XML Ontologie RDF, OWL Moteur de recherche s émantique Corese Applications
E N D
Modélisation des connaissances pour le Web sémantique Olivier.Corby@sophia.inria.fr Alain Giboin Brigitte Trousse “Knowledge is Power” Modélisation des connaissances et Web sémantique
PLAN • Introduction • Web sémantique • XML • Ontologie • RDF, OWL • Moteur de recherche sémantique Corese • Applications • Aspects ergonomiques et organisationnels • Recherche d’information sur le Web • Réutilisation de traces d'usages • Extraction de connaissances à partir de données, raisonnement à partir de cas Modélisation des connaissances et Web sémantique
Web sémantique d’entreprise • RENAULT : mémoire d’un projet véhicule pour en réutiliser les solutions lors de projets ultérieurs • Deutsche Telekom : aide à l’insertion d’un nouvel employé • CSTB : aide à la veille technologique • IPMC : mémoire des expériences menées par un biologiste. • Telecom Valley : cartographie des compétences inter-entreprises Modélisation des connaissances et Web sémantique
Mémoire d’entreprise • Matérialisationexplicite et persistante des connaissances et informations cruciales (explicites ou tacites) d’une organisation • pour faciliter leuraccès, partage et réutilisation par les membres de l’organisation • dans leurs tâches individuelles et collectives. Modélisation des connaissances et Web sémantique
Mémoire d’entreprise • Les Individus + l’Organisation + la TechnologieApproche pluridisciplinaire Modélisation des connaissances et Web sémantique
Utilisateur (tâche collective) Utilisateur (tâche individuelle) Monde extérieur (Internet & Web...) Système de Gestion des Connaissances Auteur de doc. Administrateur /Gestionnaire mémoire Veilleur / Documentaliste Ontologies Base de connaissances BD Doc. multimédia Doc. électronique Expert MEMOIRE D ’ENTREPRISE Notre vision Modélisation des connaissances et Web sémantique
IntraWeb & Mémoire d’entreprise • Les technologies du Web permettent une large diffusion d’information. • Les Intranets ou IntraWebs, basés sur les techno du Web, peuvent améliorer le partage d’infos et de conn. dans les entreprises. • Besoin d’accéderà des pers. compétentes, de retrouver des infos pertinentes dans des documents, de découvrir des services utiles, de communiquer ou publier pour partager des conn. spécifiques …. • Analogie entre les ressources du Web et les ressources de la mémoire d’entreprise. Modélisation des connaissances et Web sémantique
Vers le Web Sémantique • Langages pour représenter des metadonnées (ou annotations sémantiques) : RDF • Vers un langagestandard pour représenter des ontologies: RDF Schema, OIL, DAML, DAML+OIL OWL • Méthodes & outils pour construction (semi)-automatique ou coopérative des ontologies & des annotations: WebOde, OntoEdit, Annotea... • Langages de requêtesdédiés RDF : RQL... • Outils dédiés à RDF: CORESE, ICS Forth RDFSuite, JENA, SESAME, TRIPLE Modélisation des connaissances et Web sémantique
Vers le Web Sémantique • Services d’inférence sur les métadonnées • Passage à l’échelle & performance vs puissance d’expression & puissantes capacités d’inférence • Le Web Sémantique vs plusieurs webs sémantiquesinteropérables • Comparaison, Fusion, ou Intégration d’ontologies • Web Sémantique et Web services: DAML-S • Fouille du Web Sémantique • Agents pour recherche d’info ou fouille Modélisation des connaissances et Web sémantique
Approche« Web sémantique d’entreprise » • Mémoire d’entreprise matérialisée dans : • des ressources (documents (XML, HTML, ...) ou logiciels ou matériels ou personnes ou services), • des ontologies (décrivant le vocabulaire conceptuel partagé par une communauté), • des annotations sémantiques sur ces ressources (i.e. le contenu des documents ou les caractéristiques des logiciels/matériels/services ou les compétences des personnes), en se basant sur ces ontologies, • avec diffusion sur l’Intranet ou le Web. Modélisation des connaissances et Web sémantique
Spécificités d’un Web sémantique d’entreprise / au Web Sémantique • Organisation limitée Accord plus facile sur une politique d’entrepriseOntologies & annotations plus faciles à créer Vérif. de la validité & fiabilité des sources d’info plus facile Profilsutilisateursplus précisEchelle plus réduite pour les corpus de documents, les ontologies… • Mais:contraintesdesécurité & confidentialité • Besoin de stabilité, compatibilité & facile intégration dans l’environnementinterne de travail Modélisation des connaissances et Web sémantique
Ontologies et Annotations • L’ontologie permet de capturer les aspects pertinents de la signification des concepts utilisés dans les scénarios d’application. • Ontologies et annotations peuvent être représentées en: • Graphes Conceptuels (langage de représentationdes connaissances, utilisé en IA), • ou RDF(S) (langage recommandé par le W3C pour la description des ressources sur le Web)traducteur entre ces langages Modélisation des connaissances et Web sémantique
Documents (XML) Annotations sémantiques Ontologies <accident> <date> 19 Mai 2000 </date> <description> <facteur>le facteur d ’accident mis en cause est un problème d ambiguïté clignotant sur une nationale très fréquentée</facteur> </description> </accident> Représent. Recherche d’info utilisant les capacités des GC RDF RDF Schema Traduction RDF -> GC <rdfs:Class rdf:ID=« Facteur-Accident »> <rdfs:suclassOf rdf:ressource=« http:/…> </rdfs: Class> <rdfs:Class rdf:ID=« Ambiguite-clignotant »> <rdfs:SuClassOf rdf:ressource=« #Facteur-Accident » /> </rdfs:Class> RDF RDF Principe d’un Web sémantique d’entreprise (CORESE) Modélisation des connaissances et Web sémantique
Rôles possibles de l’ontologie • Un composant de la mémoire, destiné à être exploré par l’utilisateur final • vs Une référence pour indexer/annoter sémantiquement la mémoire à des fins d’amélioration de la recherche de ressources ou d’information dans la mémoire • vs Une base pour la communication et l'échange d’information entre des programmes, des agents logiciels Modélisation des connaissances et Web sémantique
Thèmes de recherche • Comment construire et faire évoluer les ontologies et les annotations ? • Comment les représenter et raisonner dessus ? • Comment les exploiter pour la recherche d’information ou pour la dissémination pro-active d’informations ? • Comment gérer une mémoire distribuée ? • Comment manipuler de multiples ontologies ou des annotations multi-points de vue? Modélisation des connaissances et Web sémantique
Système Multi-Agents de Gestion des Connaissances Annotations RDF Auteur Documents Documents Ontologies, modèles d ’entreprise, modèles utilisateurs (RDFS), Créateur d ’ontologies Utilisateur final(Nouvel employé,Veilleur…) Projet Européen COMMA Mémoire distribuée Modélisation des connaissances et Web sémantique
Haut niveau Niveau médian Aspects Document Aspects Entreprise Aspects Utilisateur Aspects Domaine Niveau spécifique Ontologie O ’CoMMA • Méthode: Recueil, Phase terminologique, Structuration, Validation, Formalisation en RDFS • Résultat: 470 concepts, 80 relations, 13 niveaux de profondeur Modélisation des connaissances et Web sémantique
CoMMA : Conclusions • Méthode de constructionde l’ontologie + Structure de l’ontologie • Recherche d’infos par des agents guidés par des ontologies et des modèles : “agents Corese” • Possibilité de distribution de la mémoire :distribution des annotations et distribution des requêtes Modélisation des connaissances et Web sémantique
Mémoire de projet véhicule (RENAULT) • Objectif : Capitaliser les connaissances sur les problèmes d’un projet véhicule. • Approche SAMOVAR : • Exploiter un outil de traitement linguistique sur les champs textuels du Système de Gestion de Pbs • Construire une ontologie(Problème, Pièce...) • Annoter les descriptions de pb avec cette ontologie • Exploiter le moteur de recherche CORESE pour la rech. d’infos Modélisation des connaissances et Web sémantique
Ontologie Pièce Problèmes Candidatsà insérer dans l’onto Problème Champs textuels de la base SGP Extraction Nomino Enrichiss. ontologie Validation Sorties Nomino UCN(A), N, ... Initialisation ontologie Bootstrapde l’ontologieProblème Ontologie Problème Base règles heuristiquesterminol. Interviews Construction de l’Ontologie Problème Modélisation des connaissances et Web sémantique
SAMOVAR Ontologie RDFS Je cherche toutes les pièces sur lesquelles des problèmes de claquement ont été observés I H M Organisation de SAMOVAR Moteur de recherche CORESE Base annotée RDF Modélisation des connaissances et Web sémantique
Zone Problème Poste de Conduite Montage Latéral Géométrie ARCHITECTE Climatisation Fixation MEP Planche de Bord Instrumentation Centrage G F E Climatiseur Volant de direction Vide Poche Vissage Accostage Clipsage Chaussage Tableau de bord Evacuation de condensation PIECES Agrafage Traverses Poste de Conduite Levier de vitesse Extrait de l’ontologie Pièce Extrait de l’ontologie Problème Recherche guidée par l’ontologie Modélisation des connaissances et Web sémantique
SAMOVAR : Conclusions • Ontologie dans une véritable application industrielle • Méthode de construction d’une ontologie à partir de textes :Exploitation d’outils de TALN + validation humaine • Méthode de construction d’une mémoire de projet Modélisation des connaissances et Web sémantique
Projet RNRT « KMP » KMP = Knowledge Management Platform • Objectifs :Concevoir un prototype d’unServeurWeb Sémantiquedecompétencespour le partenariat inter-firmesdansle domaine des télécommunications& Analyserles usages collectifsdu prototype Exemple derequêtevisée : I am seeking for an industrial partner knowing how to design integrated circuits within the GSM field for cellular/mobile phone manufacturers • Zone : Telecom Valley (Sophia Antipolis) • Equipe multi-disciplinaire • Conception centrée utilisateur et participative Modélisation des connaissances et Web sémantique
Conclusions • Approche « Web sémantique d’entreprise » : recherche d’info guidée par des ontologies et des annotations • Comparable à d’autres projets : C-WEB, DECOR, FRODO, MESMUSES, OntoKnowledge,... • Différents rôles de l’ontologie • Applications : accidentologie, bâtiment, automobile, télécommunications, santé, biologie • Scénarios : mémoire de projet, veille techno, cartographie des compétences... • Perspectives : « Web sémantique inter-entreprises / inter-communautés »Passage à l’échelle + hétérogénéité + dynamique + services web sémantique Knowledge Web Modélisation des connaissances et Web sémantique