190 likes | 339 Views
Un système de médiation basé sur les ontologies. FDC 2006 Troisième atelier sur la "Fouille de données complexes dans un processus d'extraction des connaissances" 17 Janvier 2006 Lille, France Nora Maiz, Omar Boussaid et Fadila Bentayeb Laboratoire ERIC Université Lumière Lyon 2
E N D
Un système de médiation basé sur les ontologies FDC 2006 Troisième atelier sur la"Fouille de données complexes dans un processus d'extraction des connaissances" 17 Janvier 2006 Lille, France Nora Maiz, Omar Boussaid et Fadila Bentayeb Laboratoire ERIC Université Lumière Lyon 2 Bt L, 5av Pierre Mendès-France 69 676 BRON
? SGBD relationnel SGBD objet SGBD Semi- structuré Fichiers texte application Chaîne hôtelière Agence de voyage Site horaire vols Information ville Météo Comment faire pour aller à Lille (FDC)? OQL SQL XML HTML xquery n-uplets M. de recherche Instances objets API
Ontologie Médiateur Adaptateur Adaptateur Adaptateur Adaptateur Adaptateur SQL HTML instances objets XML M. Rech n-uplets xquery OQL API SGBD relationnel SGBD objet SGBD Semi- structuré Fichiers texte application Chaîne hôtelière Agence de voyage Site horaire vols Information pays Météo
Contexte • Notre travail s’inscrit dans le cadre d’une collaboration avec Le Crédit Lyonnais (LCL). • LCL dispose de plusieurs sources hétérogènes qui évoluent rapidement. • Objectif : développer un médiateur à base d’ontologies pour résoudre les problèmes d’hétérogénéités structurelle et sémantique des données.
Etatde l’art • Ontologies pour l’intégration : • Architecture des ontologies • Approche avec une seule ontologie (SIMS) • Approche avec plusieurs ontologies (OBSERVER) • Approche hybride (KRAFT) • Modèles d’intégration : • GAV(Global as view) • LAV(local as view) • GLAV (Generalized Local As View)
Notre système de médiation • Approche ascendante de développement des ontologies • Langage de requêtes • Algorithme de réécriture de requêtes Application sur les sources de LCL
Approchede développement des ontologies Étape 1 : Construction des ontologies locales Étape 2 : Construction de l’ontologie globale Étape 3 : Définition des correspondances Choix de l’architecture et du modèle : - Architecture hybride modélisée selon GLAV.
Utilisationdu OWL • Avantages : • Puissance d’expression des concepts et de leurs relations • Capacité de faire du raisonnement • Les classes OWL représentent les concepts élémentaires des sources de données • Les propriétés OWL représentent les liens entre les différents concepts
Exemplede LCL Collaborateur (IdCollaborateur) DemandeMarketing (IdDemande, IdCollaborateur) Personne (IdPersonne, NomPersonne) Profil (IdProfil, LibProfil, TypeProfil, IdPersonne) S1 - Collaborateur - D. Marketing - Personne - Collaborateur - Collaborateur E - Collaborateur D - Profil S2 • Personne • - Collaborateur • - Profil
Réécriturede requêtes • Notre approche est modélisée selon le modèle GLAV un dépliement et une réécriture de requêtes • Langage de requêtes • Algorithme de réécriture de requêtes
Langage de requêtes • Requête utilisateur Q : conjonction de sous requêtes Qi => Q = i=1…nQi • Une sous requête Qi = ( QLAV) v (QGAV) • QLAV = Concept(x) • QGAV = Concept(x) Propriété(x,y) Concept(y)
Réécriture derequêtes • But : - Réécrire toutes les QLAV en QGAV - Définir une table de correspondances - Eliminer les QLAV qui ne correspondent pas aux autres sous requêtes • Algorithme : - Entrée : une requête utilisateur est une conjonction de QLAV et/ou QGAV. - Sortie : ensemble de requêtes sémantiquement équivalentes
Exemple Q : (collaborateur (x) aUneAdresse (x,y) Adresse(y)) … 1 (Adresse (z) aPourVille (z, «Lyon »)) ………………... 2 (Profil (p))………………………………………………... ...3 1,2 GAV : sous requêtes envoyées aux adaptateurs correspondants pour être exécutées ; puis jointure des résultats. 3 LAV : sous requête doit être réécrite en : (Personne(r) aUnProfil(r,p) Profil(p) exécutée ; puis jointure avec les résultats précédents.
Implémentation de INMEA Ontologie locale Système de médiation par agents et ontologies OWL Source de données Agent wrapper Module de raisonnement Ontologie locale Ontologieglobale requête Source de données Agent wrapper Module de requêtage et de réécriture Ontologie locale Agent médiateur Source de données Agent wrapper
Conclusion • Nous avons proposé un système de médiation basé sur les ontologies : • Une méthode ascendante de conception des ontologies • Un langage de requêtes • Un algorithme de réécriture • L’approche est validée sur les sources de LCL • Implémentation du médiateur INMEA
Perspectives • Valider notre approche sur un nombre plus important de sources • Prendre en considération la diversité des types de sources • Considérer des requêtes plus complexes • Introduire notre approche dans le cadre de l’entreposage de données