210 likes | 329 Views
Quality-oriented and Metadata-driven Integration in Information Grids. Christoph Quix Présenté par Tarek TURKI tartur2000@yahoo.fr. Plan. Présentation du contexte Introduction Objectifs La méthodologie d’intégration Conclusion et perspectives Bibliographie.
E N D
Quality-oriented and Metadata-driven Integration in Information Grids Christoph Quix Présenté par Tarek TURKI tartur2000@yahoo.fr Tarek TURKI MRI - RTS
Plan • Présentation du contexte • Introduction • Objectifs • La méthodologie d’intégration • Conclusion et perspectives • Bibliographie Tarek TURKI MRI - RTS
Christoph Quix est un professeur assistant au groupe SI (Informatik V) de RWTH Aachen, Allemagne Il a reçu son Ph.D. en informatique en 2003 Il travaille sur la gestion de la méta-donnée dans les entrepôts de donnée Il a réalisé une trentaine de publications dans les journaux scientifiques et les conférences internationales Publié en décembre 2004 Présentation du contexte Tarek TURKI MRI - RTS
Introduction • Grille d’information • Abstraction des ressources • Interface unique pour faire des requêtes • Sources de données hétérogènes, indépendantes et dynamiques • But : délivrer un « bon » résultat pour une requête donnée • Besoin de la qualité des résultats + méta-donnée (hétérogénéité)! Tarek TURKI MRI - RTS
Objectifs • Un Framework de méta-données étendu pour stocker les différents types de méta-données • L’intégration de la qualité sous plusieurs aspects (complétude, exactitude, …) dans le Framework • Une méthodologie qui se base sur la méta-donnée et la qualité pour l’intégration de l’information Tarek TURKI MRI - RTS
Modèle de la méta-donnée • On classe la méta-donnée d’une source selon 3 perspectives : • Perspective conceptuelle : ontologies et modèles sémantiques de la grille • Perspective logique : modélise la structure de la donnée, c’est une vue du schéma conceptuel • Perspective physique : décrit les emplacements de la donnée et la façon d’y accéder Tarek TURKI MRI - RTS
Modèle de la méta-donnée Tarek TURKI MRI - RTS
Qualité des données • Contexte d’utilisation pris en compte • L’approche GQM (Goal-Question-Metric) propose un modèle intéressant de la qualité • Séparation de la qualité requise par les utilisateurs et le calcul des facteurs de qualité • Utilise les questions pour évaluer les facteurs de qualité Ex: « Améliorer la disponibilité du système A » « Quel est le temps de réponse des requêtes? » Tarek TURKI MRI - RTS
Qualité des données Tarek TURKI MRI - RTS
Méthodologie d’intégration Tarek TURKI MRI - RTS
Méthodologie de l’intégration • Ontologie de la grille • Associations Ontologies/Schémas logiques • Metadata Repository & les informations sur la Qualité • Requête utilisateur & Qualité requise • Réécriture de la requête Tarek TURKI MRI - RTS
Ontologie de la grille • Définie les sémantiques des informations dans la grille • Définie les classes et les relations qui les lient à l’aide d’un langage tel que OWL Tarek TURKI MRI - RTS
Association schémas/ontologies (1) • Chaque source fournie un schéma de la structure des données stockées • Un schéma logique est une vue sur l’ontologie • Cette approche, est dite LAV (local-as-view) • Schéma logique : structure de la donnée • Ontologies : description abstraite des objets • Comment relier ces schémas logiques avec les objets conceptuels ? Tarek TURKI MRI - RTS
Association schémas/ontologies (2) • Solution : Utilisation des requêtes d’annotation ! • Ex : (b,i,t,a,d,n) sont les objets conceptuels et (isbn,name…) sont des données relationnelles Tarek TURKI MRI - RTS
Metadata Repository & les informations sur la Qualité • Gère toute la méta-donnée nécessaire à l’intégration de l’information • Contient une carte des associations ontologies/schémas logiques • Contient les informations sur la qualité des sources de données • Compare la qualité requise par l’utilisateur avec celles des sources meilleure réécriture des requêtes Tarek TURKI MRI - RTS
Requête utilisateur & Qualité requise • La définition d’une requête est similaire à celle d’un schéma logique • Ex : retrouver tous les auteurs qui vivent à Munich • Les besoins en qualité sont exprimés à l’aide d’un poids entre [0,1] • Le poids peut être affecté à chaque prédicat et/ou à chaque aspect de la qualité (disponibilité, …) Tarek TURKI MRI - RTS
Réécriture de la requête • La requête utilisateur est réécrite en plusieurs requêtes pour les sources de données • Principe : • Identifier les sources qui peuvent contribuer dans le résultat de la requête. • Trouver toutes les combinaisons « correctes » des sources identifiées • Utilisation de l’algorithme MiniCon pour la deuxième étape de la réécriture Tarek TURKI MRI - RTS
MiniCon • Construction du MiniCon-Description (MCD) : c’est une liste des associations entre les prédicats des requêtes et ceux des sources • Combiner les MCD pour couvrir la totalité des prédicats de la requête • Prendre en compte les requêtes d’annotation par la création d’une fonction « match » spécifique Tarek TURKI MRI - RTS
Conclusion et perspectives • Un nouveau modèle pour les méta-données • La méthodologie d’intégration proposée est bien définie • Pas d’implémentation pas d’expérimentation pas d’évaluation Perspectives : • Intégration d’une vue orientée service • Implémentation d’un prototype au sein du Framework OGSA-DAI Tarek TURKI MRI - RTS
Bibliographie M. Jarke, M. A. Jeusfeld, C. Quix, P. Vassiliadis. « Architecture and Quality in Data Warehouses: An Extended Repository Approach ». Information Systems, 24(3):229–253, 1999. Tarek TURKI MRI - RTS
Any Questions ? Tarek TURKI MRI - RTS