500 likes | 641 Views
Intégration de schémas de bases de données. J. Akoka I. Comyn-Wattiau. 1. Sommaire. Contexte Définitions Problèmes d’intégration Etapes de l’intégration Exemple Outils d’intégration. CONTEXTE. Contexte. Conception ascendante de bases de données Fusion de bases de données réparties
E N D
Intégration de schémas de bases de données J. Akoka I. Comyn-Wattiau 1
Sommaire • Contexte • Définitions • Problèmes d’intégration • Etapes de l’intégration • Exemple • Outils d’intégration
Contexte • Conception ascendante de bases de données • Fusion de bases de données réparties • Conception incrémentale • Conception d’entrepôts de données
Conception ascendante de bases de données • Principe : chaque groupe d’utilisateurs construit sa vue de la base de données • Avantages : • validation précoce des vues • parallélisme • taille des vues • Inconvénients : entraîne une phase supplémentaire d’intégration
Fusion de bases de données réparties • Principe : rassembler les différentes parties d’un système distribué en une vue unique centralisée • Intérêts : • fournir une vision globale de la base répartie • assurer la cohérence globale de la base • Problèmes : • les parties peuvent être conflictuelles • les systèmes existent déjà
Conception incrémentale • Principe : on conçoit un schéma de bases de données par ajout progressif d’information • Avantages : • validation intermédiaire • prise en compte des modifications • Inconvénients :
Conception d’entrepôts de données • Principe : on produit une vue conceptuelle d’un entrepôt par intégration des bases sources • Avantages : permettre une meilleure connaissance du contenu de l’entrepôt • Inconvénients : l’entrepôt n’est pas uniquement une fusion (sélection, raffinement, etc.)
Définition • Confronter différentes perceptions du réel • modélisées • par des concepteurs humains
Réel Modélisation conceptuelle Schéma conceptuel Conception logique Schéma logique Conception physique B.D. Le cycle classique de conception de base de données
Réel Réel Réel ... M.C. M.C. M.C. Vue 1 Vue 2 Vue n Intégration Schéma conceptuel Conception logique Schéma logique Conception physique B.D. L’intégrationde vues une alternative à la modélisation conceptuelle classique
Quelques définitions • Vue ou schéma local : dénomination des schémas sources • Schéma résultant ou schéma global ou schéma intégré : schéma conceptuel résultant de l’intégration
Intégration de bases de données • C’est l’intégration de bases de données existantes • Elle comprend : • la conception d ’un schéma global ou intégration de schémas • l ’intégration des données (problèmes de conversion, formatage, etc.)
Les problèmes d’intégration • Conflits determinologie • Différentesdéfinitions de classes • Représentations équivalentes • Définition de contraintes
CHERCHEUR SUJET travaille concerne SUJET LIVRE Conflits de terminologie • synonymie • homonymie EMPLOYE SALARIE VUE 1 VUE 2 VUE 1 VUE 2 10/02/97 17
Conflits de terminologie TERMES CONCEPTS Domaine de recherche Sujet Salarié Thème Employé Employé
Différentes définitions de classes • inclusion de classes AUTOMOBILISTE possède VOITURE VUE 1 possède PERSONNE VOITURE VUE 2
Différentes définitions de classes • intersection de classes prêt immobilier PERSONNE BANQUE VUE 1 VUE 1 prêt personnel BANQUE PERSONNE VUE 2
Conflits de définitions de classes CONCEPTS POPULATIONS Prêts immobiliers Prêt Prêts personnels Personne Automobiliste Personnes
Terminologie et recouvrement de classes • Les deux types de problèmes se présentent souvent de la même façon VUE 1 VUE 2 NSS Nom Prénom Service Numlit HOSPITALISE PATIENT NSS Nom Prénom Médecin Patient et Hospitalisé sont synonymes ? Patient et Hospitalisé sont-ils en recouvrement de classes ?
LIVRE titre EDITEUR nom Equivalences de représentation (1) titre LIVRE éditeur VUE 1 VUE 2
Equivalences de représentation (2) PERSONNE nom nom PERSONNE sexe HOMME FEMME VUE 1 VUE 2
Définition de contraintes EMPLOYE EMPLOYE (1,1) (1,n) (1,n) (1,n) PROJET PROJET VUE 1 VUE 2
Les étapes de l ’intégration • Comparaison • Mise en conformité • Fusion • Enrichissement du schéma
Comparaison des vues • Mise en correspondance des éléments communs • Identification des conflits • de terminologie, • de représentation, • de contraintes, • etc.
Fusion des schémas • Les concepts communs aux deux schémas sont insérés une seule fois dans le schéma global • Les autres concepts sont ajoutés au schéma global • Il y a enrichissement mutuel des schémas : une entité se voit dotée des attributs des deux entités d ’origine
Enrichissement du schéma • Dans le schéma global, des concepts nouveaux se trouvent en commun • La phase d’enrichissement permet de définir d’éventuelles relations sémantiques entre ces concepts
Nom, prénom, N°SS, adresse Personne Matricule, date-embauche, salaire Patient Personnel Num-dossier, date-création Hospitalisé Externe Médecin Infirmière Grade, type-contrat Spécialité, num-agrément Date-entrée Rendez-vous Convoqué Posologie Date Dose, fréquence Nom Bâtiment Rattaché Affectation Unité Code, nom, type-conditionnement, type-malade Service Médicament Nom, code, téléphone VUE 1 Fournit Nom, adresse Laboratoire
Matricule, nom, prénom, N°SS, adresse, salaire Personnel Grade, type-contrat Poste, qualification Infirmière Médecin Administratif Num-agrément Exerce Spécialité Affectation Rattaché Nom, prénom, adresse, num-dossier, date-entrée Patient Nom, code, téléphone Hospitalisé Service Prescription Dose, fréquence Code, nom, type-conditionnement, prix Médicament VUE 2 Fournit Nom, adresse Laboratoire
Comparaison des vues • Synonymie : Posologie et Prescription • Homonymie : Hospitalisé • Recouvrement de classes : Patient • Représentations équivalentes : Spécialité • Conflits de contraintes : non décrits sur les graphiques
Nom, prénom, N°SS, adresse Personne Matricule, date-embauche, salaire Patient Personnel Num-dossier, date-création Num-agrément Hospitalisé Externe Médecin Infirmière Grade, type-contrat Date-entrée Exerce Date Convoqué Rendez-vous Prescription Spécialité Dose, fréquence Nom Bâtiment Rattaché Affectation Unité Code, nom, type-conditionnement, type-malade Service Médicament Nom, code, téléphone Mise en conformité de la vue 1 Fournit Nom, adresse Laboratoire
Matricule, nom, prénom, N°SS, adresse, salaire Personnel Grade, type-contrat Poste, qualification Infirmière Médecin Administratif Num-agrément Exerce Spécialité Affectation Rattaché Nom, prénom, adresse, num-dossier, date-entrée Hospitalisé Nom, code, téléphone Intégré Service Prescription Dose, fréquence Code, nom, type-conditionnement, prix Mise en conformité de la vue 2 Médicament Fournit Nom, adresse Laboratoire
Nom, prénom, N°SS, adresse Personne Personnel Administratif Patient Num-dossier, date-création Matricule, date-embauche, salaire Poste, qualification Num-agrément Hospitalisé Externe Externe Médecin Infirmière Grade, type-contrat Date-entrée Exerce Convoqué Rendez-vous Prescription Date Spécialité Unité Dose, fréquence Rattaché Affectation Intégré Code, nom, type-conditionnement, type-malade, prix Service Médicament Nom, code, téléphone Fusion des schémas Fournit Nom, adresse Laboratoire
Nom, prénom, N°SS, adresse Personne Personnel Matricule, date-embauche, salaire Administratif Patient Num-dossier, date-création Poste, qualification Affilié Num-agrément Hospitalisé Externe Externe Médecin Infirmière Grade, type-contrat Date-entrée Exerce Convoqué Rendez-vous Prescription Date Spécialité Unité Dose, fréquence Rattaché Affectation Intégré Code, nom, type-conditionnement, type-malade, prix Service Médicament Nom, code, téléphone Enrichissement du schéma Fournit Laboratoire Nom, adresse
Première génération Propriétés inter-schémas Règles d ’intégration Schéma intégré • Couvre uniquement la phase de fusion des schémas
Deuxième génération Schémas à intégrer Recherche des correspondances entre vues Règles d ’intégration Schéma intégré • Couvre les phases de comparaison des vues et de fusion des schémas
Troisième génération Schémas à intégrer Recherche des correspondances entre vues Dictionnaire sémantique Règles d ’intégration Schéma intégré • Couvre les phases de comparaison des vues et de fusion des schémas et enrichit la comparaison
Un exemple d ’outil Transformation de structures Validation Héritage de propriétés Comparaison de structures Construction du schéma global Choix d ’intégration Résolution de conflits Intégration de contraintes
Comparaison de structures • Elle est portée par un vecteur de similitude • Elle est effectuée, deux à deux, pour tous les constituants des schémas • Elle compare : • les noms • les domaines • les constituants • les populations,etc.
Similitude entre entités • Sim=(nom, structure, population) • soit p le nombre d ’attributs équivalents, soient n et m le nombre d ’attributs de chaque entité : • si p=n=m alors structure=1 • si p=n et n<m alors structure=0.75 • si p=0 alors structure=0 • si p=n/2 et n=m alors structure=0.5 • si p>m/2 et n<=m alors structure=0.66 • si n/2<=p<=m/2 alors structure=0.33 • si p<n/2 et n<=m alors structure=0.25
Construction du schéma global • Intégration automatique
Construction du schéma global • Intégration semi-automatique
CONCLUSION • Les situations d ’intégration sont de plus en plus fréquentes • L ’automatisation est rare • L ’automatisation est difficile car les problèmes à résoudre sont d ’ordre sémantique