1 / 50

Intégration de schémas de bases de données

Intégration de schémas de bases de données. J. Akoka I. Comyn-Wattiau. 1. Sommaire. Contexte Définitions Problèmes d’intégration Etapes de l’intégration Exemple Outils d’intégration. CONTEXTE. Contexte. Conception ascendante de bases de données Fusion de bases de données réparties

omer
Download Presentation

Intégration de schémas de bases de données

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Intégration de schémas de bases de données J. Akoka I. Comyn-Wattiau 1

  2. Sommaire • Contexte • Définitions • Problèmes d’intégration • Etapes de l’intégration • Exemple • Outils d’intégration

  3. CONTEXTE

  4. Contexte • Conception ascendante de bases de données • Fusion de bases de données réparties • Conception incrémentale • Conception d’entrepôts de données

  5. Conception ascendante de bases de données • Principe : chaque groupe d’utilisateurs construit sa vue de la base de données • Avantages : • validation précoce des vues • parallélisme • taille des vues • Inconvénients : entraîne une phase supplémentaire d’intégration

  6. Fusion de bases de données réparties • Principe : rassembler les différentes parties d’un système distribué en une vue unique centralisée • Intérêts : • fournir une vision globale de la base répartie • assurer la cohérence globale de la base • Problèmes : • les parties peuvent être conflictuelles • les systèmes existent déjà

  7. Conception incrémentale • Principe : on conçoit un schéma de bases de données par ajout progressif d’information • Avantages : • validation intermédiaire • prise en compte des modifications • Inconvénients :

  8. Conception d’entrepôts de données • Principe : on produit une vue conceptuelle d’un entrepôt par intégration des bases sources • Avantages : permettre une meilleure connaissance du contenu de l’entrepôt • Inconvénients : l’entrepôt n’est pas uniquement une fusion (sélection, raffinement, etc.)

  9. DEFINITIONS

  10. Définition • Confronter différentes perceptions du réel • modélisées • par des concepteurs humains

  11. Réel Modélisation conceptuelle Schéma conceptuel Conception logique Schéma logique Conception physique B.D. Le cycle classique de conception de base de données

  12. Réel Réel Réel ... M.C. M.C. M.C. Vue 1 Vue 2 Vue n Intégration Schéma conceptuel Conception logique Schéma logique Conception physique B.D. L’intégrationde vues une alternative à la modélisation conceptuelle classique

  13. Quelques définitions • Vue ou schéma local : dénomination des schémas sources • Schéma résultant ou schéma global ou schéma intégré : schéma conceptuel résultant de l’intégration

  14. Intégration de bases de données • C’est l’intégration de bases de données existantes • Elle comprend : • la conception d ’un schéma global ou intégration de schémas • l ’intégration des données (problèmes de conversion, formatage, etc.)

  15. LES PROBLEMES D’INTEGRATION

  16. Les problèmes d’intégration • Conflits determinologie • Différentesdéfinitions de classes • Représentations équivalentes • Définition de contraintes

  17. CHERCHEUR SUJET travaille concerne SUJET LIVRE Conflits de terminologie • synonymie • homonymie EMPLOYE SALARIE VUE 1 VUE 2 VUE 1 VUE 2 10/02/97 17

  18. Conflits de terminologie TERMES CONCEPTS Domaine de recherche Sujet Salarié Thème Employé Employé

  19. Différentes définitions de classes • inclusion de classes AUTOMOBILISTE possède VOITURE VUE 1 possède PERSONNE VOITURE VUE 2

  20. Différentes définitions de classes • intersection de classes prêt immobilier PERSONNE BANQUE VUE 1 VUE 1 prêt personnel BANQUE PERSONNE VUE 2

  21. Conflits de définitions de classes CONCEPTS POPULATIONS Prêts immobiliers Prêt Prêts personnels Personne Automobiliste Personnes

  22. Terminologie et recouvrement de classes • Les deux types de problèmes se présentent souvent de la même façon VUE 1 VUE 2 NSS Nom Prénom Service Numlit HOSPITALISE PATIENT NSS Nom Prénom Médecin Patient et Hospitalisé sont synonymes ? Patient et Hospitalisé sont-ils en recouvrement de classes ?

  23. LIVRE titre EDITEUR nom Equivalences de représentation (1) titre LIVRE éditeur VUE 1 VUE 2

  24. Equivalences de représentation (2) PERSONNE nom nom PERSONNE sexe HOMME FEMME VUE 1 VUE 2

  25. Définition de contraintes EMPLOYE EMPLOYE (1,1) (1,n) (1,n) (1,n) PROJET PROJET VUE 1 VUE 2

  26. LES ETAPES DE L ’INTEGRATION

  27. Les étapes de l ’intégration • Comparaison • Mise en conformité • Fusion • Enrichissement du schéma

  28. Comparaison des vues • Mise en correspondance des éléments communs • Identification des conflits • de terminologie, • de représentation, • de contraintes, • etc.

  29. Mise en conformité

  30. Fusion des schémas • Les concepts communs aux deux schémas sont insérés une seule fois dans le schéma global • Les autres concepts sont ajoutés au schéma global • Il y a enrichissement mutuel des schémas : une entité se voit dotée des attributs des deux entités d ’origine

  31. Enrichissement du schéma • Dans le schéma global, des concepts nouveaux se trouvent en commun • La phase d’enrichissement permet de définir d’éventuelles relations sémantiques entre ces concepts

  32. UN EXEMPLE

  33. Nom, prénom, N°SS, adresse Personne Matricule, date-embauche, salaire Patient Personnel Num-dossier, date-création Hospitalisé Externe Médecin Infirmière Grade, type-contrat Spécialité, num-agrément Date-entrée Rendez-vous Convoqué Posologie Date Dose, fréquence Nom Bâtiment Rattaché Affectation Unité Code, nom, type-conditionnement, type-malade Service Médicament Nom, code, téléphone VUE 1 Fournit Nom, adresse Laboratoire

  34. Matricule, nom, prénom, N°SS, adresse, salaire Personnel Grade, type-contrat Poste, qualification Infirmière Médecin Administratif Num-agrément Exerce Spécialité Affectation Rattaché Nom, prénom, adresse, num-dossier, date-entrée Patient Nom, code, téléphone Hospitalisé Service Prescription Dose, fréquence Code, nom, type-conditionnement, prix Médicament VUE 2 Fournit Nom, adresse Laboratoire

  35. Comparaison des vues • Synonymie : Posologie et Prescription • Homonymie : Hospitalisé • Recouvrement de classes : Patient • Représentations équivalentes : Spécialité • Conflits de contraintes : non décrits sur les graphiques

  36. Nom, prénom, N°SS, adresse Personne Matricule, date-embauche, salaire Patient Personnel Num-dossier, date-création Num-agrément Hospitalisé Externe Médecin Infirmière Grade, type-contrat Date-entrée Exerce Date Convoqué Rendez-vous Prescription Spécialité Dose, fréquence Nom Bâtiment Rattaché Affectation Unité Code, nom, type-conditionnement, type-malade Service Médicament Nom, code, téléphone Mise en conformité de la vue 1 Fournit Nom, adresse Laboratoire

  37. Matricule, nom, prénom, N°SS, adresse, salaire Personnel Grade, type-contrat Poste, qualification Infirmière Médecin Administratif Num-agrément Exerce Spécialité Affectation Rattaché Nom, prénom, adresse, num-dossier, date-entrée Hospitalisé Nom, code, téléphone Intégré Service Prescription Dose, fréquence Code, nom, type-conditionnement, prix Mise en conformité de la vue 2 Médicament Fournit Nom, adresse Laboratoire

  38. Nom, prénom, N°SS, adresse Personne Personnel Administratif Patient Num-dossier, date-création Matricule, date-embauche, salaire Poste, qualification Num-agrément Hospitalisé Externe Externe Médecin Infirmière Grade, type-contrat Date-entrée Exerce Convoqué Rendez-vous Prescription Date Spécialité Unité Dose, fréquence Rattaché Affectation Intégré Code, nom, type-conditionnement, type-malade, prix Service Médicament Nom, code, téléphone Fusion des schémas Fournit Nom, adresse Laboratoire

  39. Nom, prénom, N°SS, adresse Personne Personnel Matricule, date-embauche, salaire Administratif Patient Num-dossier, date-création Poste, qualification Affilié Num-agrément Hospitalisé Externe Externe Médecin Infirmière Grade, type-contrat Date-entrée Exerce Convoqué Rendez-vous Prescription Date Spécialité Unité Dose, fréquence Rattaché Affectation Intégré Code, nom, type-conditionnement, type-malade, prix Service Médicament Nom, code, téléphone Enrichissement du schéma Fournit Laboratoire Nom, adresse

  40. LES OUTILS D ’INTEGRATION

  41. Première génération Propriétés inter-schémas Règles d ’intégration Schéma intégré • Couvre uniquement la phase de fusion des schémas

  42. Deuxième génération Schémas à intégrer Recherche des correspondances entre vues Règles d ’intégration Schéma intégré • Couvre les phases de comparaison des vues et de fusion des schémas

  43. Troisième génération Schémas à intégrer Recherche des correspondances entre vues Dictionnaire sémantique Règles d ’intégration Schéma intégré • Couvre les phases de comparaison des vues et de fusion des schémas et enrichit la comparaison

  44. Un exemple d ’outil Transformation de structures Validation Héritage de propriétés Comparaison de structures Construction du schéma global Choix d ’intégration Résolution de conflits Intégration de contraintes

  45. Comparaison de structures • Elle est portée par un vecteur de similitude • Elle est effectuée, deux à deux, pour tous les constituants des schémas • Elle compare : • les noms • les domaines • les constituants • les populations,etc.

  46. Similitude entre attributs

  47. Similitude entre entités • Sim=(nom, structure, population) • soit p le nombre d ’attributs équivalents, soient n et m le nombre d ’attributs de chaque entité : • si p=n=m alors structure=1 • si p=n et n<m alors structure=0.75 • si p=0 alors structure=0 • si p=n/2 et n=m alors structure=0.5 • si p>m/2 et n<=m alors structure=0.66 • si n/2<=p<=m/2 alors structure=0.33 • si p<n/2 et n<=m alors structure=0.25

  48. Construction du schéma global • Intégration automatique

  49. Construction du schéma global • Intégration semi-automatique

  50. CONCLUSION • Les situations d ’intégration sont de plus en plus fréquentes • L ’automatisation est rare • L ’automatisation est difficile car les problèmes à résoudre sont d ’ordre sémantique

More Related