1 / 30

Approche semi-automatisée de conception de schémas multidimensionnels valides

10 Juin 2005. Article présentée par : Ahlem SOUSSI Ingénieur en informatique & Étudiante en 2ème année mastère F.S.T. Tunisie. Approche semi-automatisée de conception de schémas multidimensionnels valides. Directeurs de Mastère M.A. Jamel FEKI M.C. Faiez GARGOURI. Laboratoire. Plan.

misha
Download Presentation

Approche semi-automatisée de conception de schémas multidimensionnels valides

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 10 Juin 2005 Article présentée par : Ahlem SOUSSI Ingénieur en informatique & Étudiante en 2ème année mastère F.S.T. Tunisie Approche semi-automatisée de conception de schémas multidimensionnels valides Directeurs de Mastère M.A. Jamel FEKI M.C. Faiez GARGOURI Laboratoire

  2. Plan • Introduction • État de l’art • Approche proposée • Architecture fonctionnelle • Modules • Conclusion et perspectives

  3. Deux espaces de stockage : l’entrepôt de données (ED) les magasins de données (MD) Systèmes décisionnels • Systèmes transactionnels => production • Système décisionnel => pilotage MD SOURCES DE DONNEES ED MD

  4. Modèles Multidimensionnels

  5. Plan • Introduction • État de l’art • Approche proposée • Architecture fonctionnelle • Modules • Conclusion et perspectives

  6. Etat de l’art Types d’approche Propriété

  7. Plan • Introduction • État de l’art • Approche proposée • Architecture fonctionnelle • Modules • Conclusion et perspectives

  8. Approche proposée • Limite des approche mixtes : • Générer et gérer un grand nombre de schémas candidats inutiles • Approche proposée : • Mixte • Privilégie les besoins OLAP / aux besoins offerts par les sources

  9. Architecture fonctionnelle Acquisition graphique des besoins OLAP Génération de schémas de MD Génération d’un schéma d’ED Schéma de l’ED Besoins OLAP semi-structurés Besoins OLAP exprimés Schémas valides des MD BD de spécification des besoins décisionnels Schémas des Sources de Données Dictionnaire Correspondance et validation des schémas en étoile Génération de schémas en étoile Génération de schémas en constellation Schémas en étoile idéaux des MD Schémas en étoile valides des MD Génération de schémas de MD

  10. Structure des besoins OLAP

  11. Génération des étoiles • Enrichissement des tableaux de besoins • Tableaux spécifiés => Tableaux enrichis • Construction des étoiles Tableaux enrichis ===> schémas en étoiles GEN E T O I L E DOM 1 DOM 2 f1 f2 DOM 3 f3

  12. Exemple T1 T2 Sch1 : Schéma en étoile résultant de l’ajout de T2 à Sch Sch : Schéma en étoile équivalent au tableau T1

  13. Correspondance étoiles/Source • Correspondance étoile idéale / source (E/R) • Validation des correspondances effectuées • Correspondance des : • Faits, Mesures, Dimensions, Hiérarchies • Deux étapes : • Extraction des termes potentiels sources • Correspondance

  14. Exemple d’une source E/R

  15. Correspondance du fait DIM 2 fait mesures DIM 1 Identifiant Param 1 Param N H1_DIM1 H2_DIM1 • faits potentiels ? Entités ou associations n-aires contenant au moins un attribut numérique non-clé. Enseignement

  16. Correspondance des mesures DIM 2 Enseignement fait Nbre_ groupe_ enseignés, … mesures DIM 1 Identifiant Param 1 Param N H1_DIM1 H2_DIM1 • Mesures potentielles d’1 fait F ? • Si F-ass est une association n-aire : Les attributs numériques non-clés appartenant au(x) : • Fait F-ass • Associations parallèles à F-ass • Entités directement liées par F-ass • Si F-ass est une entité : Les attributs numériques non-clés appartenant au(x) : • F-ass • Entités ou association porteuse de données (Ent ou Apd) liées à F-ass par un lien (1,1) • Entités liées à F-ass par un lien (1,n)

  17. Correspondance des dimensions (1) DIM 2 Enseignement fait Nbre_ groupe_ enseignés, … mesures DIM 1 MATIERE Identifiant Code_Matière Param 1 Param N H1_DIM1 H2_DIM1 • identifiants potentiels de dimensions ? Les attributs appartenant au(x) : • Fait F-ass • Ent ou Apd appartenant à la fermeture transitive de F-ass ( c. à d. directement ou transitivement liées à F-ass par un lien (1,1) ou (1,n))

  18. Correspondance des dimensions (2) DIM 2 Enseignement fait Nbre_ groupe_ enseignés, … mesures DIM 1 MATIERE Identifiant Code_Matière Attributs_faibles Code_Auditoire Cycle H1_Matière • Attributs faibles potentiels de l’dentifiant d’une dimension ? Les attributs appartenant au(x) : • Fait F-ass • Ent ou Apd liées à F-ass par un lien (1,1) Libellé_Matière

  19. Correspondance des hiérarchies (1) Code Matière Code Auditoire Code Section H1_Matière MATIERE Libellé_Auditoire Libellé_Section Libellé Matière Volume horaire • identifiants potentiels de dimensions ? Les attributs appartenant au(x) : • Fait F-ass • Ent ou Apd appartenant à la fermeture transitive de F-ass ( c. à d. directement ou transitivement liées à F-ass par un lien (1,1) ou (1,n))

  20. Correspondance des hiérarchies (2) Matière Code_Matière Libellé_Matière Volume_horaire Code_Auditoire Libellé_Auditoire Code_Section • Extraction des attributs faibles potentiels de P ? Les attributs non-clés appartenant à : • L’élément E contenant P-ass • Ent ou Apd liées à E par un lien (1,1)

  21. Validation des correspondances • Ajustement des correspondances effectuées • corriger/supprimer les correspondances incorrectes • Compléter les correspondance manquantes • Choix de la correspondance la plus appropriée • Amélioration de la correspondance retenue • éliminer les éléments sans correspondant • ajouter des mesures calculables valides • ajouter des dimensions et des attributs supplémentaires

  22. Cas de plusieurs solutions de correspondance Corresp. des mesures Corresp. des dimensions Corresp. des hiérarchies Fp1 : Fpi : Fpn Sol1 Comparer les n solutions de corresp Corresp. des mesures Corresp. des dimensions Corresp. des hiérarchies Solj choisie fait F Soli Corresp. des mesures Corresp. des dimensions Corresp. des hiérarchies Soln Fait Fpj associé à F Faits potentiels associés à F • Métrique des : • Mesures • Dimensions • Hiérarchies • Paramètres • Calculés pour chaque solution de correspondance • Comptent le nombre de mesures, dimensions, hiérarchies et paramètres (d’un schéma en étoile) ayant un correspondant dans la source

  23. Génération des constellations Entrée : des étoiles valides Sortie : des étoiles + des constellations Idée de base : similitude entre schémas multidimensionnels Soient : . Si et Sj deux schémas . Card(Dim(Si)) = n . Card(Dim(Sj)) = m . p = Card(Dim(Si) ∩ Dim(Sj)) Ordre de constellation ?

  24. Génération des constellations (2) • Algorithme de principe : • Calculer MS et son maximum Max • Consteller les schémas les plus similaires • Mettre à jour la matrice MS • Réitérer Arrêt : - Taille(MS) =1, - valeurs de similitude faibles - sur demande.

  25. Plan • Introduction • État de l’art • Approche proposée • Architecture fonctionnelle • Modules • Conclusion et perspectives

  26. Conclusion et perspectives • Approche de construction de MD en 3 étapes : • Génération des étoiles • Correspondance et validation des étoiles • Génération des constellations • Perspectives • Implémentation de la méthode de correspondance avec des sources de données relationnelles. • Intégration des schémas de MD  schéma de l’ED.

  27. Merci de votre attention

  28. Modèle en étoile 1 fait central dimensions Modèles Multidimensionnels • Fait :activité analysé • Dimension: axe d’analyse • Modèle en constellation • ++ faits ayant des dimensions communes • Fusion de ++ schémas en étoile

  29. ED & MD • Entrepôt de données("data warehouse") • lieu de stockage centralisé d'un • extrait des sources • pertinent pour les décideurs, • daté, historisé • organisé selon un modèle informatique facilitant la gestion des données. • Magasin de données("data mart") • extrait de l'entrepôt • adapté à une classe de décideurs (ou à un usage particulier) • organisé selon un modèle approprié aux outils d'analyse.

More Related