1 / 29

Business Intelligence Présentation

Business Intelligence Présentation. Sommaire. Le système d’information Décisionnel Les modèles de données Le Data Mining L’offre BI de Microsoft Les nouveautés avec SQL Server 2012. La BI pour qui ? Pourquoi ?. La chaine décisionnelle. Outils BI. Proactif Interactif Passif.

teo
Download Presentation

Business Intelligence Présentation

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Business IntelligencePrésentation

  2. Sommaire Le système d’information Décisionnel Les modèles de données Le Data Mining L’offre BI de Microsoft Les nouveautés avec SQL Server 2012

  3. La BI pour qui ? Pourquoi ?

  4. La chaine décisionnelle Outils BI Proactif Interactif Passif Data Mining OLAP Reporting Adhoc Reporting de masse Rendu Présentation Exploration Découverte

  5. Définitions – Vocabulaire • Infocentre = Base de données dédiée à l’analyse d’une application  A l’origine des “copies” de base de production • Staging Area : Espace de stockage temporaire des données provenant des différentes sources. C’est un lieu où l’on va pouvoir stocker des données qui arrivent à des moments différents. C’est une zone d’attente, une “salle d’embarquement”. • ODS (Operating Data Store) • Lieu où vont être effectuées les transformations, les croisements, etc. C’est l’étape juste avant l’alimentation du Datawarehouse et il utilise, comme source la Staging Area. • Le modèle de données de l'ODS est un modèle relationnel classique assez proche des modèles de production • Ce « sas » assure l'isolation des mondes "opérationnel" et "décisionnel" (performances, exploitabilité...) • Datawarehouse = Entrepôt de données, destiné à centraliser, nettoyer, et uniformiser les données de l’entreprise à des fins de reporting et d’analyse. Il stocke l’historique des données avec la granularité la plus fine, • Data Mart : Entrepôt de données dédié à un métier particulier. Il est situé en aval du Datawarehouse

  6. Architecture cible Modélisation Source OLTP Infocentre (Miroir OLTP) Stockage Multidimensionnel Staging Area ODS DataWarehouse Data Mart1 Data Mart2 Restitution OLAP Cubes Outils Clients (Excel, Proclarity…) Reporting Custom Data Mining

  7. Typologie et périmètre des projets décisionnels • Un SID (système d’information décisionnel), c’est : « un système permettant aux utilisateurs de l’entreprise de disposer d’informations pertinentes et d’outils d’analyse puissants pour les aider à prendre les bonnes décisions au bon moment » (Bill Inmon) • Un projet décisionnel est réussi quand l’utilisateur dit : « J’ai l’information, elle est sûre, je la comprends, donc je l’utilise »

  8. Modélisation BI • KIMBALL : • Tables de fait , Tables de Dimensions • Stockage dénormalisé des données • Inmon’s: • S ’appuie sur une modélisation en BD relationnelle complexe • Les données sont stockées dans la 3éme Forme Normale (3NF) • Lequel Choisir? • Traditionnellement la modélisation Kimbal est utilisée • Kimball permet un Feedback rapide / demandes métier

  9. La pierre angulaire d’un système décisionnel Le modèle de donnée OLTP(Online Transaction Processing ) Reporting opérationnel OLAP (Online Analytical Processing ) Pilotage métier et entreprise

  10. OLTP VS OLAP OLTP OLAP • Time-critical • In-place data update • Current data (‘Snapshot’) • Functional transaction focus • Store details only • Only keeps company internal data • Small delays tolerable • Append only • Historical and current data • Reporting (information delivery) focus • Store summary + details(e.g. counts and aggregates) • Warehouse also keeps external data (e.g. customer demographics)

  11. Les modèle de données ROLAP Schéma en flocon Schéma en étoile

  12. Les technologies Multidimensionnelles

  13. Le Data Mining QU'EST-CE QUE LE DATA MINING ? C’est l'exploration et l'analyse de grandes quantités de données afin de découvrir des formes et des règles significatives en utilisant des moyens automatiques ou semi-automatiques. • Basé sur des méthodes mathématiques +/- complexes : • Méthodes de tri : Les algorithmes de Data Mining • Technique: Statistique • Résultat: Prédiction, estimation, classification

  14. Les Algorithmes de Data Mining Analyse supervisée (Y=fct(x1,x2…xn)) Analyse Non-supervisée (pas de sortie à classer) -Naive Bayes -Arbre de décision -Réseaux de neurones -Réseaux Bayesiens -Régression logistique - Arbre de décision -Régression linéaire -Réseaux de neurones -Régression logistique • Clustering - Time Series -Règles d’Association -Arbre de décision Classification Estimation Cluster Forecast Association Sans le savoir, vous utilisez le Data Mining tous les jours! Eg: MozillaThunderbird et Microsoft Outlook utilisent le classifier Naive Bayes pour filtrer les spam de vos mails.

  15. Exemple de Data Mining: • Entreprise : banque • Activité : prêts hypothécaires • Problème : accepter ou refuser une demande de crédit ? • Solution: Analyser les données historiques : solvabilité observée lors des anciens crédits pour prévoir la solvabilité des Nouveaux demandeurs de crédit

  16. Quelques possibilités d'utilisation • Marketing • Quel profil de client cibler lors d’une campagne marketing ? • Quels clients sont susceptibles de réagir à une promotion déterminée ? (CRM) • Quels produits offrir à quels clients ? (Eg: Amazone) • Finances • Quels produits financiers proposer à quels clients ? • Comment détecter une faillite prochaine ? (Crise Boursière) • Télécommunications • Quels clients sont susceptibles de nous quitter ? • Quel est le profil des clients très rentables, • et des clients pas ou peu rentables ?

  17. L’offre BI de Microsoft

  18. Architecture fonctionnelle avec Microsoft BI Data Mining

  19. SQL Server Management Studio SQL Server Management Studio est un environnement intégré qui permet d'avoir accès, de configurer, de gérer, d'administrer et de développer tous les composants de SQL Server. SQL Server Management Studio associe un groupe d'outils graphiques à des éditeurs de script T-SQL, MDX, …

  20. SQL Server Integration Services • Au-delà du simple transfert des données d’une source vers une destination, l’ETL sert à : • Ordonnancer des taches • Nettoyer les données transférées • Augmenter la puissance de traitement pour faire face à l’accroissement constant des volumes de données • Prendre en charge la totalité de la chaîne de traitement, c’est-à-dire d’être à même de mettre à jour les cubes OLAP construits à partir des entrepôts de données mis à jour • À l’aide d’outils de débogage, les développeurs peuvent définir des points d’arrêts sur les packages, les conteneurs, les événements de tâches et les observateurs de données pour surveiller les données pendant leur passage dans le flux.

  21. SQL Server Reporting Services • SQL Server Reporting Services est un outil de génération de rapports d’entreprise. • Le générateur de rapports, autorise les utilisateurs à : • Créer leurs propres rapports : reporting Had-hoc avec ReportBuilder • S’abonner à des rapports (Pull/Push) • Exporter les rapports en différents formats

  22. SQL Server Analysis Services • SQL Server Analysis Services permet de concevoir, de créer et de gérer des structures multidimensionnelles qui contiennent des données agrégées provenant d'autres sources de données

  23. Le Data Mining avec Xls 2010 il s’agit d’utiliser de manière transparente et naturelle de puissants outils statistiques. Des analyses prédictives rendues possibles directement depuis Excel 2007 grâce à l’add-in nommé « SQL Server 2008 Datamining pour Excel.»

  24. Portail Collaboratif (SharePoint 2010) • Les technologies SharePoint apportent : • Un portail d’entreprise qui intègrent tous les composants de Microsoft Business Intelligence : rapports, analyses, tableaux de bord, Scorecards, feuilles Excel, … • La BI collaborative pour agir après l’analyse. • Des fonctionnalités clés telles que la recherche, la gestion de contenu, la collaboration, la visualisation de feuilles Excel en mode web.

  25. Microsoft SQL Server 2012 : Denali • High Availability • Scalability and Performance • Business Intelligence • Web & Breadth • Security & Manageability • EDIM • User-Defined Server Roles 15 000 partitions/table • Windows Server Core Support • Unified Semantic Model • PHP Driver Data Lineage Reliable & Integrated Failover Detection Column store DataWarehouse Crescent • Impact Analysis Semantic Platform SQL Studio In-memory BI for corporate Contained Database Authentication Application Centric Failover LocalDB SSIS Server Fast FileStream Alerting • Multiple Readable Secondaries Win32 access to database files Data Quality Database Replay UTF-16 Sysprep for AS Enhanced MDS • Paging for result sets Audit Enhancements Online Operations Fast Full Text PowerPivot Enhancements HA for StreamInsight Management Pack for High Availability FileTable • Full Globe Spatial Support AlwaysOn Reporting as SharePoint Shared Service Backup Secondaries • DAC Enhancements • ODBC for Linux SSMS Enhancements • JDBC 4.0 driver

  26. Merci …

  27. Unified Semantic Model

  28. Projet Crescent : Power View

  29. Projet Crescent : Power View

More Related