610 likes | 861 Views
Business IntelligencE. Une mise en oeuvre pratique avec SQL Server. EPITA - 24 ème semaine de conférences - Promo 2012 8 novembre 2011. Jean-Pierre RIEHL Practice Manager SQL MVP SQL Server http://blog.djeepy1.net SIGL 2002 . Vincent RENZI Practice Manager Collaboratif. Agenda.
E N D
Business IntelligencE Unemise en oeuvre pratique avec SQL Server EPITA - 24ème semaine de conférences - Promo 2012 8 novembre 2011
Jean-Pierre RIEHLPractice Manager SQLMVP SQL Serverhttp://blog.djeepy1.netSIGL 2002 Vincent RENZI Practice Manager Collaboratif
Agenda • Qu’est ce que la Business Intelligence • Un projet décisionnel • La modélisation • L’intégration des données • Les cubes • La restitution des données
QU’est ce que la BI L’informatique décisionnelle désigne les moyens, les outils et les méthodes qui permettent de collecter, consolider, modéliser et restituer les données, matérielles ou immatérielles, d'une entreprise en vue d'offrir une aide à la décision et de permettre aux responsables de la stratégie d'entreprise d’avoir une vue d’ensemble de l’activité traitée. Source Wikipedia collecter modéliser restituer aide à la décision
QU’est ce que la BI • Transformer les données de l’entreprise en décisions • Analysede l’activité, des réussites et des échecs • Outil de pilotage de la performance • Planifier
A qui s’adresse la BI Pour qui ? • Le management • Les directions (générales) • Tout le monde « BI for masses »
Une question classique Pourquoi ne pas utiliser un système OLTP pour l’analyse de données ? • Affecte les performances des SI, ERP, CRM… • Les données utiles à l’analyse sont rarement contenues dans une seule source. • Données non sures, modifiées régulièrement et souvent trop précises. • La façon de visualiser les données est contrainte par le service IT au moyen de rapports ou procédures stockées. • Design Entité-Relationnel peut adapté pour l’analyse.
Les tendances du marché Self-Service BI BI mobile BI temps réel BigData
Les projets Décisionnels • Même s’il demande un fort engagement métier, un projet BI reste un projet de développement • Analyse, Conception, Développement, Tests • Ne pas négliger le caractère politique du décisionnel (négociation, consensus, adhésion)
Un projet décisionnel 2 phases : • Analyse & Conception • Réalisation
Phase 1 : analyse & conception • La phase d’analyse est primordiale • Souvent précédée d’une phase d’audit • Le livrable est la modélisation d’un DataWarehouse • C’est l’élément clé de la solution • Description des Faits (ce que j’analyse) et des Dimensions (sur quels axes) • Importance de la granularité • On se centre sur l’utilisateur (l’utilisation)
Phase 2 : réalisation • Elle inclut : • La création du DataWarehouse • L’ETL • Les cubes • Les rapports, tableaux de bord • L’intégration • On préfèrera une méthode itérative
Quel Modèle ? • Plusieurs modèles existent : • Ralph Kimball: approche DataMart • Bill Inmon: approche DataWarehouse • Sémantique : approche par entité • Data Vault : approche par propriétés • …et les autres • Mais ça reste des tables et des relations • Modèle en étoile vs. flocon
Alors ? Quel Modèle ? Choisissez le modèle pragmatique Identifiez • les mesures tables de faits • Ex : montant d’une vente, valeur d’un stock • les axes d’analyse tables de dimensions • Ex : date, pays, entrepôt, produit • La granularité • Niveau de finesse pour l’analyse
Modèle en étoile Points clés d’un projet BI
Intégrer les données Construire un ETL (ExtractTransformLoad) • Importance de : • La validation des sources • La qualificationdes données • La qualitédes données • Phase la plus risquée et la plus longue
Flux d’intégration Les données proviennent de sources(hétérogènes) et doivent « rentrer » dans le DataWarehouse • Fusion de sources • Calcul • Vérification • Correction de valeurs • Normalisation • Dédoublonnage • Etc.
Les Tendances du marché Grosses volumétries Data Quality Master Data Management Données non-structurées
Les Cubes Représentation multidimensionnelle du DataWarehouse OLAP : Online AnalyticalProcessing • RequêtageMDX • Arrivée du In-Memory
Les Cubes Un cube c’est aussi : • Des membres calculés • Ex : YTD, YOY, Y-1, % croissance, etc. • Des KPI (Key Performance Indicator) • Permet de mesurer par rapport aux objectifs • Du Data Mining
Data Mining • Science de la prédictibilité • Objectif : arriver à déterminer une valeur un comportement, une tendance à partir de données en entrée • Implémentation d’algorithmes • Forecast, Clustering, Naïves Bayes, Time Series, etc. • Utilisation • En batch (sur des lots de données) • En temps réel, fonctionnalité d’une application
La restitution des données BESOINS UTILISATEURS CE QUE CELA SIGNIFIE - + Tableaux de bords Mise en place de tableaux de bords / Directions opérationnelles Analyse Ad-hoc Réponse à des questions complexes par l’utilisateur Data Mining Analyse prédictive, Exploration de données Reporting Ad-hoc Création et mise en forme par l’utilisateur Reporting de masse Rapports pro-formats imprimés, envoyés par mail ou partagés sur portail + - Nbre Utilisateurs Maturité
Reporting de masse • Via un simple navigateur, dans un portail • Diffusion par messagerie, publipostage • Filtres, navigation, drillthrough, export, etc. • Connexion directe à toute donnée
Reporting ad-hoc par les utilisateurs • Interface de création à la mode Office • Modèle métier • Connecteurs à de nombreuses sources inclus
Analyse multidimensionnelle par les utilisateurs • Excel 2007 • Visualisation & Analyse avancée : • tableaux croisés dynamiques • Graphiques, fonctionnalités avancées • Diffusion dans un portail : Excel Services • Client léger : navigateur • Fonctions collaboratives
Scorecards & tableaux de bords • Référentiel des indicateurs clés • Consolidation, ventilation • Feedback, interactivité (navigation) • Cartes de stratégies • Méthodologie Norton & Kaplan
Les portails collaboratifS Des espaces de travail aux réseaux sociaux
Une approche centrée sur le contexte d’usage Accès à l’information et aux individus Processus pilotés par des hommes Communications interpersonnelles Espaces de travail collaboratif • Espaces de réunion • Sites d’équipes • Réseaux sociaux • Recherche • Notifications / alertes • Réseaux sociaux • Formulaires flexibles • Gestion de portefeuilles • IM/e-mail/ téléphone • Conférence audio, vidéo ou Web Services Collaboratifs Services d’Infrastructure
Lancement en avril 2010. Plus de 120 millions d’utilisateurs, 3 millions en France : Soit 20% de la base installée Office Client. Plus de 17000 clients dans le monde. Plus de 1 milliard $ de CA atteint en l’espace de 6 ans dans le monde. 15% de croissance en France sur cette année. Quelle est la réponse de Microsoft ?
Qu’est-ce que SharePoint? Portail GED Search Social Networking Collaboratif Composites Business intelligence Recherche d'Entreprise Formulaires Une plateforme applicative !
SharePoint pour quels usages? Documents Patrimoniaux DAM (ActifsNumériques : vidéo, audio…) Global Bases contractuelles Intranet d’entreprise Nuage de tags d’entreprise Portée de l’information Applicationspécifiqued’équipe Base de connaissances Mon site Local Bibliothèqued’équipeouprojet Folksonomie Taxonomiegérée Hierarchies gérées Niveau de contrôle
Partenaires et Clients (Extranet) Employés Clients Collaboration en équipe Présence sur Internet Portail Entreprise RH, Finance, etc. Individu XML Web Services Applications Métiers (Siebel, data warehouse, Apps spécifiques . . .) StratégieSharepoint: une application évolutive • Système d'information de l'entreprise homogène à tous les niveaux • Amélioration de l'efficacité des individus, des équipes, de l'entreprise • Consolidation des serveurs pour un faible TCO • Mise en œuvre de solutions métiers interopérables via les services Web • Services d'infrastructure Web
La plateforme SharePoint 2010 Pages et interface utilisateurs Connected Client APIs Server APIs Web UI Framework ASP.NET forms Web Services Library Features Templates Solutions File System Lists Features Query Content Types Workflow External Lists Silverlight XSLT Views Client OM REST LINQ Web Parts Event Model Application Lifecycle Application Model (Sites) Content Management Data Model Lists New Improved
Qu’est-ce qu’un site SharePoint ? • SharePoint gère les espaces documentaires comme des sites web • On peut avoir une arborescence de site • Chaque espace documentaire est un site collection Page 46
SharePoint et le réseau socialEspace communautaire Tag Cloud Feed Discussions Adhésion
SharePoint et le réseau socialMy Site Mon calendrier Activités de mes collègues au sein du réseau social Mes communautés
SharePoint et le réseau socialMy Profile Mon profil Mon équipe Présence Mes compétences
Quelques retours terrain… • Démonstration un travail sur la forme
SharePoint et la gestion des documents Parlons métier: Bibliothèque de documents Bibliothèqued’images et de vidéos Language métier (taxonomie) & Tags de document Ensemble de document & Identifiant unique Office Web Apps • 1 Million de documents dans un dossier • Plusieurs millions de documents dans une bibliothèque • Plusieurs To de données dans une ferme Parlons volume: