1 / 30

Business Intelligence (BI)

Business Intelligence (BI). FHTW Berlin Datenbanken Prof. Dr. Zschockelt.

osmond
Download Presentation

Business Intelligence (BI)

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Business Intelligence (BI) FHTW Berlin Datenbanken Prof. Dr. Zschockelt Business Intelligence (BI) gilt heute als generalisierender Begriff für Methoden des intelligenten Sammelns und Auswerten von Daten mit dem Ziel einen Mehrwert für die Unternehmenssteuerung zu erzielen. Das Messen der wich-tigsten Ist-Zustände (Key Performance Indicator) im Verbund mit analytischen Verfahren (OLAP, Data Mining) und daraus abgeleiteten Vorher-sagen (Forecasting) sollen den Produk-tivitätsfaktor "Informa-tion" maximal verwer-ten.

  2. Die Business-Intelligence-Pyramide FHTW Berlin Datenbanken Prof. Dr. Zschockelt Hervor-ragende Kapitalrendite Zusammensetzung und Umsetzung Wissen(Fähigkeit zum Beantworten aller geschäftsrelevanten Fragen) Erkenntnisse(gezielt, zeitnahe, vollständige, aber auch einfache Analyse) Informationen(relevant, vollständig, kontextbezogen, zuverlässig, aktuell) Daten(Integration, Bereinigung, Unternehmensmodellierung, Konsolidierung;Transformation und Aggregation) Quelle: frei nach IT-FOKUS 6/2003

  3. Data Warehouse FHTW Berlin Datenbanken Prof. Dr. Zschockelt Ein Data Warehouse ist eine sachverhaltsbezogene, integrierte, unveränderliche und zeitraumbezogene Datensammlung zur Unterstützung von Managementent­scheidungen. W. H. Inmon (USA 1996) Ein Data Warehouse ist eine Sammlung von integrierten Informationen, welche von den betrieblichen operativen Systemen und anderen externen Datenquellen gewonnen werden. Der spezielle Zweck ist die Unterstützung von betrieblichen Entscheidungen, nicht betrieblichen Tätigkeiten. M. J. Corey, M. Abbey (USA 1997) Mit dem Begriff Data Warehouse i.e.S. wird generell eine von den opera-tionalen DV-Systemen isolierte Datenbank umschrieben, die als unter-nehmensweite Datenbasis für alle Ausprägungen managementunter-stützender Systeme dient und durch eine strikte Trennung von operatio-nalen und entscheidungsunterstützenden Daten und Systemen gekenn-zeichnet ist. Mucksch, Behme (BRD 1997) Es gibt sehr gute Portale, z. B.: http://www.datawarehousingonline.com/

  4. Grundlegende Architektur eines Data Warehouse( frei nach Quelle: Anahory/Murray: Datawarehouse, S. 59 ) Meta-Daten ArchivierteausführlicheInformationen FHTW Berlin Datenbanken Prof. Dr. Zschockelt Einfügemanager Abfragemanager OperationaleDaten Zusammen-fassungsin-formationen AusführlicheInformationen ExterneDaten Warehouse-Manager OLAP-Werkzeuge

  5. Speicherung im Data Warehouse FHTW Berlin Datenbanken Prof. Dr. Zschockelt relational multidimensional (denormalisiert Star- bzw. Snowflake-Schema) (Cube) Auswertung mittels OLAP(Online Analytical Processing) ROLAPMOLAP(relationales OLAP)(multidimensionales OLAP) HOLAP(hybrides OLAP)

  6. Spezielle Data-Warehouse-Datenmodelle strukturieren das Data Warehouse (DWH) Dimension 1 Dimension 2 Fakt Dimension n Dimension 3 Dimension 5 Dimension 4 FHTW Berlin Datenbanken Prof. Dr. Zschockelt Kernpunkt der Speicherung ausführlicher Data-Warehouse Informationen zu einem ausgewählten Thema ist immer eine Faktentabelle mit zu analysierenden Messwerten. Diese wird mit Dimensionswerten (vermutete Einflussgrößen auf die Entwicklung der Fakten) indiziert, um die Fakten aus unterschiedlichen Sichten analysieren zu können. Das daraus entstehende typische Schema des Modells wird Star-Schema (bzw. in erweiterter Form auch Star- oder Snowflake-Schema) genannt).

  7. Starflake-Schema einer Datenbank Beispiel FHTW Berlin Datenbanken Prof. Dr. Zschockelt Quartal Monat Produkt Periode Versand(Fakten) Sommer-Saison Vertrieb Markt Legende: Faktentabelle Star-Dimensionsdaten Snowflake-Dimensionsdaten

  8. Beispiel einer Dimensionstabelle "Periode" FHTW Berlin Datenbanken Prof. Dr. Zschockelt Spalten in Dimensionstabellen spiegeln Hierarchien wieder, z. B. Jahr  Quartal  Monat  Bezeichnung aber auch Saison  Jahr u.a.

  9. Hierarchien in Dimensionen 2002 FHTW Berlin Datenbanken Prof. Dr. Zschockelt 1. Ausgeglichene HierachienBeispiel Periode 1. Quartal  Januar Februar März 2. Quartal  April Mai Juni 3. Quartal  Juli August September 4. Quartal  Oktober November DezemberJahr Quartal MonatAnmerkung: Benennung der Hierarchien einfach. 2. Unausgeglichene HierachienBeispiel Abteilungsstruktur Firmenkunden  Großkunden Kleinkunden Privatkunden  Region Süd Region Nord Öffentlicher Dienst Anmerkung: Benennung der Hierarchien schwierig. 3. Unregelmäßige HierachienBeispiel Regionen Land  Region  StaatAnmerkung: Benennung der Hierarchien einfach, aber bestimmte Hierarchie-stufen ggf. bedeutungslos für bestimmte Werte. Z. B. keine Region und kein Staat für Lichtenstein.

  10. Fragestellungen - Datenräume - Methoden FHTW Berlin Datenbanken Prof. Dr. Zschockelt

  11. Typisierung von OLAP-Abfragen FHTW Berlin Datenbanken Prof. Dr. Zschockelt rotate ("Drehen" des OLAP-Würfels) Es interessiert der Zusammenhang einiger ausgewählter Dimensionen . slice ("Ausschneiden" von Ebenen aus dem OLAP-Würfel) Eine Dimension wird auf einen interessierenden Wert eingeschränkt. dice ("Abteilen" von Teilwürfeln aus dem OLAP-Würfel)Einschränkung der Dimensionen auf einen ausgewählten Wertebereich.

  12. Zur Methodik der Pivot-Tabelle(am Beispiel MS-Excel) FHTW Berlin Datenbanken Prof. Dr. Zschockelt Fakten Dimension 1 (vertikal) Quelldaten Dimension 3 (Blatt) Dimension 2 (horizontal)

  13. Navigieren in multidimensionalen Speichern FHTW Berlin Datenbanken Prof. Dr. Zschockelt Roll-up vom Detail zur AggregationDrill-down vom Aggregat zum Detail

  14. Gegenüberstellung OLAP/RDBMS FHTW Berlin Datenbanken Prof. Dr. Zschockelt

  15. Datentransformation mit ETL-Tools ETL Extract Transform Load Data WarehouseData MartOLTP-Datenbank FHTW Berlin Datenbanken Prof. Dr. Zschockelt Datenquellen Ziel-Datenbank ETL-Tools dienen zur Migration von Quelldaten in eine andere Datenressource in der Regel innerhalb einer analytischen Umgebung.

  16. Merkmale des ETL-Prozesses FHTW Berlin Datenbanken Prof. Dr. Zschockelt

  17. Ausgewählte Analysewerkzeuge für BI FHTW Berlin Datenbanken Prof. Dr. Zschockelt

  18. Business Objekts Enterprise Beispiel eines BI-Tools FHTW Berlin Datenbanken Prof. Dr. Zschockelt Quelle: IT-FOKUS 6/2003

  19. Portale als Data Warehouse Client FHTW Berlin Datenbanken Prof. Dr. Zschockelt Ziel: Kombination von Data Warehouse-, Analyse- und Reporting-Lösungen auf Basis einer integrierten Portalstruktur. Anforderungen • Technologische Integration von OLTP- und Data Warehouse-Systemen. • Online-Verfügbarkeit des Data Warehouse. • Abrufbarkeit von unterschiedlichen Endgeräten; Wiedererkennungseffekte. • Angemessene Sicherheit bei parallelen Zugriffsmöglichkeiten. • Portal-Framework (z. B. zur Personalisierung ). • Einbindung heterogener Datenquellen durch Portlets. • Endnutzergerechte BI-Tools. • Data-Warehouse-Basisstruktur. IT-Infrastruktur Beispiel BA: http://www.hyperwave.com/d/references/ba.html

  20. Beispiel InSight Marktführer der BI-Tools FHTW Berlin Datenbanken Prof. Dr. Zschockelt Aus der MS-OLAP-Server-DEMO footmart werden ausgewählte Sichten (rechte Seite) als Grafik angezeigt. Quelle: http://www.dynasight.com/von Arcplan.

  21. Übersicht über relevante Data Warehouse Anbieter FHTW Berlin Datenbanken Prof. Dr. Zschockelt

  22. FHTW Berlin Datenbanken Prof. Dr. Zschockelt  Marktübersicht Data Warehouses  (Computer Zeitung Ausgabe 09/2004)

  23. Typische betriebliche Data-Warehouse-Umgebung FHTW Berlin Datenbanken Prof. Dr. Zschockelt Data Marts für Abteilungen

  24. Anwendungsszenarien für Data Mining FHTW Berlin Datenbanken Prof. Dr. Zschockelt Aufgaben desData Mining Methoden desData Mining BeispielhafteFragestellungen Prognose Neuronale Netze Prognosemodell Response-Wahr-scheinlichkeit Segmentierung und Kategorisierung Identifikation ertragreicher Segmente Entscheidungs-bäume Analyse von Kaufmustern Assoziations-analyse Cluster-verfahren Customer Profiling Assoziations-verfahren Klassifikation Beispielhafte Fragestellungen Methoden des Data Mining Aufgaben des Data Mining in MS-SQL-Server 2000 Analysis Services implementiert. Data Mining bietet eine Reihe von Methoden, die je nach Aufgabe und Fragestellung zum Einsatz kommen, um bisher verborgene Zusammenhänge in der Datenbasis aufzudecken.

  25. Prinzip des Training und der Vorhersage FHTW Berlin Datenbanken Prof. Dr. Zschockelt Vorhersagedaten Einflussdaten Vorhersage (apply) Klassenbildung (build) "Training des Modells" Häufigkeiten Ein Modell wird trainiert, auf Basis der ermittelten Wahrscheinlichkeiten werden Vorhersagedaten berechnet. Falldaten

  26. MS-Analysis-Services Begriffswelt FHTW Berlin Datenbanken Prof. Dr. Zschockelt • Ziel eines Dataminingmodells ist das Erkennen von Mustern in einer datenbank-gespeicherten Datenmenge (= trainieren); zum Beispiel das Erkennen des Musters, nach dem Kunden ihre Kundenkarten auswählen. • Um die für die Mustererkennung erforderlichen Daten auswerten zu können, muss eine Tabelle (Dimension) ausgewählt werden, welche die zu untersuchenden Fälle enthält (Fallschlüsseltabelle). Nach der Data Warehouse Begriffswelt sind die zu untersuchen-den Fälle immer Bestandteil einer Dimension (nicht der Fakten). • Ein Fall bezeichnet die Datensammlung, aus der eine zu analysierende Einheit besteht (z. B. die Daten eines Kunden).Er wird durch die Fallschlüsselspalte(z. B. Kunden-ID) identifiziert. • Eine Eigenschaft des Falls (Vorhersagbare Spalte(n)) ist auszuwählen. Für diese sollen verursachende Eingabewerte ermittelt werden. • Dafür stehen unterschiedliche Methoden zur Verfügung: "Microsoft Decision Trees" für die Berechnung von Entscheidungsbäumen. "Microsoft Clustering" ("Nearest Neighbor-Verfahren") für die Clusteranalyse (hierbei entfallen vorhersagbare Spalten).

  27. MS-Analysis-ServicePlus und Minus FHTW Berlin Datenbanken Prof. Dr. Zschockelt - + • Geringer Methodenvorrat • Schlichte Ergebnisprä-sentation • MS OLE DB Provider for Data Mining Services un-ausgereift. • Erweiterung der DB-Funktionalität • Transfermöglichkeit des Mo-dells auf andere Datenquellen • Gemeinsame Bedienoberfläche mit OLAP-Tools • Enge Integration mit OLAP-Speicher und RDBMS MS-SQL-Server 2000 • Gute Dokumentation, inklusiveAnwendungsbeispiel

  28. Bewertung von Data Mining Plattformen durch Gartner Group Microsoft Hyperion Oracle  SAP SAS Information Builders    • Seagate  • Comshare • Pilot Software • CA/Platinum • Gentia  • Sagent  • AlphaBlox •  Panorama •  Arcplan AbilitytoExecute Niche Player Visionaries Completeness of Vision FHTW Berlin Datenbanken Prof. Dr. Zschockelt Challengers Leaders

  29. Spezialisten machen Data Mining wahrnehmbar FHTW Berlin Datenbanken Prof. Dr. Zschockelt Beispiel SPSS( http://www.spss.de ) Das Konzept des Predictive Analytics soll aus der Analyse des Vergangenen Modelle für die Zukunft generieren. "Predictive analytics connects data to effective action by drawing reliable conclusions about current conditions and future events. "

  30. Produktübersicht SPSS FHTW Berlin Datenbanken Prof. Dr. Zschockelt

More Related