1 / 0

IBM SPSS Predictive Analytics Datenanalyse und Vorhersagen

IBM SPSS Predictive Analytics Datenanalyse und Vorhersagen. Hochschule Bremerhaven 08./09.03.2012. Dr. Christian Trippner Senior Technical Sales Professional Business Analytics IBM Software Group Hollerithstraße 1 81829 München e-mail: christian.trippner@de.ibm.com

neva
Download Presentation

IBM SPSS Predictive Analytics Datenanalyse und Vorhersagen

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. IBM SPSS Predictive AnalyticsDatenanalyse und Vorhersagen

    Hochschule Bremerhaven 08./09.03.2012
  2. Dr. Christian Trippner Senior Technical Sales Professional Business Analytics IBM Software Group Hollerithstraße 1 81829 München e-mail: christian.trippner@de.ibm.com Tel: 0049-89-4504-5047 Referent
  3. 360° Kundensicht Schaffung echter und nachhaltiger Wettbewerbsvorteile Interaktionsdaten CRM Systeme Click-Streams Kunden-Feedback Psychologische Daten - Werthaltungen Einstellungen Affinitäten 360° Kundensicht schafft einen echten Wettbewerbsvorteil Deskriptive Daten Demographie (Mikro-)geographie Selbstauskünfte Verhaltensdaten - Transaktionen Zahlungsverhalten Nutzungsverhalten Grundlage: historische Basis
  4. Capture Datenzugriff & ETL Befragung verschiedener Zielgruppen Nutzung strukturierter, halbstrukturierter und unstrukturierter Daten PredictiveAnalytics ist ein Prozess Predict Statistische Analytik Data & Text Mining Act Integration von Modellen in operative Systeme für bessere Entscheidungen Direkte Einbettung in zentrale Geschäftsprozesse
  5. Datenzugriff (direkt, ODBC, OLE-DB, Textdaten) Umfangreiches Datenmanagement Umfangreiche Analysemöglichkeiten Visualisierungen in Tabellen und Grafiken Client/Server Architektur +43 Jahre Erfahrung und Kompetenz in Datenanalyse IBM SPSS – der Standard für alle Phasen im analytischen Prozess
  6. IBM SPSS PredictiveAnalytics Produktpalette
  7. Antizipativ Vorhersage von zukünftigen Verhalten auf Basis historischer und aktueller Daten – im Gegensatz zur Ex Post Analyse. Individualisiert Predictive Analytics: Agieren statt Reagieren Erkennen von individuellen Einflussfaktoren für jeden einzelnen Kunden Ziel: Vorhersage zukünftiger Einzelereignisse Handlungsorientiert PredictiveAnalytics zielt direkt auf die Optimierung von Entscheidungen und die Auslösung konkreter Aktionen ab. Predictive Analytics generiert aus Daten operative Entscheidungen, indem verlässliche Schlüsse zur aktuellen Situation und zukünftigen Ereignissen erkannt bzw. prognostiziert werden.
  8. Integrierte Analytics Lösungen In welchen Stadtteilen? Data Mining Wieviele Kundenhaben wirverloren? OLAP Was sollten wirdem Kundenheute anbieten? Query & Reporting WelcheKunden sindwechsel- gefährdet? Mehrwert mit PredictiveAnalytics Bottom-Up Data Mining Text Mining Top-Down Abfragen: OLAP, BI Mehrwert 10
  9. Statistische Methoden und natürliche Spracherkennung erfassen die Bedeutung von Textinformationen Ermöglicht quantitative Auswertungen auf Basis unstrukturierter Textdaten Automatisierte Analyse von Emails, Web Daten, Interviews, Call Center Notizen etc. Mehrwert durch Einbeziehung unstrukturierter Textdaten in den Analyseprozess
  10. 70’s 80’s 90’s Text Mining: Konzept der Linguistischen Extraktion Freitext-ProtokolleinesKundenanrufs “Kd. nichtzufriedenmit Mobil Telefon, Anrufvom18.11.2010 – Kundemöchtezu Yellow inc wechseln” Named Entities Recognition (NER)  Wort Extraktion Begriffs- Extraktion Kd Kunde Yellow inc zufrieden nicht wechseln Mobil Telefon Kunde -> CRM-Begriff Kd? Yellow inc -> Telco Company (nicht die Farbe) Mobil Telefon -> Telco-Begriff nicht zufrieden 18. Nov > Date Kunde Yellow inc Mobil Telefon Nicht zufrieden
  11. Heute Text Mining: Konzept der Linguistischen Extraktion Freitext-Protokoll eines Kundenanrufs “Kd. nichtzufriedenmit Mobil Telefon, Anrufvom18.11.2010 – Kundemöchtezu Yellow inc wechseln” Kombiniert mit strukturierten Daten Sentiment-Analyse Kunde (Kd) Mobil Telefon unzufrieden (negativ); Wechseln zu (negative Vorhersage) yellow inc (Wettbewerber) Entscheidung Wechselwilliger Kunde mit hohem Kundenwert  individuelles Angebot
  12. Verlaufsanzeige Aktuelle Monitoring-Filter Stimmungsbild (positiv/negativ) Text Mining: Internet Dashboard als Früherkennungssystem Filter auf Zeitraum Themen als Tag Cloud Quellen Freitextsuche Einzelbeiträge zur Selektion
  13. Text Mining Data Mining Statistics Predict Act Capture Erfolgreiche Analytic erfordert einen Closed Loop Planung OLAP Reporting Daten integrieren Anreichern Dashboards / Analysen / Scorecards KundenInformationen
  14. Visuelles Programmieren analytische Streams Hohes Maß an Interaktivität und Benutzerfreundlichkeit Skalierbarkeit durch Client-/Server Architektur Nahtlose Zusammenarbeit mit allen gängigen Datenbanksystemen Arbeiten mit dem IBM SPSS Modeler
  15. Datenzugriff ODBC Datenbanken, Flat Files, … Datenmanipulation und –aufbereitung Datenselektion & -transformation Pre-processing, Bereinigung, Abfragen Transformationen für Visualisierung oder Modellierung Bearbeitung von Metadaten 'Outputs' von Modellen können auch als Daten weiterverarbeitet werden Datenzugriff, -aufbereitung
  16. A B C ? MöglicheKampagnen %? $? 42 A A A ? %? $? B B B C C C ? %? $? 87 Kampagnen-ausführung Beste Kampagne pro Kunde Wertbasierte Optimierung operativer Entscheidungen Durchsuchen der Datenbanken nach Events
  17. Enterprise Platform für Predictive Analytics 1 Verstehen Einblick in die aktuelle Unternehmensleistung anbieten  Was ist in der Verghangenheit geschehen?  Was geschieht momentan? Vorhersagen Verhalten in der Vergangeheit analysieren, um zukünftige Events vorherzusagen Was wird passieren? 2 3 Agieren Operative Prozesse überwachen und Maßnahmen vorschlagen Welche Maßnahme bietet das beste Ergebnis? Operative Prozesse Datenquellen des Unternehmens Marketing-daten CRM Enterprise Plattform für Predictive Analytics Kunden-daten Kunden- dienst Web- daten Produkt & Markt Fianzen & Risiko Produkt-daten Transakt-ionsdaten Tätigkeiten
  18. Verstehen “Einblick in die Effektivität von Marketingkampagnen” “Management Cockpit:Indikatoren für die Schlüsselleistung” “Visualisierung von komplexen Beziehungen”
  19. “Automatische Erkennung neuer Zielgruppen und Vorhersage ihres potenziellen Wertes” Vorhersagen “Entdecken neuer Risikoprofile” “Einsatz von ClusterverfahrenzurKundensegmentierung und zurErstellung von speziellenAngebotenfürwenigloyaleKundengruppen” “Modellierung des Kampagnenresponses und Auswahl der affinsten Segemente”
  20. Vertriebs- und Laufzeitangebote über Call Center Cross-sell und Angebote via Website Agieren Optimierung der Entscheidung Bewertung der Risiken zum Zeitpunkt der Dateneingabe Real-time Identifikation von suspektenTransaktionen Optimierung des Direct Marketing, um die Resonanz und den Profit zu maximieren Risk-Scoring ,um Fälle für die Recherche zu bestimmen
  21. UNIVERSITÄTEN Kunden, eine Auswahl
  22. “... der Prozess des Entdeckens bedeutsamer neuer Zusammenhänge, Muster und Trends durch die Analyse großer Datensätze mittels Mustererkennung sowie statistischer und mathematischer Verfahren” - Erick Brethenoux, Gartner Group Data Mining ist ...
  23. Berry / Linoff:„DM ist der halb- oder vollautomatisierte Prozess der Erklärung und Analyse großer Datenmengen, um bedeutsame (= für die eigene Situation nutzbare) Strukturen und Zusammenhänge aufzudecken!“ DM  Menge von Daten in Trichter werfen, um automatisch relevante Zusammenhänge zu bekommen! Definition - Data Mining
  24. Was ist Data Mining? Finding patterns in data which you can use to do your business better. (C. Shearer, VP Data Mining) “Decisions from Data”
  25. Von SQL zum Data Mining.
  26. Die Evolution im Analysebereich 1. SQL: kompliziert + deskriptiv 2. OLAP: einfach + deskriptiv 3. Data Mining: einfach? + prediktiv
  27. Thesen 1Data Mining ist einfacher Data Mining ist automatischer Data Mining findet mehr Muster Statistik vs. Data Mining
  28. 1 Data Mining ist einfacher Bei klassischen Verfahren müssen häufig wesentlich mehr Vorarbeiten zur Datenaufbereitung durchgeführt werden als bei Data Mining Verfahren. Nur wenige Spezialisten beherrschen diese Vorarbeiten. Bei einer einfachen Regression muss z.B. folgendes (mindestens) überprüft werden: Linearer Zusammenhang muss gegeben sein, wenn nicht, müssen entsprechende Transformationen (log, Wurzel...) durchgeführt werden Heteroskedastizität(Zunahme der Streuung bei größer werden der Variablen) Multikollinearität(Suche nach Redundanzen in den Variablen, die die Modellstabilität beeinflussen) Normalverteilung der Residuen(Entdeckung von Ausreißern, die Modell verfälschen) Skalenniveau OK (unterschiedliche Aussagegüte von Variablen) Statistik vs. Data Mining
  29. Statistik vs. Data Mining 2Data Mining ist automatischer explorativ vs. Hypothesenprüfend Anderer Entstehungshintergrund, da DM Verfahren mehr Datenvolumen und mehr Felder verarbeiten können müssen, Verfahren sind „robuster“ In klassischer Statistik finden sich nur wenig nicht manuelle explorative Verfahren Typischer Ansatz: Literaturstudium> Hypothesenentwicklung> Datenerhebung> Hypothesenprüfung
  30. Statistik vs. Data Mining 3 Data Mining findet mehr Muster Spareinlagen in € Einkommen in €
  31. Data Mining verwendet bestehende Daten für: Vorhersage Gruppenzugehörigkeit Numerische Werte Gruppenbildung Gruppenbildung-/-findung anhand bestimmter Merkmale und Eigenschaften Assoziation Ereignisse die zusammen oder nacheinander auftreten Analyse von „Sonderfällen“ Entdecken von Fällen mit besonderen Eigenschaften Vorgehensweise
  32. CRISP-DM: Die Data Mining Methodologie Cross-Industry Standard Process for Data Mining
  33. Gemeinsame Anstrengung von führenden Köpfen im Data Mining Ermöglicht geübten und ungeübten Anwendern, auf das Spezialwissen von Branchenexperten zuzugreifen Garantiert eine verbesserte Effizienz von Data Mining-Projekten CRISP-DM der Weg zum Erfolg
  34. Wurzeln von CRISP-DM Entstehung: Anfang 1999 aus einem Industriekonsortium
  35. Zuverlässiger und wiederholbarer Prozess („Kochanleitung“ zu Data Mining) Flexibel genug, um individuellen Unterschieden Rechnung zu tragen herstellerneutral / industrieübergreifend Fokus auf geschäftliche Fragestellungen Warum CRISP-DM?
  36. Geschäfts- verständnis Daten- verständnis CRISP-DM Phasen Daten Daten- aufbereitung Verteilung der Ergebnisse 80-90% Projektzeit Modell- bildung Modell- bewertung
  37. CRISP-DM User Guide CRISP-DM Ressourcen Anleitungen, Tips und Tricks, „Fallen“
  38. Praxisdemo Data Mining Analyse - Kündiger (Churn) im Bereich TELCO
  39. Mining Stream Training Analysedesign Test
  40. Umfassendes Analysespektrum zahlreiche Data Mining Algorithmen (Neuronale Netze, C&RT(i), C5.0, CHAID (i), QUEST(i), lineare u. logistische Regression, Kohonen, K-Means, TwoStep-Cluster) Zusammenhangsanalyse (Apriori, GRI, Sequence) Dimensionsreduktion (Faktorenanalyse) Direkte Schnittstelle zu speziellen Statistiken mit IBM SPSS Base + Modulen Visuelle Programmierung (Visual Workflow) Business-User und Experten-Modus Interaktive Grafiken Prozessunterstützung: CRISP-DM Vorlagen (CATs) CRM, Telco, Web Mining Fraud, Biotechnologie (Microarray) Modeler ist offen (Schnittstelle CEMI) Text Mining for Modeler, Capri eigene Programmierung (ETL, Modellierung, Output) Automatisierung, Export und leichtes Einbinden in externe Lösungen Modeler - die Vorteile im Überblick
  41. Vielen Dank für Ihre Aufmerksamkeit FRAGEN?
  42. Literaturliste Berry/Linnof: Mastering Data Mining Berry/Linnof: Data Mining Techniques Clay Helberg: Data MinigwithConfidence Wilde/Hippner: Grundlagen des CRM Han/Kamber: Data Mining – ConceptsandTechniques Berson/Smith/Thearling: Building Data Mining Applications für CRM Tsiptsis/Chorianopoulos: Data Mining Techniques in CRM. Inside Customer Segmentation http://www.researchmethodsarena.com/ Internet
More Related