1 / 87

Die Linusbank Allgemeine Marktübersicht Unternehmenssicht Problembeschreibung Projektplan

Die Linusbank Allgemeine Marktübersicht Unternehmenssicht Problembeschreibung Projektplan Data Understanding Data Preparation Modeling Kampagnen-Management Fazit. Die Linusbank Allgemeine Marktübersicht. Höhere Preissensitivität Häufig 2 bis 4 Bankverbindungen

lars-rush
Download Presentation

Die Linusbank Allgemeine Marktübersicht Unternehmenssicht Problembeschreibung Projektplan

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Die Linusbank Allgemeine Marktübersicht Unternehmenssicht Problembeschreibung Projektplan Data Understanding Data Preparation Modeling Kampagnen-Management Fazit

  2. Die LinusbankAllgemeine Marktübersicht • Höhere Preissensitivität • Häufig 2 bis 4 Bankverbindungen • Entwicklung kostenloser Girokonten: • 2000: gesamt: 6 % • 2005: gesamt: 10 % - 2 % Onlinekonten • 2010: gesamt: 20 % - 19 % Onlinekonten • Allgemeine Demografie am Markt: • 21 % jünger als 30 • 15 % älter als 70 Jahre • 19 % zwischen 40 und 49 • Andere Altersgruppen jeweils ca. 15 %

  3. Die LinusbankUnternehmenssicht • Mittelgroße Filialbank mit 500.000Kunden • 5 Produkte: • Umfangreiches Data Warehouse mit historisierter Datenbasis • Sowohl Online- als auch Filialgeschäft Abbildung 1.1: Produktübersicht

  4. Die Linusbank Problembeschreibung Was der Kunde sagt Was der Kunde will Projektplan Data Understanding Data Preparation Modeling …

  5. ProblembeschreibungWas der Kunde sagt „Wir wollen den Produktbesitz und die Produktnutzung unserer Bestandskunden intensivieren, um dem Wettbewerbsdruck zu begegnen. Allerdings sind die Kosten unserer jeweils produktbezogenen Cross- und Up-Selling-Kampangenhoch, und zu häufig sollten die Kunden auch nicht angesprochen werden. Deshalb wollen wir mit unseren Kampagnen vorranging die wertvollsten Kundenadressieren. Leider können wir den Erfolg von Kampagnennur schwer beurteilen. Anhand von Vergangenheitsdaten wissen wir, dass sich unsere Kunden hinsichtlich ihres Produktbesitzes, ihrer Produktnutzung sowie ihrer Reaktion auf Kampagnen zum Teil deutlich unterscheiden.“

  6. ProblembeschreibungWas der Kunde will • Kosten für Kampagnen sehr hoch • Kunden nutzen wenige Produkte • Keine Erfolgsmessung der Kampagnen • Wertvolle Kunden unbekannt • Ziele: • Kundenzufriedenheit und Bindungerhöhen • Wertvolle Kundenidentifizieren • Kosten reduzieren • Erfolgsmessung für Marketingkampagnen einführen

  7. Die Linusbank Problembeschreibung Projektplan Projektablauf Koordination der Projektarbeit Data Understanding Data Preparation Modeling Kampagnenauswertung …

  8. ProjektplanProjektablauf • Orientierung des Projektablaufes an den Phasen des CRISP-DM • Einarbeitung in Bankgeschäft und Daten der Linusbank • Festlegen der Teilziele für Projektablauf • Erarbeiten von Kennzahlen auf Basis der vorhandenen Daten • Evaluation der erstellten Modelle und ableiten von Handlungsempfehlungen Abbildung 3.1: Projektplan

  9. ProjektplanKooperation der Projektarbeit Abbildung 3.2: http://altranprojektseminar.wikispaces.com

  10. Projektplan Data Understanding Übersicht über vorhandene Daten Produktverteilung Produkterträge Kundenanalyse Kundenwertkonzept Data Preparation …

  11. Deskriptive AnalyseÜbersicht über vorhandene Daten Abbildung 4.1: Datenübersicht

  12. Deskriptive AnalyseProduktverteilung (Gesamt) • Girokonto hat größten Produktanteil • Kredit nur vergleichsweise geringer Anteil • Anteil für Riester und Sparenminimal Abbildung 4.2: Produktverteilung gesamt

  13. Deskriptive AnalyseProduktverteilung (im Monat Juni) Abbildung 4.3: Anzhal Produktverteilung Juni

  14. Deskriptive AnalyseProduktverteilung (im Monat Dezember) Abbildung 4.4: Anzahl Produktverteilung Dezember

  15. Deskriptive AnalyseProduktverteilung • Deutliche Unterschiede in der Produktverteilung zwischen den Monaten Juni und Dezember erkennbar • Zurückzuführen auf wirksame Marketingkampagnen • Alle Informationen über erstes Halbjahr im Datensatz für Juni enthalten • Juni-Datensatz stellt Basis unserer Annahmen und Berechnungen dar • Später: Vergleich und Güteanalyse mit Daten des Dezembers

  16. Deskriptive AnalyseProdukterträge • Riester und Kredit haben die höchsten Anteile an den Erträgen • Zins, Giro und Depot vergleichsweise niedriger Ertragsanteil Abbildung 4.5: Produkterträge

  17. Deskriptive AnalyseKundenanalyse 1/4 Die absolute Zahl der Kunden, die 1, 2, 3, 4 oder 5 und mehr Produkte besitzen Die relativen Änderungen der Kunden mit einer bestimmten Anzahl an Produkten

  18. Deskriptive AnalyseKundenanalyse 2/4 Umsatzanalyse nach Monaten sowie Zahl der Kunden, die einen Vertrag abgeschlossen haben und Zahl der abgeschlossenen Verträge.

  19. Deskriptive AnalyseKundenanalyse 3/4 Abbildung 4.6: Kreditvolumen • Übersicht über das Volumen von Kreditkunden abhängig von der Kreditwürdigkeit

  20. Deskriptive AnalyseKundenanalyse 4/4 • Mehr Filial- als Onlinekunden • KaumUnterschiede in der Altersstruktur im Vergleich Online/ Offline Abbildung 4.7: Vertriebskanal Abbildung 4.8: Demographie

  21. Deskriptive AnalyseKundenwertkonzept 1/3 Motivation: • Banken besitzen nur beschränkte Ressourcen für Aktivitäten der Kundenbindung • Ziel ist es Kundensegmente zu identifizieren, die den Einsatz dieser Ressourcen rechtfertigen • Ermöglichung einer spezifischen Art der Betreuung von Bestandkunden und potenziellen Neukunden • Ausschöpfung von Cross- & Up-Selling-Potenzialen Mögliche Verfahren • Qualitative Segmentierung • ABC-Analysen • Kundendeckungsbeitragsrechnung • Kunden-Scoring-Modelle • Kunden-Portfolio-Analyse • Customer-Lifetime-Value Abbildung 4.9: ABC Analyse Quelle: http://www.mapone.de/images/abcanalyse.jpg

  22. Deskriptive AnalyseKundenwertkonzept 2/3 Kundenwert lässt sich über viele Faktoren bestimmen: • Beziehungsdauer • Kreditwürdigkeit • Transaktionsvolumen • Erwartete Kaufwahrscheinlichkeit für die Zukunft • Generierter Umsatz • Hohes Einkommen Durch welche Daten lassen sich solche Kunden erkennen? • Kreditvolumen • Kreditwürdigkeit • Einlagen-Netto-Volumen • Einlagenvolumen • Saldo Girokonto • Beziehungsdauer

  23. Deskriptive AnalyseKundenwertkonzept 3/3 Versuchsansatz: Kunden unterteilen in A, B und C Kunden • A Kunden sind wertvoll • B Kunden haben keinen besonderen Wert, schädigen die Linusbank aber nicht • C Kunden schädigen die Linusbank Mögliche einflussreiche Größen für Kundenwertbestimmung: • Produktnutzung X ist die Menge an Produkten, welche einen besonders hohen Anteil am Umsatz/Gewinn der Linusbank haben • Dauer Gewichtungsfaktor für die wichtigsten Produkte der Linusbank • Anzahl Gewichtungsfaktor für die wichtigsten Produkte der Linusbank • Volumen Gewichtungsfaktor für die wichtigsten Produkte der Linusbank • Kreditwürdigkeit Risikominimierung • Vermögensausprägung viel Vermögen bedeutet viel Kapital für die Linusbank • Beziehungsdauer Zeichen für Loyalität • Cross-Selling_Potenzial Möglichkeit der Aufwertung des Kunden durch Kampagnen

  24. Data Understanding Data Preparation Datenbereinigung Ausschluss von Datenmaterial Transformierung von Datensätzen Kundenwert Vorgehen zur Kundenwertbestimmung Hilfsmittel: ABC-Analyse Modeling …

  25. Data PreparationDatenbereinigung Ausschluss von „toten“ Kunden, um eine saubere Datenbasis für die Folgemodelle zu erzeugen? Nur bedingt sinnvoll, da diese Kunden durch die Kampagnen reaktiviert werden können Denkbarer Nutzen etwa bei Assoziationsanalyse für den Warenkorb, wobei Konten-Tabelle nur Kunden enthält, die mindestens ein Produkt besitzen Modelle arbeiten fehlerhaft, aber der gezielte Ausschluss (klar definierter) wertloser Kunden ist fehlerfrei, sodass das Endmodell eine höhere Güte aufweisen müsste Normierung der Datensätze erforderlich, da Daten sowohl metrisch skaliert vorliegen (z. B. Kredithöhe oder Beziehungsdauer) oder nominal bzw. ordinal (z. B. Geschlecht, Familienstand, Kreditwürdigkeit) Verbindung der Datensätze über die Kundennummer möglich (jeder Kunde hat eine eindeutige Kundennummer)

  26. Data PreparationAusschluss von Datenmaterial • Produktnutzung_Giro und Dauer_Giro beinhalten die gleichen Fakten • Wenn die Produktnutzung = 0 ist auch die Dauer_Giro = 0 • Daraus folgt, dass Dauer_Giro überflüssig ist • Ebenso bei Zins, Kredit, Riester, Depot • Ausschluss von Kreditkarte, Baufinanzierung undTermingeld, Sparkarte laut Aufgabenstellung (keine adäquaten Daten)

  27. Tabelle Konten und Kunden Verknüpfung der beiden Tabellen für jeden Monat mit den Informationen: Beziehungsdauer Alter Vertriebskanal Produktnutzungsdauer (Giro, Zins, Kredit, Riester, Depot) Nutzen der Produkte wurde binär kodiert Kunde nutzt Produkt  1 Kunde nutzt Produkt nicht  0 Alter: bis 17: Minderjährig  wird ausgeschlossen 18-2930-3940-4950-59ab 60 Beziehungsdauer: 0-3: Neukunde3-12: 1 Jahr13-24: 2 Jahre25-60: 3-5 Jahre51-120: 6-10 Jahreab 121: mehr als 10 Jahre Data PreparationTransformierung von Datensätzen

  28. Data PreparationKundenwert 1/3 • Für eine erste Analyse genügt ein relativ einfacher Initialkundenwert, der auf Basis des Laufzeitertrags ermittelt wird. In weiteren Schritt kann anhand von den verschiedenen Prognosemodellen einScore für jeden Kunden erzeugt werden, der in einen präziseren und feiner abgestimmten Kundenwert einfließt • Für die aktuelle Aufgabe genügt der Initialkundenwert • Kunden haben zu einem bestimmten Zeitpunkt ein eine Menge an Produkten mit unterschiedlichemErtrag erworben • Je nach Ertrag erzeugen diese Kunden einen höheren oder niedrigeren Umsatz • Kunden werden anhand dieses Umsatzes in verschiedene Werte-Klassen eingeteilt

  29. Data PreparationKundenwert 2/3 • Ermittlung des Kundenwertes abhängig von der Zielstellung, wobei Ziele nicht klar voneinander trennbar sind: • Erhöhung der Kundenbindung? • Steigerung der Produktdurchdringung je Kunde? • Steigerung des durchschnittlichen Umsatzes? • Verbesserung der Kundenzufriedenheit? • In diesem Fall: • Steigerung der Produktdurchdringung • Erhöhen des Umsatzes z. B. durch Cross Selling

  30. Data PreparationKundenwert 3/3 • Dazu: • Ermittlung passender Kennzahlen notwendig • Möglich sind: • Einlagenvolumen • Kreditwürdigkeit • Produktumsatz • Beziehungsdauer • ABER: • Modell soll möglichst einfach gestaltet werden, dass so vieleEigenschaftenwie • notwendig und so wenige wie möglich verwendet werden. • Dafür bieten sich der Produktumsatz (Laufzeiterträge) und das erwartete Cross-Selling-Potential an (ermittelt anhand der Prognosemodelle)

  31. Data PreparationVorgehen zur Kundenwertbestimmung 1/2 Zweistufiges Vorgehen: • Schritt 1: • Initialkundenwert besteht lediglich aus Produktumsatz, da Potential noch nicht bekannt ist • Dieser Kundenwert fließt in Prognose-Modell ein • Schritt 2: • tatsächlicher Kundenwert erzeugt durch neuen Kundenwert aus Ergebnis des Prognose-Modells von Schritt 1 • Berechnung anhand der Scores für die einzelnen Kaufwahrscheinlichkeiten der Produkte

  32. Data PreparationVorgehen zur Kundenwertbestimmung 2/2 • Berechnung Initialkundenwert: • Summe der Laufzeiterträge der Kunden und Einteilung in Klassen A bis E • Berechnung des tatsächlichen Kundenwertes: • Summe der Einzelscores für die Kaufwahrscheinlichkeiten für die 5 Produkte • (maximal erreichbarer Wert: 5 Punkte) • Beinhaltet durch Berücksichtigung des Initialkundenwertes bereits die jeweiligen Umsätze • erneute Einteilung der Kunden in Klassen A bis E anhand der Höhe des • Gesamtscores.

  33. Data PreparationHilfsmittel: ABC-Analyse • Klassische ABC-Analyse gruppiert Kunden prozentual in Klassen ein, die einen bestimmten Umsatzanteil ausmachen • Jedoch in SQL extrem komplex zu implementieren • Abgewandelter Algorithmus sortiert Kunden absteigend nach Umsatz und ordnet absolute Mengen in die Klassen ein, sodass die ersten 50.000 Kunden mit dem höchsten Umsatz Klasse A darstellen, die nächsten Kunden Klasse B usw. • Die Mengen wurden so definiert, dass ca. 20 % der Kunden (A und B) 80 % des Umsatzes generieren A: 0 - 50.000 B: 50.000 – 100.000 C: 100.000 – 150.000 D: 150.000 – 200.000 E Über 200.000

  34. Data Understanding Data Preperation Modeling Assoziationsanalyse Clusteranalyse Prognosemodelle Kampagnen-Management Fazit

  35. ModelingAssoziationsanalyse Teil der Aufgabenstellung: Entwickeln Sie jeweils ein Produktbezogenes Data-Mining-Modell zur Prognose von Cross-Selling-Abschlüssen auf die Produkte Linuskredit, Linusdepot, Linusgiro, Linuszins und Linusriester. Ziel der AnalyseEindruck darüber gewinnen, welche Produkte häufig gemeinsam genutzt werden.

  36. AssoziationsanalyseVorbereitung der Daten für Assoziationsanalyse • Benötigter Datensatz: • Konten • Enthaltene Daten: • Kundennummer als ID • Produktnutzung (Kredit, Depot, Giro, Zins, Riester) binär 0 oder 1 • Vermögensausprägung (negativ, ausgeglichen, positiv) nominal -1, 0 oder 1 • Alter (in 5 Stufen) nominal • Kreditwürdigkeit (gut, schlecht, unbekannt) nominal • Beziehungsdauer (5 Stufen) nominal • Kanal (Online, Filiale) binär

  37. AssoziationsanalyseEinstellungen • Der Datenfluss im Diagramm: Abbildung 6.1: Datenfluss • Reduzieren der Werte, da Transaktionen wie Kredit oder Riester im verhältnis zur Gesamtzahl der Transaktionen relativ selten auftreten. Sie sollen aber trotzdem in der Analyse erscheinen Abbildung 6.2: Einstellung General • Die Filtereinstellungen, um nicht zu berücksichtigende Produkte auszuschließen: Abbildung 6.3: Einstellung Class Variable

  38. AssoziationsanalyseErgebnis 1/2 • Das Ergebnis der Analyse mit dem ermittelten Warenkorb. • Hier zu sehen sind nur die Regeln, die auf der rechten Seite genau ein Ergebnis erzeugen Abbildung 6.4: Regel-Table

  39. AssoziationsanalyseErgebnis 2/2 • Überblick über alle erzeugten Regeln: Abbildung 6.5: Regel-Table 2

  40. AssoziationsanalyseFazit • Häufig zusammen gekauft werden Zins, Depot und Riester in allen möglichen Kombinationen • Macht Sinn, da alle drei Produkte im Kern Sparprodukte darstellen • StarkenLift erzeugen Riester-Produkte, die sowohl für Zins, als auch Zins Kombination mit Giro oder Depot häufig nachgefragt werden • Diese Produkte werden jedoch vergleichsweise selten verkauftHandlungsmöglichkeiten: Kunden, die bereits ein oder mehrere Produkte besitzen, könnten entsprechend interessiert sein an den ermittelten Kombinationen. So bietet es sich an, Besitzer von Zins, die noch über kein Depot verfügen, ein Produktangebot vorzubereiten bzw. Depot-Besitzern auch Linuszins anzubieten.

  41. ModelingClusteranalyse Teil der Aufgabenstellung:Entwickeln Sie jeweils ein Produktbezogenes Data-Mining-Modell zur Prognose von Cross-Selling-Abschlüssen auf die Produkte Linuskredit, Linusdepot, Linusgiro, Linuszins und Linusriester. Ziel der Analyse Eindruck über die Kundenstruktur gewinnen. Gibt es typische Nutzergruppen, die ähnliche Eigenschaften aufweisen?

  42. ClusteranalyseVorbereitung der Daten für Clusteranalyse • Benötigter Datensatz:Kunden_binary200812 • Enthaltene Daten: • Kundennummer als ID • Produktnutzung (Kredit, Depot, Giro, Zins, Riester) binär 0 oder 1 • Vermögensausprägung (negativ, ausgeglichen, positiv) nominal -1, 0 oder 1 • Alter (in 5 Stufen) nominal • Kreditwürdigkeit (gut, schlecht, unbekannt) nominal • Beziehungsdauer (5 Stufen) nominal • Kanal (Online, Filiale) binär

  43. ClusteranalyseVorgehen • Nachdem der Clusternode keine zufriedenstellenden Ergebnisse hervorbrachte, kam der SOM/Kohonen-Node zum Einsatz • Vorgehen: • Sampling-Node mit Simple-Random (12345) als Starteinstellung und 4x6 Clustern • Anschließend Beobachtung des Distance-Plots auf eine gleichmäßige Verteilung der Cluster und Prüfung der Clusterhäufigkeit in den Statistics • Schrittweise Reduzierung der Clusterzahl brachte bei 2x3 Clustern das erste gute Ergebnis, bei dem die Cluster gut verteilt waren und keine Häufung mehr auftrat. • Als wichtigeVariablen zeigt sich stets die Beziehungsdauer, die Vermögensausprägung, Giro, Depot, Zins, Kredit. Abbildung 6.6: Datenfluss

  44. ClusteranalyseErgebnis 1/5 Abbildung 6.7: Übersicht Cluster

  45. ClusteranalyseErgebnis 2/5 Abbildung 6.8: Distanzgraph • ermittelten Distanzgraphen deutlich getrennt

  46. ClusteranalyseErgebnis 3/5 Abbildung 6.9: Altersverteilung • Das Alter wurde nicht in die Cluster-Unterscheidung einbezogen

  47. ClusteranalyseErgebnis 4/5 Abbildung 6.10: Produktverteilung • Schwerpunkt der Produkte auf verschiedene Klassen

  48. ClusteranalyseErgebnis 5/5 Abbildung 6.11: Verteilung von Kreditwürdigkeit und Vermögensausprägung • Während Vermögensausprägung durchaus einen Einfluss hat, ist die Kreditwürdigkeit in allen Clustern gleich verteilt

  49. ClusteranalyseFazit • Es zeigen sich zwei auffällige Cluster-Gruppierungen: • So gibt es stets ein ClusterKreditkunden, das einen erheblichen Anteil an Kreditkunden beinhaltet, die eine stark negativeVermögensausprägungaufweisen und eine mittlere Beziehungsdauer ab 3 Jahren erreichen • Die zweite Gruppe sind die Sparkunden mit positiverVermögensausprägung, langerBindungsdauer teils über 10 Jahre und allen drei Spar-Produkten Zins, Depot und Giro • Die dritte Gruppe umfasst die verbleibenden Cluster mit vorrangig ausgeglichenem Vermögen und häufig einem Girokonto oder Depot • Handlungsmöglichkeiten:Es lässt sich erkennen, dass im Cluster der Sparkunden die klassischenSparprodukte häufig nachgefragt werden. Ein Ansatz wäre, Kunden zu finden, die ebenfalls vermögend sind, aber noch nicht alle Produkte besitzen. Zusätzlich ist eine Aktion denkbar, bei der Kunden, die alle Produkte besitzen, aber nur geringeEinlagen aufweisen, zusätzliches Geld überweisen, weil sie mit hoher Wahrscheinlichkeit noch woanders über Konten mit Spareinlagen verfügen.

More Related