250 likes | 497 Views
MODELY DISKRÉTNÍ VOLBY 3. cvičení. Osnova. Podstata modelů diskrétní volby Modely binární volby LPM Logitový Probitový Aplikace Ukázka – cílení marketingových kampaní. Podstata modelů diskrétní volby. Vychází z principu regrese Používají se pro diskrétní endogenní proměnou
E N D
Osnova • Podstata modelů diskrétní volby • Modely binární volby LPM Logitový Probitový • Aplikace Ukázka – cílení marketingových kampaní
Podstata modelů diskrétní volby • Vychází z principu regrese • Používají se pro diskrétní endogenní proměnou • Princip: Jinak se rozhoduji mezi nekonečně mnoha alternativami a mezi dvěma (několika) • Vhodné pro marketingový výzkum a data mining apod.
Modely binární diskrétní volby(1) • Y nabývá pouze dvou hodnot • Značené: 0, 1 • Na čem závisí, že zákazník zůstává u banky/operátora/pojišťovny nebo odchází. • Na čem závisí, zda zákazník vlastní daný produkt? • Na čem závisí to, že zákazník nesplatí úvěr? • Na čem závisí to, že zákazník podvádí banku? • ...
Modely binární diskrétní volby(2) • Lineární pravděpodobnostní model • Odhadnuté hodnoty udávají pravděpodobnost, že pro dané pozorování i bude Y rovno 1. • Problémy: • Náhodné složky vykazují heteroskedasticitu – nutno odhadovat MZNČ, MVNČ • Pravděpodobnost leží mimo interval <0,1> • Interpretace modelu - linearita
Logitový model diskrétní binární volby • Využívá KDF logistického rozdělení • Matematické hledisko pohledu – flexibilní a jednoduchá funkce • Smysluplná interpretace • Odhad pomocí MMV
Probitový model diskrétní binární volby • Využívá KDF standardního normálního rozdělení • Matematické hledisko pohledu – flexibilní a jednoduchá funkce • Smysluplná interpretace • Odhad pomocí MMV
Vyhodnocení modelů • LPM – Stejný princip jako pro KLRM • Logit, probit • Waldův chí-kvadrát test • Score test • Test věrohodnostním poměrem • Modifikovaný R2
APLIKACE • Společnosti • Banky, úvěrové a finanční společnosti • Telekomunikační společnosti • Pojišťovny • Retailové společnosti ... • Marketing • Odchod zákazníka • Pořízení produktu – crosssell • Risk management • Nesplacení úvěru - Skóring • Podvod
Marketingové kampaně • Cílené marketingové kampaně jako součást podlinkové komunikace se zákazníkem (z ang. BTL) • Firma oslovuje konkrétní skupinu zákazníků s konkrétní nabídkou (produkt, sleva...) pomocí různých komunikačních kanálů (dopis, email, sms, telefonát...) • Problém • Velké množství zákazníků • Které zákazníky oslovit? • Jaký produkt jim nabídnout? • Pomocí jakého komunikačního kanálu?
Marketingové kampaně • Cíl: • Vyšší odezva klientů na marketingové kampaně při stejných marketingových nákladech • Snížení marketingových nákladů při stejné odezvě klientů • Zvýšení zisků firmy
Aplikace - zadání • Klíčovými produkty banky jsou spotřebitelské úvěry, kreditní karty a spořicí účty. • Úkol: zlepšit cílení marketingových kampaní, v současné době platí, že jsou klienti do kampaní vybíráni pomocí expertních pravidel. • Součástí řešení je spočítání pravděpodobnosti, že si klient pořídí dané produkty a nastavení automatizace počítání modelů s měsíčními intervaly.
1. Krok – Příprava dat • Co vše víme o klientech banky? • Socio demo: Věk, Pohlaví, Místo bydliště, Zaměstnání, Vzdělání • Behaviorální: Počet a typy produktů, doba využívání produktů, počet žádostí • Transakční data: obrat na účtech, zůstatek, průměrné příjmy, • Informace o kampaních, stížnostech klienta – komunikace klient - banka • Odkud bereme údaje? • Primární zdroje: pobočky, call-centrum, internetové bankovnictví, účetní software ... • Co je klíčový krok v přípravě dat? • Unifikace a identifikace klienta
1. Krok – Příprava dat • Pro jednotlivá období byla vytvořena analytická tabulka • Přidány odvozené (trendy, kategorie, průměry...) a transformované proměnné (kategorizace, logaritmická transformace • Práce s chybějícími hodnotami, odlehlými pozorováními ... • Počet klientů: cca 900 tis. (aktivní i neaktivní klienti) • Počet vysvětlujících proměnných: 1100
2. Krok – Odhad modelu • Princip práce s daty a odhad modelu pro spotřebitelské úvěry
2. Krok – Odhad modelu - Logit • Výsledný model • Interpretaceprametru: • Znaménka – zvyšuje se, snižuje pravděpodobnost • Poměr šancí – pro klienta, který žádal o úvěr, je 4,2 krát vyšší pravděpodobnost, že si vezme úvěr v daný měsíc, než u klienta, který o úvěr nežádal.
2. Krok – Odhad modelu • Statistika „lift“ – vhodná pro nestatistické • uživatele modelu
3. Krok - Implementace • Převod pravděpodobnosti na obchodní skóre
Co je vlastně výsledkem modelu • Výsledkem je „pravděpodobnost“ • Výsledkem je skóre • Přepočet pravděpodobnost-> skóre • Obojí je ve campaign management system • Model se automaticky přepočítává každý měsíc
Aplikace DM – Odchod klientů • Cíl: předpovědět odchod zákazníků • Náklady na získání nového klienta překračují náklady na udržení stávajícího klienta • S předstihem předpovědět: • Storno smlouvy, účtu, služby, … • Pokles využívání služeb • Vhodná kombinace s hodnotu zákazníka • Odcházející ziskové klienty nebo klienty s vysokým potenciálem si udržet -> vynaložit prostředky • Odcházející ztrátové klienty přenechat konkurenci
Aplikace – Creditscoring / frauddetection • Creditscoring – výpočet pravděpodobnosti neplacení • Pro nové úvěry/tarifní zákazníky (schvalování) – máme data: • ze žádosti, • z registrů (creditbureau, SOLUS), • z dalších zdrojů (demografické profily, výsledky cenzů atd. • Pro stávající úvěry/zákazníky (řízení rizik - kapitálová přiměřenost – Basel II)
Aplikace – Frauddetection • Frauddetection – výpočet pravděpodobnosti podvodů • u pojistných událostí • kreditních karet • spotřebitelských úvěrů a jiných úvěrů • „praní špinavých peněz“ • billingové podvody
Zdroje • Hušek R, Pelikán J,: APLIKOVANÁ EKONOMETRIE, teorie a praxe • Hosmer D, Lemeshow S,: APPLIED LOGISTIC REGRESSION • Fíglová Z,: ANALÝZA MODELOV DISKRÉTNEJ VOLBY A ICH APLIKÁCIA • Eko-kom