1 / 25

MODELY DISKRÉTNÍ VOLBY 3. cvičení

MODELY DISKRÉTNÍ VOLBY 3. cvičení. Osnova. Podstata modelů diskrétní volby Modely binární volby LPM Logitový Probitový Aplikace Ukázka – cílení marketingových kampaní. Podstata modelů diskrétní volby. Vychází z principu regrese Používají se pro diskrétní endogenní proměnou

mahsa
Download Presentation

MODELY DISKRÉTNÍ VOLBY 3. cvičení

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. MODELY DISKRÉTNÍ VOLBY3. cvičení

  2. Osnova • Podstata modelů diskrétní volby • Modely binární volby LPM Logitový Probitový • Aplikace Ukázka – cílení marketingových kampaní

  3. Podstata modelů diskrétní volby • Vychází z principu regrese • Používají se pro diskrétní endogenní proměnou • Princip: Jinak se rozhoduji mezi nekonečně mnoha alternativami a mezi dvěma (několika) • Vhodné pro marketingový výzkum a data mining apod.

  4. Modely binární diskrétní volby(1) • Y nabývá pouze dvou hodnot • Značené: 0, 1 • Na čem závisí, že zákazník zůstává u banky/operátora/pojišťovny nebo odchází. • Na čem závisí, zda zákazník vlastní daný produkt? • Na čem závisí to, že zákazník nesplatí úvěr? • Na čem závisí to, že zákazník podvádí banku? • ...

  5. Modely binární diskrétní volby(2) • Lineární pravděpodobnostní model • Odhadnuté hodnoty udávají pravděpodobnost, že pro dané pozorování i bude Y rovno 1. • Problémy: • Náhodné složky vykazují heteroskedasticitu – nutno odhadovat MZNČ, MVNČ • Pravděpodobnost leží mimo interval <0,1> • Interpretace modelu - linearita

  6. Logitový model diskrétní binární volby • Využívá KDF logistického rozdělení • Matematické hledisko pohledu – flexibilní a jednoduchá funkce • Smysluplná interpretace • Odhad pomocí MMV

  7. Probitový model diskrétní binární volby • Využívá KDF standardního normálního rozdělení • Matematické hledisko pohledu – flexibilní a jednoduchá funkce • Smysluplná interpretace • Odhad pomocí MMV

  8. Srovnání KDF normálního a logistického rozdělení

  9. Vyhodnocení modelů • LPM – Stejný princip jako pro KLRM • Logit, probit • Waldův chí-kvadrát test • Score test • Test věrohodnostním poměrem • Modifikovaný R2

  10. APLIKACE • Společnosti • Banky, úvěrové a finanční společnosti • Telekomunikační společnosti • Pojišťovny • Retailové společnosti ... • Marketing • Odchod zákazníka • Pořízení produktu – crosssell • Risk management • Nesplacení úvěru - Skóring • Podvod

  11. Marketingové kampaně • Cílené marketingové kampaně jako součást podlinkové komunikace se zákazníkem (z ang. BTL) • Firma oslovuje konkrétní skupinu zákazníků s konkrétní nabídkou (produkt, sleva...) pomocí různých komunikačních kanálů (dopis, email, sms, telefonát...) • Problém • Velké množství zákazníků • Které zákazníky oslovit? • Jaký produkt jim nabídnout? • Pomocí jakého komunikačního kanálu?

  12. Marketingové kampaně • Cíl: • Vyšší odezva klientů na marketingové kampaně při stejných marketingových nákladech • Snížení marketingových nákladů při stejné odezvě klientů • Zvýšení zisků firmy

  13. Aplikace - zadání • Klíčovými produkty banky jsou spotřebitelské úvěry, kreditní karty a spořicí účty. • Úkol: zlepšit cílení marketingových kampaní, v současné době platí, že jsou klienti do kampaní vybíráni pomocí expertních pravidel. • Součástí řešení je spočítání pravděpodobnosti, že si klient pořídí dané produkty a nastavení automatizace počítání modelů s měsíčními intervaly.

  14. 1. Krok – Příprava dat • Co vše víme o klientech banky? • Socio demo: Věk, Pohlaví, Místo bydliště, Zaměstnání, Vzdělání • Behaviorální: Počet a typy produktů, doba využívání produktů, počet žádostí • Transakční data: obrat na účtech, zůstatek, průměrné příjmy, • Informace o kampaních, stížnostech klienta – komunikace klient - banka • Odkud bereme údaje? • Primární zdroje: pobočky, call-centrum, internetové bankovnictví, účetní software ... • Co je klíčový krok v přípravě dat? • Unifikace a identifikace klienta

  15. 1. Krok – Příprava dat • Pro jednotlivá období byla vytvořena analytická tabulka • Přidány odvozené (trendy, kategorie, průměry...) a transformované proměnné (kategorizace, logaritmická transformace • Práce s chybějícími hodnotami, odlehlými pozorováními ... • Počet klientů: cca 900 tis. (aktivní i neaktivní klienti) • Počet vysvětlujících proměnných: 1100

  16. 2. Krok – Odhad modelu • Princip práce s daty a odhad modelu pro spotřebitelské úvěry

  17. 2. Krok – Odhad modelu - Logit • Výsledný model • Interpretaceprametru: • Znaménka – zvyšuje se, snižuje pravděpodobnost • Poměr šancí – pro klienta, který žádal o úvěr, je 4,2 krát vyšší pravděpodobnost, že si vezme úvěr v daný měsíc, než u klienta, který o úvěr nežádal.

  18. 2. Krok – Odhad modelu • Statistika „lift“ – vhodná pro nestatistické • uživatele modelu

  19. 3. Krok - Implementace • Převod pravděpodobnosti na obchodní skóre

  20. Co je vlastně výsledkem modelu • Výsledkem je „pravděpodobnost“ • Výsledkem je skóre • Přepočet pravděpodobnost-> skóre • Obojí je ve campaign management system • Model se automaticky přepočítává každý měsíc

  21. Aplikace DM – Odchod klientů • Cíl: předpovědět odchod zákazníků • Náklady na získání nového klienta překračují náklady na udržení stávajícího klienta • S předstihem předpovědět: • Storno smlouvy, účtu, služby, … • Pokles využívání služeb • Vhodná kombinace s hodnotu zákazníka • Odcházející ziskové klienty nebo klienty s vysokým potenciálem si udržet -> vynaložit prostředky • Odcházející ztrátové klienty přenechat konkurenci

  22. Aplikace – Creditscoring / frauddetection • Creditscoring – výpočet pravděpodobnosti neplacení • Pro nové úvěry/tarifní zákazníky (schvalování) – máme data: • ze žádosti, • z registrů (creditbureau, SOLUS), • z dalších zdrojů (demografické profily, výsledky cenzů atd. • Pro stávající úvěry/zákazníky (řízení rizik - kapitálová přiměřenost – Basel II)

  23. Aplikace – Frauddetection • Frauddetection – výpočet pravděpodobnosti podvodů • u pojistných událostí • kreditních karet • spotřebitelských úvěrů a jiných úvěrů • „praní špinavých peněz“ • billingové podvody

  24. Zdroje • Hušek R, Pelikán J,: APLIKOVANÁ EKONOMETRIE, teorie a praxe • Hosmer D, Lemeshow S,: APPLIED LOGISTIC REGRESSION • Fíglová Z,: ANALÝZA MODELOV DISKRÉTNEJ VOLBY A ICH APLIKÁCIA • Eko-kom

More Related