560 likes | 726 Views
TECHNIKY VÝPOČTU IBNR A JEJICH APLIKACE V POJIŠTĚNÍ ODPOVĚDNOSTI Z PROVOZU VOZIDEL. Petr Jedlička Jan Kočvara Jakub Strnad. Obsah prezentace. Munich Chain-Lader ( MCL ) Regresní metody výpočtu rezerv (Probabilistic Trend Family – PTF ) Simulační techniky k určení rozdělení IBNR
E N D
TECHNIKY VÝPOČTU IBNR A JEJICH APLIKACE V POJIŠTĚNÍ ODPOVĚDNOSTI Z PROVOZU VOZIDEL Petr Jedlička Jan Kočvara Jakub Strnad
Obsah prezentace • Munich Chain-Lader (MCL) • Regresní metody výpočtu rezerv (Probabilistic Trend Family – PTF) • Simulační techniky k určení rozdělení IBNR • Aplikace v pojištění odpovědnosti z provozu vozidla (POV) • Ilustrace použití metod na škodách způsobených nepojištěnými řidiči
Trojúhelníková schémata zpoždění • Data • Pojistná plnění • Závazky • Počty událostí… • Forma dat (v řádcích) • Kumulativní • Přírůstková • Interpretace • Řádky: odpovídají období vzniku relevantní události • Sloupce: období zpoždění ve hlášení nebo plnění události od data vzniku • Diagonály: údaje pro jednotlivá kalendářní období • Snahou je odhad dat pod aktuální diagonálou • Doplnění trojúhelníku na čtverec (obdélník) • Statistické metody, nejznámější je Chain-Ladder známá data období vzniku odhadovaná část
Standardní Chain-Ladder a jeho nedostatky • Neuvažuje / neumožňuje: • Systematický vývoj podle roku vzniku • Odhadnout inflaci ve výši škod (vývoj podle kalendářního období) • Určit vedle bodového odhadu IBNR její pravděpodobnostní rozdělení nelze spočítat interval spolehlivosti pro IBNR, medián atd. • Projekce vyplacených plnění (Paid) a celkových závazků (Incurred) často zcela odlišné • Nevýhody z hlediska POV • V celém trhu POV je pozorován nárůst škod v čase převyšující inflaci (tzv. superimposed inflation) • Výrazný meziroční nárůst objemu škod u ŠU placených z GF ČKP
Úvod k Munich Chain-Ladder • Metoda vyvinuta aktuáry Münchener Rück • Odtud odvozen její název • Rozšiřuje model T. Macka (1993) • stejné kalkulace variability vývojových faktorů • Hlavní znaky • Pracuje zároveň s kumulativními trojúhelníky Paid i Incurred • Snahou je zmenšit rozdíly projekcí obou trojúhelníků • Úprava vývojových faktorů Standardního Chain-Ladderu (SCL) • Modelování závislostí mezi trojúhelníky
Používané symboly pro MCL • n…rozměr trojúhelníků • a(i)…poslední známé období vývoje pro rok vzniku i • Pi,j…kumulativní hodnota vyplaceného plnění • pro rok vzniku i a zpoždění j • I i,j…kumulativní hodnota celkového závazku = Pi,j+ odpovídající stav RBNS • (P/I) i,j = Pi,j / I i,j • i = 1,…,n; j=1,…,a(i). • Trojúhelník podílů vyplacených plnění a celkového závazku (měl by konvergovat k 1)
Vývojové faktory • Standardní faktory Chain Ladder pro oba trojúhelníky: • Průměrný poměr Paid a Incurred: • Dodefinujeme pro • Při použití těchto projekcí SCL platí následující: • Grafická interpretace na následujícím grafu (Závislost poměru P/I na období vývoje): podíly projekcí Paid a Incurred nekonvergují k 1. • Nízká hodnota podílu ve známé části také nízké hodnoty podílu predikcí
Graf podílu Paid a Incurred • Graf vlevo znázorňuje známá data včetně průměrných podílů • Druhý graf je doplněn o podíly predikcí P/I dle SCL • -Podíl Paid a Incurred nekonverguje ke 100%
Hlavní myšlenka MCL metody • Nízký podíl dosud vyplaceného plnění (Paid) z celk. závazku (Incurred), tj. (P/I)i,j vyšší podíl plnění Pi,j+1/Pi,j je vhodné navýšit vývojový faktor nižší podíl závazků Ii,j+1/Ii,j je vhodné snížit vývojový faktor • Matematicky • Záporná korelace mezi oběma veličinami (P/I)i,j a Pi,j+1/Pi,j • Možnost modelovat závislost pomocí regrese a následně vývojový faktor ze SCL upravit: • Pro roky vzniku s nízkým podílem P/Idojde k urychlení vývoje vyšší faktor u Paid trojúhelníku a naopak
Problémy s implementací • Není možné formulovat oddělené regrese pro každé období vývoje • Modely pak ovlivněny nedostatkem pozorování • Vysoká variabilita odhadů • Lineární regrese není vhodná • Málokdy je vývojový faktor menší než 1 a nikdy není záporný • Možno proto modelovat hyperbolickou křivkou
Řešení uvedených problémů • Linearita regrese • Uvažovat závislost Pi,j+1/Pi,jna (I/P)i,jnamísto na (P/I)i,j • Nedostatek dat a kvalita odhadů • Nebrat oddělené regresní modely pro každé období vývoje, ale uvažovat všechna data společně v jednom modelu • K tomu je nutná standardizace hodnot vysvětlující i vysvětlované proměnné Nutné předpoklady o variabilitě a střední hodnotě • Predikce regresního modelu pak určují „korekce“ vývojových faktorů standardního Chain-Ladderu pro trojúhelník vyplacených plnění
Technika standardizace • Podobně jako závislost Pi,j+1/Pi,jna (I/P)i,jlze uvažovat závislost Ii,j+1/Ii,j na (P/I)i,j • Užitečné pro adjustaci vývojových koeficientů trojúhelníku Incurred • Stejné důvody pro standardizaci • Analogické předpoklady o variabilitě faktorů (T. Mack) • Odhady parametrů obou regresí by měly vycházet kladné
Předpoklady – Trojúhelník Paid Viz Thomas Mack (1993) • Náhodná posloupnost Pi:=(Pi,1,Pi,2,…,Pi,n)’ • Střední hodnota: • Variabilita: • Označení: Pi(j)=(Pi,1,…Pi,j)’(tj. známá část procesu v okamžiku odhadu) • PosloupnostiPxaPyjsou nezávislé pro x≠y • Analogické předpoklady pro Incurred trojúhelník
Komentář k předpokladům • Předpoklad o střední hodnotě lze upravit: • Úprava předpokladu o rozptylu: Analogický předpoklad je ve speciálním případě modelů ELRF (Extended Link Ratio Family) odpovídající právě SCL
Předpoklady – Trojúhelník Incurred • Náhodná posloupnost Ii:=(Ii,1,Ii,2,…,Ii,n)’ • Střední hodnota: • Variabilita: • Označení: Ii(j)=(Ii,1,…Ii,j)’(tj. známá část procesu v okamžiku odhadu) • PosloupnostiIxa Iyjsou nezávislé pro x≠y • Limitace • Neuvažují se (zatím) předpoklady o vztahu Paid a Incurred
Předpoklady o závislostech • V praxi znalost obou trojúhelníků Paid i Incurred Pi,j, Ii,j • Značení: • Bi={Pi,;Ii} • Bi(j)={Pi(j); Ii(j)}’(známá část obou procesů v čase výpočtu projekcí) • Qi=Pi / Ii • Standardizovaná náhodná veličina X při znalosti C: • Předpoklad základního vztahu MCL • Předpokládaná lineární závislost Paid vývojového faktoru na poměru I/P (ve standardizovaném tvaru)… udává sklon regresní přímky • Předpoklad nezávislosti • Procesy Bxa By jsou stochasticky nezávislé
Korekce vývojového faktoru • Z předchozího vyplývá: • Poznámky • Vývojový faktor MCL je přirozeně určen jako korekce faktoru SCL • Postup odvození ukázán pro Paid trojúhelník • Analogické principy i pro Incurred trojúhelník:
Korelační koeficienty • Označení • X …standardizované hodnoty podílů P/I resp. I/P • Y…standardizované vývojové faktory • V předpokladech modelu uvedeno: • • Dosazením dostáváme matematickou interpretaci koeficientů: • Standardizace hodnotu korelačního koeficientu neovlivní • „Rozumná“ situace
Výpočty odhadů - variabilita • Standardní odhady vývojových faktorů (viz dříve) • Variabilita faktorů • Trojúhelník Paid • Trojúhelník Incurred • Odhad : • Odhad variabilit podílů Paid a Incurred • Paid: je odhadem • Incurred: je odhadem
Výpočty MCL vývojových faktorů • Na základě vypočtených standardizovaných hodnot formulujeme regresní modely • Odhady parametrů pomocí MNČ • Odhady vývojových faktorů MCL • Odvození projekcí obou trojúhelníků pro j=a(i) pro ostatní j
Aplikace metody MCL v POV • ČKP aplikovala MCL na data • Vybraných členských pojišťoven • Garančního fondu • Zkušenosti s metodou na datech členů • Očekávanou závislost veličin se ne vždy podařilo prokázat • K přiblížení výsledků projekcí obou trojúhelníků došlo jen částečně • Analýza GF ČKP (přesněji ŠU způsobené nepojištěnými) • Podobně rozporuplné výsledky • Např. citlivost odhadů regresních parametrů na odlehlá pozorování
Ukázka závislosti • Grafy ukazují závislosti normovaných hodnot podílu Pi,j+1/Pi,jna (I/P)i,j(všechna data, resp. data po vyloučení dvou odlehlých pozorování) • Odhady parametrů: • Citlivost na odlehlá pozorování je výrazná. Vynechání dvou pozorování způsobilo pokles korelace o 0,2 (!)
Zhodnocení výsledků MCL • Predikce založené na MCL • Při „správném“ charakteru závislostí: • podobné odhady finálních projekcí nezávisle na typu trojúhelníku • U SCL problém: • některé predikce Paid převyšují odhady Incurred • jiné jich nedosahují (viz graf) • zvlášť často v pozdějších letech vzniku (extrém např. v posledním období vzniku, pokud např. (P/I)n,j ~ 0 pro j=a(n)) • IBNR podle MCL může vyjít nižší než podle SCL(z Incurred trojúhelníku) • V našem příkladě škod nepojištěných cca. o 44% • Obecně ale platit nemusí
Grafické srovnání projekcí SCL a MCL • Podíl P/I u MCL konverguje ke 100% pro každý rok vzniku • Dokonce i pro ta období vzniku, kde je dosud vyplacené plnění relativně zanedbatelné vůči závazku
Regresní techniky výpočtu rezervy • Dynamické modely:Yi,j=bj*Yi,j-1+ei,j, Var(ei,j)=2(Yi,j-1) • Yi,jkumulativní data (počty škod, plnění nebo závazek k období vzniku i a vývoje j) • Přímočaré rozšíření SCL metody • Speciálně • = 0 Metoda nejmenších čtverců • = 1SCL metoda • = 2 • Zobecnění modelu: Yi,j=a0+a1*i+bj*Yi,j-1+ei,j, Var(ei,j)=2(Yi,j-1) • Zahrnutí vývoje podle období vzniku události • Extended link ratio family model
Popis PTF Modelu • PTF = Probabilistic Trend Family • Modelování vývoje pomocí trendů ve třech směrech • Accident (vývoj počtu nebo objemu škod mezi řádky trojúhelníku) i • Důležitý u škod s neznámou expozicí (např. právě GF ČKP) • Development (vývoj mezi sloupci) j • Payment/Calendar trend (vývoj po diagonálách) t = i + j • pomocí něj lze odhadnout tzv. superimposed inflaci • Regresní model • Vysvětlující proměnné jsou „indikátory“ časových období • Vysvětlovaná proměnná je logaritmus přírůstkových nebo i kumulativních údajů • počty událostí, plnění, závazky
Specifikace regresního modelu • Nejpodrobnější možný model: • Každý přechod v libovolném směru je modelován odlišným parametrem • Model je evidentně přeparametrizován (vysoká vysvětlovací schopnost, avšak přesto nevhodné pro predikci) • Odhady mohou být zatíženy velkou chybou • Špatně podmíněná matice X (LZ sloupce, XTX singulární) • Ukázka designové matice X takového modelu
Poznámky k formulaci PTF • Pro obecný PTF platí: • Vývoj v libovolném směru lze převést na zbylé dva směry • Příklad: Následující dva modely jsou ekvivalentní • Stabilní shodné trendy a v accident a development = stabilní trend a v payment směru 2a 2a 2a
Předpoklady o rozdělení plateb • přírůstek trojúhelníku • Normalita residuí v PTF modelu • Vztahy pro logaritmicko-normální rozdělení Pi,j • Rozdělení podílů
Hledání vhodného modelu – 1. možnost • Začínáme s popsaným „plným“ modelem • resp. modelem získaným forward krokovou regresí • Použitý přístup: vytvářet podmodely sčítáním sloupců matice • CSS = Columns Sum Submodel • Pro období se stabilním J vývojem stačí jediný parametr trendu, např. • Rozdílné od myšlenky vypouštět nevýznamné parametry původního modelu • Cíl: • Kompromisní model, který: • přijatelně vysvětluje data, ale • neobsahuje mnoho parametrů např. model minimalizující AIC (Akaikeho informační kritérium)
Hledání vhodného modelu – 2. možnost • Postupujeme „zdola“ od jednoduchých modelů • Např. začínáme s modelem: Yi,j= a + b*i + c*j + ei,j • V něm se předpokládá, že platí Yi+1,j – Yi,j ~ b, pro každé j a Yi,j+1 – Yi,j ~ c, pro každé i • Hledáním „zlomů“ ve vývoji grafů residuí vůči hodnotám i, j a t se pak dá odvodit, mezi jakými okamžiky uvažovat změnu parametru • Např. model bude tvaruYi,j+1 – Yi,j ~ c0pokud j < j0a Yi,j+1 – Yi,j ~ c1jinak. • K nalezení vhodného modelu pomůže i znalost okamžiku intervence • jakýkoliv vnější vliv – legislativní, ekonomické změny apod. • Opět vhodnou mírou kvality výsledného modelu je AIC nebo modifikovaný koeficient determinace
Postup tvorby modelů dle grafů residuí • Graf průměrů residuí základního modelu proti zpoždění • Zřejmý trend v grafu • Růst residuí do 4. období vývoje • (model trend podhodnocuje) • Pak následuje pokles • (model trend nadhodnocuje) • Řešení: • uvažovat dva parametry pro development trend („zlom“ ve 4. období) • V rozšířeném modelu nepozorujeme trendy v residuích
Kumulativní vs. přírůstková data • PTF model je možné aplikovat na kumulativní i přírůstková data • Zehnwirth (1994, 1998) uvažuje logaritmus přírůstkových dat • Nevýhody tohoto přístupu podle ČKP • Nulové hodnoty v pozdějších obdobích vývoje nelze logaritmovat • Případné nahrazení nulových hodnot „malými hodnotami“ zkresluje model • Občas náročné najít model s dobrou vysvětlující schopností • Řešení • Někdy lze použít logaritmy kumulativních dat (nesmí ale být významná autokorelace residuí) • Obtížněji interpretovatelné odhady parametrů a teoretické zdůvodnění modelu
Požadavky na výsledný model • Jejich splnění důležité pro adekvátnost bootstrapu (viz dále) • Dostatečná vysvětlovací schopnost • Při hodnotách R2 < 0,85 narůstá při přechodu na nelogaritmované hodnoty rozdíl mezi střední hodnotou a mediánem (vysoká variabilita) • Odstranění systematických složek z grafů residuí • Nezamítnutí normality residuí • Shapiro – Wilkův test, • Normal Probability plot • Histogram residuí • Nekorelovanost residuí • Durbinův – Watsonův test • Pozor na multikolinearitu (i + j = t)
Doplnění trojúhelníku na čtverec • Výpočet lineárních předpovědí Yi,j včetně predikčních intervalů pro i, j splňující: • i+j >T • i <= T • Tje poslední známé kalendářní období • Přechod na původní (nelogaritmované) hodnoty • Předpokládáme splnění normality v logaritmovaném modelu • Použijeme vztah pro střední hodnotu a medián logaritmicko-normálního rozdělení • Potřebnou variabilitu odvodíme v logaritmickém tvaru z rozdílu: • 97,5% kvantil – stř. hodnota ~ 2* směr. odchylka
Zhodnocení implementace PTF metody • Metoda je flexibilní • Lze jí uplatnit i na trojúhelníky z nejrůznějších důvodů neúplné • Z jednou vytvořeného modelu lze někdy vycházet i při další analýze • Rozmanité možnosti předpovídání • Limitace metody • Předpoklad stejného vývoje plateb podle kalendářního období do budoucna (vývoj ve směru payment nemusí být stabilní) • Při predikci tail faktoru se uvažuje vývoj daný posledním parametrem i na další období vývoje • Softwarová realizace • Software ICRFS (vyvinutý jedním z autorů metody Dr. B. Zehnwirthem) automaticky určí „nejlepší“ model a vše ostatní • Realizace ČKP (regresní modely vytvářeny manuálně) • Regresní část: STATISTICA • Simulační část: Excel, Mathematica
Odhady rozdělení předpovědí • Z předpovědí k dispozici: • Odhad střední hodnoty a kvantilů • Zajímá nás: • Např. rozdělení součtu v neznámé části čtverce • Sice platí, že střední hodnota součtu = součet středních hodnot, ale pro kvantily žádná analogie neplatí • Řešení použité ČKP • Bootstrap na základě lineárních předpovědí z modelu v logaritmickém tvaru • získáme odhad střední hodnoty, směrodatné odchylky (předpokládáme normalitu a také nezávislost) – viz požadavky na regresní model • Opakované generování takto určených náhodných veličin a následné součty realizací (součty odlogaritmovaných hodnot) Získáme empirické rozdělení součtu (plnění, závazku nebo počtu událostí) Pravděpodobnostní meze např. pro IBNR
Aplikace PTF metody a simulací v ČKP • Odhady IBNR Garančního fondu ČKP • Nezjištění • Nepojištění Problém • Neznámá velikost „kmene“ těchto motoristů • Stálý nárůst počtu událostí i objemů způsobených škod • Analýzy IBNR členských pojišťoven • Analýzy agregované IBNR celého trhu • Ve všech případech poskytl vhodně zvolený PTF model velmi dobré výsledky
Aplikace PTF pro GF ČKP – „nepojištění“ • Analýza pomocí objemů škod nedala přijatelné výsledky • Nízké R2(pouze cca. 72%) přes splnění normality residuí predikce nepoužitelné v praxi • Nerealisticky široký predikční interval po odlogaritmování • Možné řešení • Přechod k analýze počtu pojistných událostí pomocí PTF • R2výsledného modelu 89% • Regresní diagnostika neindikuje nesplnění předpokladů • Odhad celkového plnění a IBNR proveden pomocí vývoje průměrné PU
Příklad tvorby modelu • Porovnání výsledků modelu z kumulativních i přírůstkových dat • Tvorba kumulativního modelu • Odhadnutí okamžiků změny vývoje Grafylogaritmovanýchhodnot vůči směrům Accident – stabilní růst do 10. období, pak pokles Development – zlom vývoje ve 3. období Payment – stabilní růst
Formulace kumulativního modelu Odhady parametrů Obdobným postupem hledání zlomů v grafech residuí jsme odvodili podrobnější model: Stále systematický vývoj v grafech residuí např. zřejmý zlom ve vývoji residuí podle roku vzniku
Hledání modelu - pokračování • Nakonec formulován model se šesti parametry • Ten byl následně zredukován o nevýznamné parametry • Byl přidán parametr popisující payment trend. • Výsledky konečného modelu včetně grafů vývoje residuí:
Kumulativní Součet predikcí: 22 520 Součet diagonály 15 925 Očekávaný přírůstek 6 595 R2 = 0,935 DW = 1,08 corr = 0,454 (!) Normalita: Přírůstkový Součet predikcí: 19 025 Součet diagonály 15 925 Očekávaný přírůstek 3 100 R2 = 0,886 DW=1,68 corr = 0,157 Normalita: Srovnání výsledků obou přístupů • Na základě těchto výsledků jsme se rozhodli pro přírůstkový model. (Nicméně v jiných případech byl kumulativní použitelný)
Další simulační technika • Vyvinuta firmou Deloitte • Rozšiřuje možnosti softwaru na výpočet rezerv Cros • Poskytuje podobné informace o empirickém rozdělení jako bootstrap používaný ČKP
Stručný popis techniky • Vychází z projekcí získaných SW Cros: • Standardní Chain Ladder • Vyhlazení vývojových faktorů různými křivkami • Bornhuetter – Fergusonova metoda • Kredibilitní přístup… • Vlastní simulace v Excelu (odvolává se na struktury Crosu) • Myšlenka generování scénářů • Náhodné prohazování vypočtených residuí a nové výpočty projekcí
Princip simulací • Doplnění trojúhelníku na čtverec • Zpětné určení vyhlazených hodnot ve známé části trojúhelníku • Protažení vývojovými faktory od diagonálních hodnot nazpátek • Přechod od kumulativních hodnot na přírůstková data • U původních i zpětně vyhlazených trojúhelníků • Výpočet residuí • Odečtením přírůstkových trojúhelníků pozorovaných a očekávaných hodnot
Použitá standardizace residuí • Uvažují se standardizovaná residua • Snaha o zdůvodnění • Uvedený postup smysluplný, pokud je rozptyl přímo úměrný stř. hodnotě • To se sice předpokládá (se zpožděním) u ELRF modelu, ale pro kumulativní data Yi,j • Regresní modelYi,j+1=bj*Yi,j+ei,j+1, Var(ei,j+1)=2(Yi,j+1) (*) je ekvivalentní SCLa takévar(Yi,j+1| Yi,j)= 2(Yi,j) • Teď se předpokládá přímá úměra pro přírůstková data Xi,j+1=Yi,j+1 – Yi,j • Odvození Var(Xi,j+1| Yi,j) za platnosti modelu (*)
Zhodnocení uvažované standardizace • Odvodili jsme: • Standardizace by byla v pořádku, pokud: Nepodařilo se najít zdůvodnění použitého přístupu standardizace • V dodaných materiálech žádná interpretace standardizace residuí nebyla uvedena.