260 likes | 471 Views
Odkrivanje goljufij na osnovi analize socialnih omrežij. Lovro Šubelj, FRI. DSI 2009, Portorož, 15. - 17.4.2009. Vsebina. Goljufije v avtomobilskem zavarovalništvu Rešitve za odkrivanje goljufij Socialna omrežja Sistem za odkrivanje goljufij Predstavitev z omrežji
E N D
Odkrivanje goljufij na osnovi analize socialnih omrežij Lovro Šubelj, FRI DSI 2009, Portorož, 15. - 17.4.2009
Vsebina • Goljufije v avtomobilskem zavarovalništvu • Rešitve za odkrivanje goljufij • Socialna omrežja • Sistem za odkrivanje goljufij • Predstavitev z omrežji • Identifikacija sumljivih komponent • Odkrivanje sumljivih entitet • Predstavitev rezultatov • Eksperimentalni rezultati s prototipnim sistemom • Sklep
Goljufije v avtomobilskem zavarovalništvu • Rešitve za odkrivanje goljufij • Socialna omrežja • Sistem za odkrivanje goljufij • Predstavitev z omrežji • Identifikacija sumljivih komponent • Odkrivanje sumljivih entitet • Predstavitev rezultatov • Eksperimentalni rezultati s prototipnim sistemom • Sklep
Goljufije v avtomobilskem zavarovalništvuOpis problema I Drive down Swoop and squat • Izsiljene ali uprizorjene prometne nesreče z namenom (neupravičene) pridobitve sredstev • Goljufi hlinijo poškodbe oz. pridobijo sredstva za popravilo vozila • Klasični načini povzročitve prometne nesreče; več znanih shem
Goljufije v avtomobilskem zavarovalništvuOpis problema II Skupne značilnosti Še posebej zanimive so skupine sodelujočih goljufov: vozniki, avtomehaniki, vlečne službe, kiropraktiki, zdravniki, odvetniki, policisti, zavarovalniški delavc, itd.
Goljufije v avtomobilskem zavarovalništvuPosledice Zavarovalnice opažajo, da je velik del škodnih zahtevkov pretiranih (do 15-30%) oz. popolnoma izmišljenih (okoli 10%) Velike izgube za zavarovalnice, višje zavarovalnine za zavarovance → učinkovit sistem potencialna konkurenčna prednost Povečana nevarnost na cestah Obilo dela za “žrtve”
Goljufije v avtomobilskem zavarovalništvuRaziskava • Značilnosti domene: • Občutljivi podatki • Pomanjkanje označenih podatkov, vedno nove goljufije • Ekstremno neuravnotežen problem • Cilj raziskave: sistem za odkrivanje skupin goljufov (!); brez označenih podatkov; rangiranje • Delovna hipoteza: z ustrezno predstavitvijo in analizo podatkov je moč odkriti velik del goljufij, tudi brez množice označenih primerov • Omejimo se na osnovne entitete in podatke, ki jih je moč (avtomatsko) pridobiti iz policijskega zapisnika o nesreči (pogosto v praksi).
Goljufije v avtomobilskem zavarovalništvu • Rešitve za odkrivanje goljufij • (Socialna) omrežja • Sistem za odkrivanje goljufij • Predstavitev z omrežji • Identifikacija sumljivih komponent • Odkrivanje sumljivih entitet • Predstavitev rezultatov • Eksperimentalni rezultati s prototipnim sistemom • Sklep
Rešitve za odkrivanje goljufij • Pristopi: • ekspertni, inteligentni sistemi • strojno učenje, podatkovno rudarjenje (NN, SVM, CT, NB, itd.) • statistika (verjetnost) • Analize kažejo, da v praksi ni razlik • Osredotočajo se na posamezne nesreče, in ne na skupine goljufov • Slabosti: • Za večje nabore podatkov • Zahtevajo označene podatke • Neprimerna predstavitev (tabelarični zapis – le statične lastnosti)
Goljufije v avtomobilskem zavarovalništvu • Rešitve za odkrivanje goljufij • Socialna omrežja • Sistem za odkrivanje goljufij • Predstavitev z omrežji • Identifikacija sumljivih komponent • Odkrivanje sumljivih entitet • Predstavitev rezultatov • Eksperimentalni rezultati s prototipnim sistemom • Sklep
Socialna omrežja Omrežja temeljijo na matematičnih objektih – grafih: množica vozliščV ter množica povezav med njimi E Neusmerjeni grafi, multigrafi, uteženi grafi Omrežje je navadno utežen multigraf z različnimi povezavami Vozlišča – entitete, povezave – relacije med njimi Entitete so osebe →socialna omrežja
Goljufije v avtomobilskem zavarovalništvu • Rešitve za odkrivanje goljufij • Socialna omrežja • Sistem za odkrivanje goljufij • Predstavitev z omrežji • Identifikacija sumljivih komponent • Odkrivanje sumljivih entitet • Predstavitev rezultatov • Eksperimentalni rezultati s prototipnim sistemom • Sklep
Sistem za odkrivanje goljufij • Podatke predstavimo z omrežji (naravna predstavitev domene; ni izgube informacije; formulacija kompleksnih relacij) • Sistem entitetam določi stopnjo sumljivosti → skupine goljufov • Razdelimo ga v štiri dele: • Predstavitev podatkov z omrežji • Identifikacija sumljivih komponent • Odkrivanje ključnih entitet • Predstavitev rezultatov ekspertu oz. analitiku
Sistem za odkrivanje goljufijPredstavitev z omrežji I Zgradimo omrežja – relacijske lastnosti predstavimo s povezavami Kakšna omrežja? Identificiramo 6 načel gradnje omrežij. Osredotočimo se na 4 tipe omrežij: omrežje voznikov, sopotnikov, nesreč, vozil
Sistem za odkrivanje goljufijPredstavitev z omrežji II Komponente omrežja po potrebi poenostavimo: delimo glede na skupnosti znotraj njih
Sistem za odkrivanje goljufijIdentifikacija sumljivih komponent I Identificirali smo skupne lastnosti goljufivih komponent (skupin entitet) Za vsako lastnost konstruiramo indikator (0-1 atribut) Sumljive komponente odkrijemo na podlagi indikatorjev: posamezen indikator, majority voter, (P)RIDITanaliza.
Sistem za odkrivanje goljufijIdentifikacija sumljivih komponent II Kako konstruirati indikatorje? Zgradimo naključna omrežja
Sistem za odkrivanje goljufijOdkrivanje ključnih entitet I • Iterativen algoritem za ocenjevanje stopnje sumljivosti entitet • Hipoteza: sumljivost entitet je moč določiti na podlagi sumljivosti (neposredno) povezanih entitet, in pa statičnih lastnosti • Ujemanje z relacijo sosednjosti v omrežju nesreč Algoritem: • Inicializiraj stopnjo sumljivosti za vse udeležence (poljubno) • Ponavljaj • Oceni udeležence glede na ocene sosedov iz prejšnje iteracije (model) • Normaliziraj ocene (znotraj komponent) • Normaliziraj ocene (glede na celotno omrežje)
Sistem za odkrivanje goljufijOdkrivanje ključnih entitet II Z iterativnim ocenjevanjem premagamo lokalnost (težko “na silo”) Sumljivost udeleženca se propagira na pov. entitete (po omrežju) Trije linearni modeli za propagacijo sumljivosti Izpostavimo najsumljiveše udeležence in povezujoče nesreče – povezani udeleženci spadajo v isto skupino goljufov
Sistem za odkrivanje goljufijPredstavitev rezultatov Predstavitev rezultatov ekspertu oz. analitiku.
Goljufije v avtomobilskem zavarovalništvu • Rešitve za odkrivanje goljufij • Socialna omrežja • Sistem za odkrivanje goljufij • Predstavitev z omrežji • Identifikacija sumljivih komponent • Odkrivanje sumljivih entitet • Predstavitev rezultatov • Eksperimentalni rezultati s prototipnim sistemom • Sklep
Eksperimentalni rezultati s prototipnim sistemom Prototipni sistem nad policijskimi zapisniki Poročamo o rezultatih na nekoliko večjem naboru podatkov kot v prispevku. Označeni podatki: 211 udeležencev (46 goljufov), 91 nesreč Vsi podatki: 3451 udeležencev, 1561 nesreč Ocenimo uspešnost in analiziramo različne komponente sistema – dobri rezultati Pazljivost pri interpretaciji rezultatov:
Eksperimentalni rezultati s prototipnim sistemomUspešnost sistema Rangiranje Klasifikacija (minimiziramo skupno ceno)
Goljufije v avtomobilskem zavarovalništvu • Rešitve za odkrivanje goljufij • Socialna omrežja • Sistem za odkrivanje goljufij • Predstavitev z omrežji • Identifikacija sumljivih komponent • Odkrivanje sumljivih entitet • Predstavitev rezultatov • Eksperimentalni rezultati s prototipnim sistemom • Sklep
Sklep • Sistem izpolnjuje zadane cilje • Veliko možnih izboljšav(večji nabor (označenih) podatkov, podatki o novih entitetah, itd.) • Učinkovit sistem za detekcijo lahko za zavarovalnice predstavlja veliko prednost pred konkurenti: • poveča količino odkritih goljufij; zmanjša stroške odkrivanja; pohitri odkrivanje Posledično: • nižje zavarovalne premije • manj vznemirjanja zavarovancev, povečanje zaupanja • Prihodnje delo: • Predstavitev podatkov s hiperomrežji (hipergrafi) • Nenadzorovano učenje parametrov modelov (faktorjev) • Prenos na druge domene, področja