E N D
Expertní Systémy Petr Berka
Expertní systémy Počítačové programy simulujícírozhodovací činnost lidského experta při řešení složitých úloh a využívající vhodně zakódovaných speciálních znalostí převzatých od experta s cílem dosáhnout ve zvolené problémové oblasti kvality rozhodování na úrovni experta.
Role expertního systému • expert • kolega • asistent
Charakteristické rysy expertního systému • oddělení znalostí a mechanismu pro jejich využívání • neurčitost v bázi znalostí • neurčitost v datech • dialogový režim • vysvětlovací činnost • modularita a transparentnost báze znalostí
Typy expertních systémů • Diagnostické • diagnóza (MYCIN, INTERNIST) • interpretace (DENDRAL, PROSPECTOR) • monitorování (VM) • Generativní • návrh (R1/XCON) • plánování (MOLGEN) • predikce (GLAUKOMA)
Diagnostické úlohy získávání a interpretace informací relevantních pro potvrzení přítomnosti nebo nepřítomnosti nějaké závady v systému
Způsoby reprezentace znalostí • predikátová logika • sémantické sítě • rámce • pravidla • případy
Pravidla • procedurální sémantika JESTLIŽE situace PAK akce • deklarativní sémantika JESTLIŽE předpoklad PAK závěr situace, předpoklad a závěr jsou kombinace tvrzení o stavu světa
Atributy a výroky • výrok (auto má červenou barvu) • atribut, hodnota (barva_auta = červená) • objekt, atribut, hodnota (auto_25: barva = červená) • typy atributů: • kategoriální (binární, nominální, ordinální) • numerické
Inferenční síť • uzly = tvrzení (dotazy, cíle, mezilehlé uzly) • hrany = pravidla
Metody inference • logické metody (dedukce, abdukce, indukce) • zpětné nebo přímé řetězení • generování a testování • využití analogií
Dedukce • využívá implikaci ve dvojhodnotové logice • modus ponens A => B, A B • modus tollens A => B, B A
Zpětné řetězení • Vycházíme z cílů, které chceme odvodit a pokoušíme se nalézt pravidla umožňující tyto cíle potvrdit nebo vyvrátit
Přímé řetězení • Vycházíme z faktů, které jsou splněna a a pokoušíme se nalézt aplikovatelná pravidla
Inference v diagnostických systémech • prohledávání báze (zpětné nebo přímé řetězení) • aplikace pravidla (dedukce) • práce s neurčitostí
Vyjádření neurčitosti • pseudopravděpodobnosti • pravděpodobnosti (Bayesovské sítě) • míry důvěry a nedůvěry • váhy (algebraická teorie) • vyjímky (nemonotonní usuzování)
Algebraická teorie pro znalosti v podobě pravidel předpoklad závěr (váha) • výpočet váhy předpokladu (NEG, CONJ, DISJ) • výpočet příspěvku pravidla k váze závěru (CTR) • složení dílčích příspěvků pravidel se stejným závěrem (GLOB)
Vysvětlování • důvody pro vysvětlování • uživatel získá větší důvěru v závěry systému • tvůrce aplikace může lépe ladit bázi znalostí • typické možnosti vysvětlování • why (proč systém klade tento dotaz) • how (jak systém odvodil své doporučení)
Volba aplikace • hodnocení vágnosti a komplexnosti • pravidlo telefonního hovoru
Faktory úspěchu • Důvody pro aplikaci • expert odchází a je třeba zaškolit zástupce • snaha zajistit standardizaci způsobu rozhodování • Zkušenosti z úspěšných projektů • získejte experta pro spolupráci • zaměřte se na koncového uživatele • použijte inkrementální způsob vývoje
Vývoj znalostního systému softwarový projekt, klíčovou roli hrají znalosti
Podpora vývoje • Softwarový projekt • „klasické“ metodiky (spirála, vodopád, V) • metodika KADS • Získávání znalostí • techniky elicitace znalostí • znalostní modelování • znalostní ontologie
Výhody použití expertních systémů • zvýšená dostupnost expertízy • snížené náklady na provedení expertízy • trvalost expertízy • opakovatelnost expertízy • rychlá odezva
Limitující faktory • chybějí efektivnější techniky získávání znalostí • chybějí přesné testovací procedury • nedostatečné integrování do používaných technologií • znalostní inženýři kladou malý důraz na aplikační oblast
Příklad - expertní systém pro hodnocení rizika výskytu aterosklerózy komplikované onemocnění, které probíhá mnoho let bez příznaků. Manifestace aterosklerózy – postižení funkce životně důležitých orgánů (srdce, mozek, ledviny) má dalekosáhlé důsledky nejen zdravotní, ale i ekonomické, sociální, etické. Více než polovina úmrtí osob středního a vyššího věku je u nás stále způsobena aterosklerotickými onemocněními.
Rizikovéfaktoryaterosklerózy • neovlivnitelné: • pohlaví, věk, osobní anamnéza • ovlivnitelné: • krevní tlak, hladina cholesterolu, kouření, způsob života • stravovací návyky (obezita) • tělesná aktivita • reakce na stres
Kalkulátory Expertnísystémy • kalkulátory • vyhodnocují rizikojako vážený součet všech faktorů • uživatel musízadatpřesné odpovědina všechny otázky • expertnísystémy • vyhodnocují rizikoodvozováním v bázi znalostí • mohou zpracovávat nejistou nebo chybějící informaci
Expertní systém NEST (1/2) • reprezentace znalostí • atributy (binární, nominální, numerické) a výroky • pravidla: předpoklad závěr (váha), akce • kompozicionální- každý literál v závěru má váhu • apriorní - kompozicionálnípravidla bez předpokladu • logická - nekompozicionální pravidla bez vah • inference jako kombinace zpětného a přímého řetězení • kompozicionálníinference pro kompozicionální a apriorní pravidla (kombinování příspěvků pravidel) • nekompozicionální inference pro logická pravidla (modus ponens + disjunkce)
Expertní systém NEST (2/2) • zpracování neurčitosti • neurčitostse může vyskytovat veznalostech expertai v odpovědích uživatele běhemkonzultace, • kompozicionální (kombinovánípříspěvkůvšech aplikovatelnýchpravidel) založeno na algebraické teorii P. Hájka • různé sadykombinačních funkcí (MYCIN + PROSPECTOR, Lukasiewiczovavícehodnotová logika, neuronovésítě) • dvazákladní režimykonzultace: dialogovýa pomocídotazníku, • implementovánojako stand-alone nebo client-server verze. http://lisp.vse.cz/NEST
Systém NEST – typy odpovědí • binární atribut - váha • jednoduchý nominální atribut – hodnota a váha • množinový nominální atribut – seznam hodnot a jejich vah • numerický atribut - hodnota Dotazy nezodpovězené v průběhu konzultace získávají automaticky implicitní váhu „neznámá“ [-1,1] nebo “irelevantní“ [0,0], odpovědi lze rovněž odkládat a po skončení konzultace se k nim vrátit
Základní informce o systému AtherEx • báze znalostí vytvořenave dvou krocích • aplikace metod strojového učenína data shromážděná v epidemiologické studiirizika aterosklerózy • získanápravidla upravena a zpřesněnaexpertem • systém pracujes rizikovými faktory (otázkami)srozumitelnými laikům (20faktorů + 1 lab. test) • výsledkemkonzultacejeklasifikace pacientado jedné ze čtyř skupinz hlediska rizika aterosklerózy http://j116h01.vse.cz
Studie primární prevence aterosklerózy Dlouhodobá (1975-2000) studierizikovýchfaktorůaterosklerózyv populacimužůstředního věkurozdělených dotřískupin (normal, risk, pathological). • zjistit prevalenci rizikových faktorů aterosklerózy u mužů středního věku, • sledovat vývoj rizikových faktorů a jejich vlivu na zdravotní stav, zejména s ohledem na výskyt aterosklerotických CVD, • sledovat vliv komplexní intervence rizikových faktorů na jejich vývoj a na kardiovaskulární morbiditu a mortalitu, • po 10–12 letech trvání studie porovnat profil rizikových faktorů a zdravotní stav mužů v jednotlivých skupinách.
Control 10572x66 Entry 1417x64 Letter 403x62 Death 389x5 Data STULONG
Algoritmus KEX pro tvorbu pravidel • Rozhodovací pravidlatvaruAnt Class (w) • Kompozicionální algoritmus • Vytvářenípravideljako proces zpřesňování znalostí (přidej nové - speciálnější - pravidlojenom pokud se zpřesníschopnost klasifikace) • Aplikacepravideljakokombinace jejich příspěvků založená napseudo-bayesovském přístupu: http://lispminer.vse.cz
Analýzatabulky ENTRY (1/2) • klasifikacezaloženájen na dosud známých rizikových faktorech, • klasifikacezaložená na atributechtýkajících sezpůsobu života, osobní a rodinnéanamnézy (bez speciálních laboratorníchvyšetření), • klasifikacezaložená na atributechtýkajících sezpůsobu života a rodinnéanamnézy, • klasifikacezaloženápouze na atributechtýkajících sezpůsobu života.
Modifikacenavrženéexpertem • vytvoření nových cílů „žádné riziko“, „nízké riziko“, „střední riziko“ a „vysoké riziko“ místo původních rizikových skupin, • doplnění pravidel ke všem hodnotám atributu v případě, že alespoň jedna hodnota tohoto atributu se objevila v pravidlech generovaných z dat, • přidání atributu„cholesterol“.
Implementace • použita klient-server verze NESTu(tenký klient = webovýprohlížeč) • uživatelské rozhranní skrývádetailyo inferenci a zpracování neurčitosti(tvůrce aplikacemůže měnitpodobu dialogu projednotlivé báze znalostí) • dialogovýrežimkonzultace(s možnostízměnitodpovědi po skončení konzultacepomocídotazníku)
Expertní systémy v medicině • Generování poplachů a upozornění • Diagnostická asistence • Kontrola a plánování terapie • Vyhledávání informací • Rozpoznávání a interpretace snímků (Coiera, 2003) Info o systémech např. na www.computer.privateweb.at/judith www.openclinical.org/