160 likes | 272 Views
Projekt Stepper – Aplikace pro podporu víceúrovňové formalizace textových dokumentů. Marek RŮŽIČKA EuroMISE – Kardio, VŠE Praha. Obsah. Metodiky víceúrovňové formalizace Souhrn požadavků na aplikaci Uživatelský interface Dodatečné moduly aplikace Možnosti využití Plány do budoucna.
E N D
Projekt Stepper – Aplikace pro podporu víceúrovňové formalizace textových dokumentů Marek RŮŽIČKA EuroMISE – Kardio, VŠE Praha KEG - 26.3.2003
Obsah • Metodiky víceúrovňové formalizace • Souhrn požadavků na aplikaci • Uživatelský interface • Dodatečné moduly aplikace • Možnosti využití • Plány do budoucna KEG - 26.3.2003
Metodika víceúrovňové formalizace • Vznikla na základě zkušeností při formalizaci „lékařských doporučených postupů (LDP)“ • Ostatní metodiky určené k formalizaci LDP: • Modelově orientované (např. EON, GLIF3, Asgaard) • Dokumentově orientované (GEM, ActiveGuidelines) • Snaha vytvořit dokumentově orientovanou metodiku, řešící některé nedostatky výše uvedených KEG - 26.3.2003
Metodika víceúrovňové formalizace • Rozdělení procesu formalizace do několika úrovní • Každá úroveň představuje původní dokument v určitém stádiu formalizace doplněný o odkazy do předešlé úrovně • Pro ukládání úrovní použit jazyk XML • Výhody • minimalizaci ztráty obsažených informací • zprůhlednění celého procesu • omezení „subjektivizace“ zpracovávaných znalostí KEG - 26.3.2003
Původní představa formalizačního procesu Průběh formalizace • Identifikace základních znalostních bloků v textu • Upřesnění vnitřní struktury znalostních bloků v následujících úrovních • Export do výstupního formátu Související činnosti • Vyhotovení předpisu pro syntaktický zápis každé úrovně v DTD souboru • Anotace znalostních bloků a z nich vzešlých elementů pomocí XLinku pro případné sledování vývoje konkrétních bloků napříč úrovněmi <goal direct="yes" overall="no" id="g4"> <goal-of> <activity type="treatment"> BP lowering </activity> </goal-of> <is-goal> <state> <compound-predicate bool-op="or"> <predicate attribute="age" op="le" value="middle-aged"/> <predicate attribute="Diabetes" op="eq" value="yes"/> </compound-predicate> ... ... <goal id="g6" type="complex"> The goal of antihypertensive treatment should be to achieve "optimal" or "normal" BP in young, middle-aged, or <con>diabetic</con> subjects(below 130/85 mm Hg; Table1.)and at least "high-normal" <con>BP</con> in elderly patients (below 140/90 mm Hg; </goal> KEG - 26.3.2003
Skutečný průběh formalizace Úroveň 1 – hrubá sémantická struktura • Bezproblémové vyznačení znalostních bloků • Velmi náročné ruční vyhotovení XLinkových odkazů Úroveň 2 – detailní sémantická struktura • Dokument přestává být „čitelný“ • Práce s XLinkem je již ručně nemožná Úroveň 3 – znalostní báze • Ručně nelze vyhotovit • Akutní potřeba softwarové podpory editace KEG - 26.3.2003
Stepper - požadavky na software • Odbourat ruční vyhotovení dokumentu • Skrýt XML zápis • Automatické vytvoření XLink odkazů • Umožnit sledování vývoje znalostního bloku napříč úrovněmi • Export do výstupního formátu KEG - 26.3.2003
Charakteristika Stepperu • Programovací jazyk - Java • Vlastní DTD i XML parser • Částečná podpora XLink/XPointer • Zahrnuje XSLT procesor XALAN • Vlastní procesor XKBT pravidel KEG - 26.3.2003
Stepper – Uživatelský interface Úroveň 1 - vyznačení znalostních bloků KEG - 26.3.2003
Stepper – Uživatelský interface Úrovně 2 .. n – upřesnění sémantické struktury KEG - 26.3.2003
Pravidla Transformační pravidla (XKBT) • Definují povolené transformace znalostního bloku při přechodu do následující úrovně • Typy pravidel - dekompoziční, agregační apod. Pravidla pro úpravu vazeb mezi atributy v rámci jedné úrovně • XML/DTD architektura se tomuto problému nevěnuje a ani XML schémata nejsou ideální • Zjednodušuje doplňování hodnot atributů • Pomáhá udržovat konzistenci úrovně KEG - 26.3.2003
Pravidla • Systematická taxonomie transformačních pravidel i pravidel pro úpravu vazeb atributů • Modul schopný načítat a aplikovat oba typy pravidel • Integrovaný editor pravidel KEG - 26.3.2003
XKBT vs. XSLT Transformační jazyk XKBT (XML knowledge block transformation) • XKBT - jazyk určený k transformaci dokumentů XML (obdobně jako XSLT) • Na rozdíl od XSLT je kladen důraz na řízenou transformaci • Zaměřen na transformaci znalostí tzn. bloků, které je často nutné během transformace interpretovat doménovým expertem KEG - 26.3.2003
Pohled napříč úrovněmi Dva možné náhledy • Dohledávání všech zdrojových pasáží v textu pro zvolenou elementární část modelu • Dohledávání všech částí modelu pro určitou pasáž v textu KEG - 26.3.2003
Možnosti využití Transformace textových dokumentů • Aplikovatelné na dokumenty s podobnými vlastnostmi jako mají LDP • V případě LDP existuje několik formálních modelů založených na XML – GLIF3, Asgaard Transformace mezi modely pro zachycování znalostí • Zrychluje proces transformace (v případě existence odpovídajících sad pravidel) • Při úpravách v jednom modelu lze snadno najít dopad změn i na druhý model • Sdílení nástrojů pro reprezentaci znalostí KEG - 26.3.2003
Plány do budoucna • Formalizace LDP pro léčbu NAP • Testování metodiky na modelu Asgaard • Vývoj dalších modulů (např. reprezentace rozhodovacích struktur) KEG - 26.3.2003