130 likes | 276 Views
Report from Znalosti 200 9. Michal Barla, Mari á n Šimko, Marko Div é ky, Tomáš Kramár, Mária Bieliková. Znalosti 2009. Kedy 4. – 6. 2. 2008 Kde FIT VUT Brno Kto
E N D
Report from Znalosti 2009 Michal Barla, Marián Šimko, Marko Divéky, Tomáš Kramár, Mária Bieliková
Znalosti 2009 • Kedy • 4.– 6. 2. 2008 • Kde • FIT VUT Brno • Kto • MFF UK v Prahe, CIT TU KE, VSE Praha, FRI ZU, FIIT STU, ČVUT v Prahe, FIT VUT, UI SAV, VŠB-TU Ostrava, PF OU, PF UPJS, OSU, FI MU + firmy + Maribor + Novi Sad
Témy konferencie Znalosti, ich reprezentácie, usudzovanie, objavovanie a získavanie znalostí, vyhľadávanie informácií, extrakcia vlastností z dát, modelovanie podobnosti, spracovanie prirodzeného jazyka, znalostné systémy, všadeprítomná inteligencia, strojové učenie, multi-agentové technológie, metaznalosti, sémantická anotácia, extrakcia informácií z textu, sémantický web, ontológie, webové a gridové služby, znalostné vzory, jazyky vzorov, znalosti a bezpečnosť, sociálne siete a kolaborácia na webe, rozvoj štandardov pre web, znalostný manažment, e-learning, e-business, e-government, webové podporné systémy pre odporúčanie, sprístupňovanie informácií, navigáciu, ...
Pozvané prednášky • Mirjana Ivanović, Zoran Budimac: Applications of Case-Based Reasoning • Jozef Kelemen: Znalosti v kontextoch: od remeselníka cez znalostné systémy k znalostnému manažmentu • Tatjana Welzer: Cultural and Security Issues in Knowledge Management
UISI@FIIT a Znalosti • PC chairs: Prof. Návrat, Mgr. Chudá, PhD. • Marko Divéky, Mária Bieliková: An Approach to Interactive Storytelling and its Application to Computer Role-playing Games • Marián Šimko, Mária Bieliková: Automatizované získavanie metadát výučbového obsahu a vzťahov medzi konceptmi • Tomáš Kramár, Michal Barla: Dolovanie vzorov používania webového sídla (poster)
Mirjana Ivanović: Case-Based Reasoning • Riešenie nových problémov prispôsobením riešení, ktoré v minulosti zafungovali pre podobné problémy • Ako reprezentovať prípady (problém, riešenie) • Ako určovať podobnosti problémov
Použitie CBR • Klasifikácia • Diagnostika – cost sensitive classification with incomplete information • Konfigurácia a návrh • Konfigurácia – konštrukcia artefaktu z daných komponentov • Návrh – istý stupeň kreativity, niektoré komponenty nie sú známe • Podpora rozhodovania • Vyhľadávanie informácií
Extrakcia informácií z webu • Knoth, P. et al: Towards a Framework for Comparing Automatic Term Recognition Methods • 2 fázy: • Lingvistická – POS tagy kandidáti na termy • Štatistická, 2 druhy metód • Termhood – založené na frekvencii výskytov • Unithood – pre komplexné termy zložené z viacerých slov, meria sa sila kolokácie
Extrakcia informácií z webu • Termhood • Iba doménový korpus: TF, TFIDF, RIDF • Aj Background korpus: Weirdness, LR, GlossEx • Unithood • C-Value, LC • Ich spájanie cez voting • TFIDF + Weirdness
Užitočné odkazy? • http://code.google.com/p/jajatr • Ale dokumentáciu radšej u originálneho tvorcu knižnice • http://www.dcs.shef.ac.uk/~ziqizhang/resources/tools/jatr_v1.0.zip • Yahoo! Content analysis web services: Term Extraction (REST) • http://developer.yahoo.com/search/content/V1/termExtraction.html • http://developer.yahoo.com/search/content/V2/termExtraction.html
Extrakcia informácií z webu • Maruščák, D. et al: Unsupervised Structured Web Data and Attribute Value Extraction • Extrakcia dát z webových obchodov • Dve fázy • Zaujímavé: Automatizované vyhľadávanie dátových regiónov a záznamov cez porovnávanie DOM podstromov • Nezaujímavé: Samotná extrakcia atribútov cez regexy v extrakčnej ontológii
Webové služby • Kopecký, J. et al: Semantic Web Service Automation with Lightweight Annotations • Pekné vysvetlenie automatizácie SWS • Zjednodušenie opisov webových služieb • Pekný bottom-up prístup k tvorbe sémantických webových a RESTful služieb • WSMO-Lite – anotácia pre WSDL • MicroWSMO – rozšírenie hRESTS microformat
Sociálne siete • Laclavík, M. et al: Sociálne siete a e-mail • Extrakcia sociálnej siete ako ohodnoteného orientovaného grafu z mailovej komunikácie • Spracujú thunderbird alebo priamo smtp server záznamy • Spolu s ďalšími atribútmi (organizácia, lokalita) • Postavené na Map-Reduce architektúre (Hadoop)