90 likes | 224 Views
Infrastruktura pro dotazov á n í nad s é mantick ý mi daty. Ji ří Dokulil, Jakub Yaghob, Filip Zavoral Katedra softwarov é ho in ž en ý rstv í, MFF UK Praha {Jiri.Dokulil,Jakub.Yaghob,Filip.Zavoral}@mff.cuni.cz. Motivace. sémantický web neexistuje kdyby tak úžasná věc existovala ...
E N D
Infrastruktura pro dotazovánínad sémantickýmidaty Jiří Dokulil, Jakub Yaghob, Filip Zavoral Katedra softwarového inženýrství, MFF UK Praha {Jiri.Dokulil,Jakub.Yaghob,Filip.Zavoral}@mff.cuni.cz
Motivace • sémantický web neexistuje • kdyby tak úžasná věc existovala ... • neexistuje infrastruktura pro provozování • uložení dat a metadat, dotazovací nástroje, zpracování odpovědí, protokoly, bezpečnost, ... • datový stoh – úložiště pro RDF data • číslo entity, typ a hodnota atributu, zdroj, validita, relevance • subjekt – predikát – objekt, reifikace • kontextová ontologie • obecné rozhraní • možnost použití libovolného datového úložiště
Importéry dat a metadat • importéry dat • rozhraní pro import dat • konverzní filtry (databáze, XML, web, ...) • fyzická konverze - do podoby zpracovatelné datovým úložištěm • logická konverze - do tvaru odpovídajícímu metadatům • vyhledávače - spojují sémantický web s webem • Egothor - modulární koncepcí umožňuje doplnit moduly pro spolupráci datovým úložištěm • importéry metadat • aktualizace metadat
Manuální a automatické importéry • manuální importéry • exportní filtry různých datových zdrojů • explicitně naprogramované • automatické importéry • ohromné množství nestrukturovaných dat • framework pro heuristické, statistické a pravděpodobnostní algoritmy • vize: umělá inteligence • spolupráce s UI AV • vyhledávač Egothor • modul pro automatické odvozování sémantiky na základě stažených dat.
Dotazovače • rozhraní pro dotazy a získávání odpovědí • uživatel typicky nezná strukturu dat • rozsáhlá a dynamická • dotazovací moduly • prohlížeč dat řízený sémantikou (Tykadlo) • SPARQL • vícekriteriální dotazovač • vize: dotazy v přirozeném jazyce, lingvistické metody • metody umělé inteligence: 'ukažte, data, co je na vás zajímavého'.
Exekutory • 'výsledek dotazu' lze interpretovat různými způsoby • tradiční reprezentace vázána na použitý dotazovač • Tykadlo: propojené html stránky • vyhledávač: webové odkazy s popisem • SPARQL: řádky n-tic • exekutory • zavedení procesních modelů • úkol exekutoru: provést sémantickou akci • interakce dat získaných dotazovačem s ostatním světem • atomické exekutory lze skládat • orchestraci provádí dirigent • vzájemné propojení exekutorů za účelem dosažení funkčnosti
Závěr • a na tom všem pracujeme ... • ... stay tuned
Infrastructure for querying semantic data Jiří Dokulil, Jakub Yaghob, Filip Zavoral Dept. of Software Engineering, MFF UK Praha {Jiri.Dokulil,Jakub.Yaghob,Filip.Zavoral}@mff.cuni.cz • Yaghob J., Zavoral F.: Budování infrastruktury sémantického webu, ITAT 2006 • Dokulil J.: Transforming Data from DataPile Structure into RDF, Dateso, Desná, 2006 • Dokulil J.: Použití relačních databází pro vyhodnocení SPARQL dotazů, ITAT 2006 • Yaghob J., Zavoral F.: Semantic Web Infrastructure using DataPile, Web Intelligence, Hong Kong, 2006 • Dokulil J.: Evaluation of SPARQL queries using relational databases, 5th Intl. Semantic Web Conference, Athens, USA, 2006