280 likes | 405 Views
Preh ľad prístupov k reprezentácii ontológii pomocou relačných databáz a prekladu dopytov. Richard Veselý. Agenda. Úvod Reprezentácia Preklad Moja práca Zhrnutie. Úvod a motivácia. Potreba uchovávať veľké množstvo dát Snaha pristupovať k dátam efektívne Možnosť formulácie dopytov.
E N D
Prehľad prístupov k reprezentácii ontológii pomocou relačných databáz a prekladu dopytov Richard Veselý
Agenda • Úvod • Reprezentácia • Preklad • Moja práca • Zhrnutie
Úvod a motivácia • Potreba uchovávať veľké množstvo dát • Snaha pristupovať k dátam efektívne • Možnosť formulácie dopytov
Reprezentácia • Typ • Prístupy • Riešenia
Reprezentácia – XML • XML • Výhody • Všeobecná reprezentácia • Čitateľné človekom (?) • Možnosť transformácie na vizuálnu reprezentáciu (XSLT) • Dopytovanie pomocou existujúcich jazykov (XPath, XQuery, XPointer, …) • Nevýhody • Neškálovateľné a neefektívne • Neexistujúca referenčná integrita • Pri dopytovaní nutnosť čítať všetky dáta sekvenčne • Nemožnosť zdieľaného prístupu
Reprezentácia – RDBMS • Relačná databáza • Výhody • Škálovateľnosť • Efektívnosť prístupu • Distribuovateľnosť • Možnosť zdieľaného prístupu k dátam • Udržiavateľnosť, integrita a bezpečnosť • Nevýhody • Nutnosť návrhu efektívneho fyzického modelu • Obtiažnosť prekladu niektorých typov dopytov (v závislosti od návrhu reprezentácie)
Reprezentácia – Objektový model • Objektový model • Výhody • Abstrakcia nad dátovým úložiskom • Dopytovanie v réžii nižšej vrstvy (ak je použité úložisko) • Nevýhody • Vysoká pamäťová náročnosť (v závislosti od spôsobu reprezentácie v pozadí)
Reprezentácia – prístupy • Horizontal DB • Vertical table • Horizontal class • Table per property • Hybridný prístup • Špecifický prístup
Reprezentácia – Horizontal DB • Horizontálna schéma – jedna „univerzálna“ tabuľka • Riadok – jednotlivec • Veľké množstvo stĺpcov, nízka hustota
Reprezentácia – Vertical table • Všeobecná reprezentácia • RDF trojica(S-P-O) • Pri každom dopyte nutné prehľadávať celú databázu • Joiny obzvlášť drahé
Reprezentácia – Horizontal class • Podobný prístup ako v prípadne horizontal DB • Každá trieda má svoju tabuľku • Zodpovedá entitno-relačnému prístupu
Reprezentácia – Table per property • Každá vlastnosť vo vlastnej tabuľke • Property (Subject, Object) • Inštančné dopyty veľmi drahé (podobne ako pri vertikálnom prístupe)
Reprezentácia – riešenia • Množstvo riešení • Sesame, Jena, Kowari, RDFSuite, Inkling, rdfDB, RDFStore, EOR, Redland, RDF Gateway, TRIPLE, KAON, Cerebra, Empolis k42, Ontopia Knowledge Suite a iné
Reprezentácia – Sesame • Dopytovací jazyk – RQL (SeRQL) • Fyzické dátové úložisko – ORDBMS • Podporuje odvodzovanie • Podporuje udržiavanie • Exportný formát – RDF
Reprezentácia – Jena • Dopytovací jazyk – RDQL • Fyzické dátové úložisko – In-memory alebo DB • Podporuje udržiavanie • Exportný formát – trojice v ASCII
Reprezentácia – RDFSuite • Dopytovací jazyk – RQL • Fyzické dátové úložisko – ORDBMS • Podporuje odvodzovanie • Podporuje udržiavanie • Exportný formát – RDF
Reprezentácia – Empolis k42 • Dopytovací jazyk – TMQL • Fyzické dátové úložisko – DBMS • Podporuje odvodzovanie • Podporuje udržiavanie • Exportný formát – Topic Maps (XTM)
Preklad • Transformácia zdrojovej reprezentácie na cieľovú • Figuruje ako mostmedzivrstvami • Množstvo jazykov • SeRQL, SPARQL, RQL, RDQL, RDFQL, SquishQL, RDFPath, Versa, Triple, DAML+OIL, TMQL, Tolog a iné
Preklad – riešenia • S dôrazom na zdrojovú reprezentáciu • Špecificiká formulácia dopytov (napr. v prirodzenom jazyku) • S dôrazom na cieľovú reprezentáciu • Preklad na konkrétnu fyzickú reprezentáciu (napr. SQL)
Preklad – problémy • Vyjadrovacia sila jazykov • Problematické jazykové konštrukcie (napr. OPTIONAL blok v SPARQL) • Odlišná paradigma • Grafy, stromy
Moja práca • Všeobecná reprezentácia • Dátové úložiská • Inteligentné cachovanie • Optimalizácia
Reprezentácia • Relačná databáza • Kombinovaný špecifický model • Schéma reflektujúca OWL • Objektový model • Podpora ľubovoľného úložiska • Podpora pre import a export • Abstrakcia nad úložiskom
Dátové úložiská • Databázové • Reprezentácia dát v relačnej databáze • Databázové referencie • Hybridné • Reprezentácia schémy ontológie v pamäti • Inštančné dáta uchovávané v relačnej databáze • Hybridné referencie • Shallow lookup • Podpora cachovania
Inteligentné cachovanie • Inštančná vyrovnávacia pamäť • Read • Urýchľuje lookup • ReadWrite • Urýchľuje lookup a zápis • Garantuje integritu a synchronizáciu • Sleduje stav použitia a synchronizuje v závislosti od vyťaženia (synchronization threshold)
Optimalizácia • Vzhľadom na bežné scenáre použitia • vkladanie nových dát, dopytovanie a iné • Shallow lookup, safety lookup • Bulk insert (agregácia na úrovni sync listov) • Export
Budúca práca • Rozšírenie reprezentácie (OWL Lite/DL) a porovnanie prístupov • Reprezentácia dopytov pomocou grafov • Preklad zo zdrojovej reprezentácie (SeRQL, SPARQL a iné) na cieľovú (SQL, ale aj experiementálne – prirodzený jazyk)
Zhrnutie • Veľké množstvo dát, škálovateľnosť • Dopytovanie – preklad (SomeQL SQL) • Use case optimalizácia • Doménovo špecifické úložisko
Použitá literatúra • Mota, L., Botelho, L., Mendes, H., Lopes, A. 2003. O3F: an Object Oriented Ontology Framework. • Wood, D., Gearon, P., Adams, T. 2005. Kowari: A Platform for Semantic Web Storage and Analysis. • Vysniauskas, E., Nemuraite, L. 2006. Transforming ontology representation from OWL to relational database. • Magkanaraki, A. et al. 2002. Ontology storage and querying. • Trissl, S., Leser, U. 2005. Querying ontologies in relational database systems. • Bechhofer, S., Horrocks, I., Turi, D. 2005. The OWL Instance Store: System Description. • Mei, J., Ma, L., Pan, Y. 2006. Ontology Query Answering on Databases. • Pan, Z., Heflin, H. 2003. DLDB: Extending Relational Databases to Support Semantic Web Queries. • Parvatikar, P., Portwin, K. 2006. Scaling Jena in a commercial environment: The Ingenta MetaStore Project. • Roldan-Garcia, M., Aldana-Montes, J. F. 2005. A Tool for Storing OWL Using Database Technology. • Magkanaraki, A. et al.2002. Benchmarking RDF Schemas for the Semantic Web. • Alexaki, S. et al. 2001. On Storing Voluminous RDF Descriptions: The case of Web Portal Catalogs. • Chebotko, A., Shiyong, L., Hasan, M. J., a Farshad, F. 2006.Semantics Preserving SPARQL-to-SQL Query Translation for Optional Graph Patterns.