1 / 28

Preh ľad prístupov k reprezentácii ontológii pomocou relačných databáz a prekladu dopytov

Preh ľad prístupov k reprezentácii ontológii pomocou relačných databáz a prekladu dopytov. Richard Veselý. Agenda. Úvod Reprezentácia Preklad Moja práca Zhrnutie. Úvod a motivácia. Potreba uchovávať veľké množstvo dát Snaha pristupovať k dátam efektívne Možnosť formulácie dopytov.

tyne
Download Presentation

Preh ľad prístupov k reprezentácii ontológii pomocou relačných databáz a prekladu dopytov

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Prehľad prístupov k reprezentácii ontológii pomocou relačných databáz a prekladu dopytov Richard Veselý

  2. Agenda • Úvod • Reprezentácia • Preklad • Moja práca • Zhrnutie

  3. Úvod a motivácia • Potreba uchovávať veľké množstvo dát • Snaha pristupovať k dátam efektívne • Možnosť formulácie dopytov

  4. Reprezentácia • Typ • Prístupy • Riešenia

  5. Reprezentácia – XML • XML • Výhody • Všeobecná reprezentácia • Čitateľné človekom (?) • Možnosť transformácie na vizuálnu reprezentáciu (XSLT) • Dopytovanie pomocou existujúcich jazykov (XPath, XQuery, XPointer, …) • Nevýhody • Neškálovateľné a neefektívne • Neexistujúca referenčná integrita • Pri dopytovaní nutnosť čítať všetky dáta sekvenčne • Nemožnosť zdieľaného prístupu

  6. Reprezentácia – RDBMS • Relačná databáza • Výhody • Škálovateľnosť • Efektívnosť prístupu • Distribuovateľnosť • Možnosť zdieľaného prístupu k dátam • Udržiavateľnosť, integrita a bezpečnosť • Nevýhody • Nutnosť návrhu efektívneho fyzického modelu • Obtiažnosť prekladu niektorých typov dopytov (v závislosti od návrhu reprezentácie)

  7. Reprezentácia – Objektový model • Objektový model • Výhody • Abstrakcia nad dátovým úložiskom • Dopytovanie v réžii nižšej vrstvy (ak je použité úložisko) • Nevýhody • Vysoká pamäťová náročnosť (v závislosti od spôsobu reprezentácie v pozadí)

  8. Reprezentácia – prístupy • Horizontal DB • Vertical table • Horizontal class • Table per property • Hybridný prístup • Špecifický prístup

  9. Reprezentácia – Horizontal DB • Horizontálna schéma – jedna „univerzálna“ tabuľka • Riadok – jednotlivec • Veľké množstvo stĺpcov, nízka hustota

  10. Reprezentácia – Vertical table • Všeobecná reprezentácia • RDF trojica(S-P-O) • Pri každom dopyte nutné prehľadávať celú databázu • Joiny obzvlášť drahé

  11. Reprezentácia – Horizontal class • Podobný prístup ako v prípadne horizontal DB • Každá trieda má svoju tabuľku • Zodpovedá entitno-relačnému prístupu

  12. Reprezentácia – Table per property • Každá vlastnosť vo vlastnej tabuľke • Property (Subject, Object) • Inštančné dopyty veľmi drahé (podobne ako pri vertikálnom prístupe)

  13. Reprezentácia – riešenia • Množstvo riešení • Sesame, Jena, Kowari, RDFSuite, Inkling, rdfDB, RDFStore, EOR, Redland, RDF Gateway, TRIPLE, KAON, Cerebra, Empolis k42, Ontopia Knowledge Suite a iné

  14. Reprezentácia – Sesame • Dopytovací jazyk – RQL (SeRQL) • Fyzické dátové úložisko – ORDBMS • Podporuje odvodzovanie • Podporuje udržiavanie • Exportný formát – RDF

  15. Reprezentácia – Jena • Dopytovací jazyk – RDQL • Fyzické dátové úložisko – In-memory alebo DB • Podporuje udržiavanie • Exportný formát – trojice v ASCII

  16. Reprezentácia – RDFSuite • Dopytovací jazyk – RQL • Fyzické dátové úložisko – ORDBMS • Podporuje odvodzovanie • Podporuje udržiavanie • Exportný formát – RDF

  17. Reprezentácia – Empolis k42 • Dopytovací jazyk – TMQL • Fyzické dátové úložisko – DBMS • Podporuje odvodzovanie • Podporuje udržiavanie • Exportný formát – Topic Maps (XTM)

  18. Preklad • Transformácia zdrojovej reprezentácie na cieľovú • Figuruje ako mostmedzivrstvami • Množstvo jazykov • SeRQL, SPARQL, RQL, RDQL, RDFQL, SquishQL, RDFPath, Versa, Triple, DAML+OIL, TMQL, Tolog a iné

  19. Preklad – riešenia • S dôrazom na zdrojovú reprezentáciu • Špecificiká formulácia dopytov (napr. v prirodzenom jazyku) • S dôrazom na cieľovú reprezentáciu • Preklad na konkrétnu fyzickú reprezentáciu (napr. SQL)

  20. Preklad – problémy • Vyjadrovacia sila jazykov • Problematické jazykové konštrukcie (napr. OPTIONAL blok v SPARQL) • Odlišná paradigma • Grafy, stromy

  21. Moja práca • Všeobecná reprezentácia • Dátové úložiská • Inteligentné cachovanie • Optimalizácia

  22. Reprezentácia • Relačná databáza • Kombinovaný špecifický model • Schéma reflektujúca OWL • Objektový model • Podpora ľubovoľného úložiska • Podpora pre import a export • Abstrakcia nad úložiskom

  23. Dátové úložiská • Databázové • Reprezentácia dát v relačnej databáze • Databázové referencie • Hybridné • Reprezentácia schémy ontológie v pamäti • Inštančné dáta uchovávané v relačnej databáze • Hybridné referencie • Shallow lookup • Podpora cachovania

  24. Inteligentné cachovanie • Inštančná vyrovnávacia pamäť • Read • Urýchľuje lookup • ReadWrite • Urýchľuje lookup a zápis • Garantuje integritu a synchronizáciu • Sleduje stav použitia a synchronizuje v závislosti od vyťaženia (synchronization threshold)

  25. Optimalizácia • Vzhľadom na bežné scenáre použitia • vkladanie nových dát, dopytovanie a iné • Shallow lookup, safety lookup • Bulk insert (agregácia na úrovni sync listov) • Export

  26. Budúca práca • Rozšírenie reprezentácie (OWL Lite/DL) a porovnanie prístupov • Reprezentácia dopytov pomocou grafov • Preklad zo zdrojovej reprezentácie (SeRQL, SPARQL a iné) na cieľovú (SQL, ale aj experiementálne – prirodzený jazyk)

  27. Zhrnutie • Veľké množstvo dát, škálovateľnosť • Dopytovanie – preklad (SomeQL  SQL) • Use case optimalizácia • Doménovo špecifické úložisko

  28. Použitá literatúra • Mota, L., Botelho, L., Mendes, H., Lopes, A. 2003. O3F: an Object Oriented Ontology Framework. • Wood, D., Gearon, P., Adams, T. 2005. Kowari: A Platform for Semantic Web Storage and Analysis. • Vysniauskas, E., Nemuraite, L. 2006. Transforming ontology representation from OWL to relational database. • Magkanaraki, A. et al. 2002. Ontology storage and querying. • Trissl, S., Leser, U. 2005. Querying ontologies in relational database systems. • Bechhofer, S., Horrocks, I., Turi, D. 2005. The OWL Instance Store: System Description. • Mei, J., Ma, L., Pan, Y. 2006. Ontology Query Answering on Databases. • Pan, Z., Heflin, H. 2003. DLDB: Extending Relational Databases to Support Semantic Web Queries. • Parvatikar, P., Portwin, K. 2006. Scaling Jena in a commercial environment: The Ingenta MetaStore Project. • Roldan-Garcia, M., Aldana-Montes, J. F. 2005. A Tool for Storing OWL Using Database Technology. • Magkanaraki, A. et al.2002. Benchmarking RDF Schemas for the Semantic Web. • Alexaki, S. et al. 2001. On Storing Voluminous RDF Descriptions: The case of Web Portal Catalogs. • Chebotko, A., Shiyong, L., Hasan, M. J., a Farshad, F. 2006.Semantics Preserving SPARQL-to-SQL Query Translation for Optional Graph Patterns.

More Related