180 likes | 306 Views
OGSA DAI Systém pre prístup ku dátam a dátovú integráciu. Marek Ciglan Ústav informatiky, Slovenská akadémia vied. Motivácia. Rôzny užívatelia/aplikácie používajú rôzne frmáty pre uchovávanie dát Jednoduché textové súbory XML databázy Relačné databázy PostgreSQL Oracle DB2 MySql
E N D
OGSA DAISystém pre prístup ku dátam a dátovú integráciu Marek Ciglan Ústav informatiky, Slovenská akadémia vied
Motivácia • Rôzny užívatelia/aplikácie používajú rôzne frmáty pre uchovávanie dát • Jednoduché textové súbory • XML databázy • Relačné databázy • PostgreSQL • Oracle • DB2 • MySql • Zložité pracovať s veľkým počtom rôznorodých dátových formátov • Zložité integrovať dáta z rôznych, heterogénnych zdrojov
OGSA DAI - Prehľad • Podporuje rôzne typy dátových modelov • Súvory • Relačné databázy • XML databázy • Prístup k dátam cez jednotné interfacy • Rozširovateľný systém pre integráciu dátových zdrojov v gridovom prostredí • Poskytuje metadáta o dátových zdrojoch, ktoré sprostredkuváva • Zjednodušuje integráciu dát z rôznych dátových zdrojov
Aktivity nad dátovými zdrojmi • Aktivity nad relačnými databázami • Vykonanie SQL dotazu • Vykonanie SQL update príkazu • … • Aktivity nad XML databázami • Vykonanie XPath dotazu na XML dtabázov • Vykonanie XUpdate príkazu na XML dtabázov • … • Aktivity nad súbormi • Prístup k adresárom • Čítanie dát zo súboru • Manipulácia so súbormi v adresári • Zápis do súboru
Aktivity doručovania dát • Získanie dát z URL • Dodanie dát na URL • Doručenie dát na GridFTP server • Získanie dát z GridFTP servera • Doručenie výsledkov aktivít do streamov • …
Transformačné aktivity • ZIP kompresia dát • GNU-ZIP kompresia dát • GNU-ZIP dekompresia dát • XSLT transformácia dát • Rozloženie jediného bloku na viacero na základe separátorov • Agregovanie viacerých blokov do jedného
Dátová Integrácia MySql XML database PostgreSQL Text File Oracle Data Warehouse
Dátová Integrácia MySql XML database PostgreSQL Text File Ako previesť integráciu z týchto heterogénnych dátových zdrojov do centrálneho dátového skladu ? Oracle Data Warehouse
Dátová Integrácia OGSA - DAI MySql XML database PostgreSQL Text File Oracle Data Warehouse
Dátová Integrácia OGSA - DAI MySql XML database PostgreSQL Text File Select data Write data into file Compress file Transfer zip file Oracle Data Warehouse
Dátová Integrácia OGSA - DAI MySql XML database PostgreSQL Text File Select data Read subset of file Write data into file Transform Compress file Compress file Transfer zip file Transfer zip file Oracle Data Warehouse
Dátová Integrácia OGSA - DAI MySql XML database PostgreSQL Text File Select data Read subset of file Select data Read subset of file Write data into file XLST Transform Write data into file Transform Compress file Compress file Compress file Compress file Transfer zip file Transfer zip file Transfer zip file Transfer zip file Oracle Data Warehouse
Dátová Integrácia • Ako vykonávať dátovú integráciu ? • Pripraviť špecializovanú JAVA aplikáciu napojenú na OGSA-DAI. • Použiť OGSA-DAI perform dokumenty • Perform Dokumenty • XML dokumenty • Popisujú operácie ktoré si prajeme vykonať nad dátovými zdrojmi <sqlQueryStatement name="myQuery"> <expression> select * from littleblackbook where id=10 </expression> <webRowSetStream name="myQueryOutput"/> </sqlQueryStatement>
Perform dokumenty • Integrácia aktivít v perform dokumente <sqlQueryStatement name="myQuery"> <expression> select * from littleblackbook where id<100 </expression> <webRowSetStream name="myQueryOutput"/> </sqlQueryStatement> <deliverToGDT name="deliverQueryResults"> <fromLocal from="myQueryOutput"/> <toGDT streamId="otherServiceInput" mode="full"> http://localhost:8080/ogsa/services/ogsadai/SomeDAIService </toGDT> </deliverToGDT>
Dátová bezpečnosť • Mapovanie rolí – proces autorizácie klientskej požiadavky pre prístup k dátovému zdroju • Dvojfázový proces: • Kontrola, či je užívateľ oprávnený pristupovať k dátovému zdroju • Získanie užívateľského mena a hesla (role) ktoré bude použité na prístup k dátovému zdroju • role map dokument obsahuje informácie potrebné pre tento proces
Dátová bezpečnosť • Jednoduchý OGSA-DAI Role Map dokument <DatabaseRoles> <Database name="jdbc:mysql://host:6502/otherData"> <User dn="No Certificate Provided" userid="myUser" password="123"/> <User dn="/C=UK/O=eScience/OU=Aspatria/L=AeSC/CN=tom“ userid="superUser" password="myPassword"/> </Database> </DatabaseRoles>
Záver Vďaka za pozornosť http://www.ogsadai.org.uk http://www-unix.globus.org/toolkit/docs/development/3.9.5/techpreview/ogsadai/