1 / 28

СИСТЕМА МАССОВОЙ ИНТЕГРАЦИИ БАЗ ДАННЫХ: ФУНКЦИОНАЛЬНЫЕ ВОЗМОЖНОСТИ И СПОСОБ РЕАЛИЗАЦИИ

Институт прикладной математики им . М.В.Келдыша РАН. СИСТЕМА МАССОВОЙ ИНТЕГРАЦИИ БАЗ ДАННЫХ: ФУНКЦИОНАЛЬНЫЕ ВОЗМОЖНОСТИ И СПОСОБ РЕАЛИЗАЦИИ. В.Н. Коваленко, Е.И. Коваленко, А.Ю. Куликов. Постановка задачи массовой интеграции.

teneil
Download Presentation

СИСТЕМА МАССОВОЙ ИНТЕГРАЦИИ БАЗ ДАННЫХ: ФУНКЦИОНАЛЬНЫЕ ВОЗМОЖНОСТИ И СПОСОБ РЕАЛИЗАЦИИ

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Институт прикладной математики им. М.В.Келдыша РАН СИСТЕМА МАССОВОЙ ИНТЕГРАЦИИ БАЗ ДАННЫХ: ФУНКЦИОНАЛЬНЫЕ ВОЗМОЖНОСТИ И СПОСОБ РЕАЛИЗАЦИИ В.Н. Коваленко, Е.И. Коваленко, А.Ю. Куликов

  2. Постановка задачимассовой интеграции • Количество интегрируемых баз данных велико (100 и более) Аспекты интеграции: • язык массовых запросов; • управление инфраструктурой; • интеграция данных; • контроль доступа.

  3. Язык массовых запросов SELECTavg(MSK.person.salary) FROMMSK.person WHEREMSK.region=”Moscow” • Строится в терминах глобальной схемы таблиц • Формирование групп на основе метаинформации

  4. Язык запросов: состав группы SELECTavg(MSK.person.salary) FROMMSK.person WHEREMSK.region=”Москва” БД1 БД3 БД2 region: СПБ … region: Москва … region: Москва …

  5. Язык запросов: интерпретация SELECTavg(MSK_person.salary) FROM(SELECT1 UNIONSELECT2) ASMSK_person SELECTavg(MSK.person.salary) FROMMSK.person MSK.person = SELECT1 UNION SELECT2 person БД1 БД2 person: SELECT1 … person: SELECT2 …

  6. Выполнение запросов Массовый запрос Центральный сервер БД БД БД БД ВС ВС ВС

  7. Управление инфраструктурой • Объекты администрирования: • База данных • Вычислительный сервер • Удаленное выполнение операций. • На базу данных не устанавливается дополнительное ПО. • Изменения инфраструктуры не прерывают выполняющиеся запросы.

  8. Контроль доступа • Контроль доступа к: • базам данных; • глобальным таблицам и их полям; • строкам таблиц. • Правила: ИД=значение, СФД=значение, СПЕЦ=значение, РОЛЬ=значение Доступные БД Доступные таблицы

  9. Расширение OGSA-DAI/DQP • Массовые запросы и адресация групп БД • Интеграция данных на основе отображений • Динамическое формирование инфраструктуры • Балансировка нагрузки на вычислительные ресурсы • Контроль доступа

  10. PAX сервера

  11. Балансировка нагрузки SELECTavg(MSK_person.salary) FROM (SELECT1 UNIONSELECT2)ASMSK_person ВС1 avg ВС1 ВС2 ВС2 UNION ВС3 БД1 БД2 SELECT1 SELECT2

  12. Расширение OGSA-DAI/DQP БД БД БД БД OGSA-DAI OGSA-DAI OGSA-DAI Измененный OGSA-DAI/DQP

  13. Выбор подмножества БД

  14. Интеграция данных GAV LAV G  Q(D1, … DM} Query(G, …)  Query(Q(D1,..DM),…) Dnew: G  Q(D1, … DM, Dnew) D.L  Q(G1, .. GN) Query(G,..)  TransformedQuery(D1, ..DM) Dnew: Dnew.L -> Q(G1, .. GN)

  15. Ограничение Global As View GAV G -> Q(D1, …DN) • состав баз данных фиксирован • позволяет выделить подзапросы к интегрируемым БД Ограничение GAV G -> Q1(D1) U … U QN(DN)

  16. Понятие группы БД

  17. Формирование группы БД <Тип = «Завод» AND Регион = «Москва»> Название = A Тип = завод Регион = Москва … Название = B Тип = завод Регион = Москва … Название = C Тип = больница Регион = Москва …

  18. Расширение языка SQL - именование схем отношений <имя_группы>.<имя_глобальной_схемы> - именование метаатрибутов <имя_группы>.<имя_метааттрибута> SELECT GroupA.G1.field, GroupA.metaattributeFROM GroupA.G1

  19. Составление массового запроса GroupA : {Dk | Имя = Институт} SELECT * FROM GroupA.G1; SELECT * FROM GroupA.G1 WHERE GroupA.Имя=‘Институт’;

  20. Пример D2 D3.L G  SELECT a, b, c FROM D1.L UNION (SELECT a, b, c FROM D2.L JOIN D3.L ON ext_id = id) G  SELECT a, b, c FROM D1.L UNION (SELECT a, b, c FROM D2.L1 JOIN D2.L2 ON ext_id = id) D2.L D1.L G

  21. Добавление базы данных

  22. Подходы к интеграции БД Физическая интеграция Виртуальная интеграция БД БД БД БД БД БД БД БД Медиатор Медиатор Центральная БД Медиатор

  23. Преобразование запроса SELECT * FROM GroupA.G1 {Group A :} → SELECT * FROM () AS GroupA.G1 GroupA.G1 JOIN GroupA.G2{}→ ) GroupA.G1 JOIN GroupB.G2{} → )

  24. Метаатрибуты в запросе Имя = Институт Регион = Москва …

  25. Метаатрибуты в запросе GroupA.G1 JOIN GroupA.G2 JOIN… → Q1(D1) U Q2(D2) U … → (a1, a2, … aN, meta1, meta2, …) - именование метаатрибутов <имя_группы>.<имя_метааттрибута>

More Related