210 likes | 427 Views
Концептуальные модели представления гетерогенных данных данных. Гарипов Олег E-mail: oleg.garipov@gmail.com. Содержание доклада. Что есть концептуальное моделирование. Виды концептуальных моделей данных. Достоинства и недостатки различных КМД. Чему должны удовлетворять новые модели?.
E N D
Концептуальные модели представления гетерогенных данныхданных ГариповОлег E-mail: oleg.garipov@gmail.com
Содержание доклада Что есть концептуальное моделирование Виды концептуальных моделей данных Достоинства и недостатки различных КМД Чему должны удовлетворять новые модели?
Концептуальное моделирование • КМ - деятельность формального описания некоторых аспектов физического и социального мира вокруг нас для понимания этих аспектов и коммуникации [Малопулос] • Концептуальное моделирование (КМ) предметной области (ПО) – моделирование понятий (концептов) и концептуальных структур ПО [Когаловский]
Концептуальное моделирование • Концептуальная модель ПО в технологиях БД - это концептуальная схема (КС) базы данных • Инструмент представления концептуальной схемы - концептуальная модель данных.
Концептуальные модели данных • Модель «сущностей-связей »(ER-модель) ( Чен). • Модель «объектов-ролей» ORM ( Фалкенберг) / NIAM ( Найсен) • Расширенная реляционная модель RM/T ( Кодд ) • Функциональная модель DAPLEX ( Шипмана). • Семантические сети • Онтологии • И т.д
ER – модель • Предложена Ченом в 1972 году • Наиболее распространенная модель. • Фрагменты ПО представляются как множество сущностей с множеством связей. • Удобный способ представления структуры данных • Недостатки • Отсутствие аппарата формальных преобразований • Чувствительна к изменению атрибутов • Влияет на реализацию • Далека от естественного языка
Модель Object-Role (ORM) • Модель, основанная на фактах • Факты рассматриваются как отношения • Недостатки: • Факты из взаимосвязей фактов не вытекает взаимосвязь типов объектов • Семантически не полная модель • Плюсы: • Близки к естественному языку • Понятны не техническим специалистам • Богатая графическая нотация • Семантическая стабильность Более подробно: www.orm.com
Функциональные модели • Первые разработки Sibleyи Kershberg[1977] • Модель Shipman’а. Язык DAPLEX [1979] • Разработка языка FDL. Poulovassilis[1990]
Функциональная модель СУЩНОСТИ И ОТНОШЕНИЯ - ФУНКЦИИ
Функциональные модели • Достоинства: • Позволяет смотреть рассматривать объекты по отдельности и в «совокупности» • Динамическая • Строгая типизация • Математическая основа • Недостатки • Тяжелая для понимания • Необходимо знание теории функций
Модели на семантических сетях • В основе моделей – семантическая сеть. • Общий случай: 𝑆=(𝑂,𝑅1,𝑅2,…,𝑅𝑘)
Пример семантической сети Расширенная семантическая сеть: Every parents loves their childs
Семантические сети • Достоинства: • Наглядность • Возможность описывать данные в виде связей структур • Преобразования в логику первого порядка • Недостатки • Трудное графич. представление больших сетей • Трудность обработки информации • Трудность получения знания • Сложность поиска в сети
Онтологии • МакГраф: онтология – теория о существующих понятиях, независимых от определенного языка или языков, которым они описаны. • 2 вида • Формальные • Лингвистические
Проблемы интеграции средствами онтологий • Конфликты измерений • «Цена продукта» ( Доллар vs. Рубль ) • Конфликты контекста • «Вес человека» (зависит от времени взвешивания) • Конфликты представления • «Студент» ( «Имя» + «Фамилия» vs. «ФИО» ) • Конфликты имен • «Статус человека» ( тип занятости vs. семейный статус)
Онтологии • Достоинства: • Распределенное создание • Возможность трактовки понятий с различных точек зрения • Недостатки • Сохранение целостности в процессе развития • Сложность интеграции • Неточность, избыточность информации
Требования к модели гетерогенных данных • Строгая типизация • Легкость развития модели • Независимость от реализации ИС • Совместить модель данных и модель знаний • Модель данных должна иметь удобную нотацию представления.
Требования к моделям гетерогенных данных • Должны существовать механизмы проверки целостности, непротиворечивости и избыточности данных • Должна позволять рассматривать данные с различных точек зрения • Повторное использование.
The End • Спасибо! • Вопросы? Гарипов Олег Oleg.garipov@gmail.com