400 likes | 578 Views
Концептуальная модель электронной библиотеки. Резниченко В.А., Проскуд и на Г.Ю. Кудим К.А. Проблемы. интеграция информации различных ЭБ; сравнение ЭБ по предоставляемой функциональности; оценка и сравнение производительности различных систем ЭБ; добавление новых типов хранимых объектов;
E N D
Концептуальная модель электронной библиотеки Резниченко В.А., Проскудина Г.Ю. Кудим К.А.
Проблемы • интеграция информации различных ЭБ; • сравнение ЭБ по предоставляемой функциональности; • оценка и сравнение производительности различных систем ЭБ; • добавление новых типов хранимых объектов; • добавление новых функциональных возможностей; • резервное копирование. RCDL’2009, г.Петрозаводск
План • Обзор и анализ некоторых известных связанных проектов: • СIDOC CRM; • FRBR и FRBRоо; • DELOS DLRM; • Информационная модель ЭБ RCDL’2009, г.Петрозаводск
Концептуальная эталонная модель СIDOC CRM РАЗРАБОТАНА Международным комитетом по документации Международного совета музеев (начиная с 1996 года). Первая ее версия была представлена в 1998 году. НАЗНАЧЕНИЕ: интеграция, посредничество и обмен информацией в области мирового культурного наследия и связанных областей. RCDL’2009, г.Петрозаводск
Сейчас модель СIDOC CRM стала стандартом ISO 21127:2006 – "Эталонная онтология для обмена информацией культурного наследия" ("A reference ontology for the interchange of cultural heritage information"). RCDL’2009, г.Петрозаводск
Цели CIDOC CRM • обмен и интеграция; • семантические определения и разъяснения; • надинституционная, абстрагированнаяот конкретного локального контекста модель. RCDL’2009, г.Петрозаводск
Также CIDOCCRM стремится служить • руководством по концептуальному моделированию дляразработчиков; • общим языком для экспертов в области культуры и IT-разработчиков; • формальным языкомдляидентификации общего информационного содержания; • ПОДДЕРЖКОЙзапросовкинтегрированным ресурсам RCDL’2009, г.Петрозаводск
Объектно-ориентированная терминология CIDOC CRM Cущность (entity)называют «классом» (class). Связь (relationship)называют «свойством» (property). Свойстваопределяют каккомбинациюобластиопределения (domain)иобластизначения (range); т.е. они привязывают экземпляр (instance)класса, который служит областью определения свойства, к экземпляру класса, который служит областью значения свойства. Атрибутытакже моделируются с помощью свойств. RCDL’2009, г.Петрозаводск
Версия 5.0.1 модели CIDOC CRM (март 2009 г.) состоит из90 классов и 148 свойств, описывающих предметы, понятия, людей, события, место, время и их отношения Две корневых сущности: • Простое значение(Primitive Value): • Число;Строка;Простое время (Time primitive) • Сущность CRM (СRM Entity): • все другие сущности универсума CIDOC CRM RCDL’2009, г.Петрозаводск
Часть иерархии классов в модели СIDOC CRM RCDL’2009, г.Петрозаводск
Часть иерархии классов СIDOC CRM, ветка – E77 Постоянная сущность RCDL’2009, г.Петрозаводск
Пример декларирования класса Е73 Информационный объект «Подкласс для:» – E28 Концептуальный объект, Е72 Легальный Объект «Суперкласс для:»– E29 Проект или процедура, E31 Документ, E33 Лингвистический объект, E36 Визуальный элемент (item) «Комментарий:» включает идентифицируемые нематериальные объекты, такие как стихи, шутки, наборы данных, изображения, тексты, мультимедийные объекты, процедурные предписания, компьютерные программы, алгоритм или математические формулы, которые имеют объективно распознаваемую структуру и зарегистрированы как единое целое. «Примеры:» Поэма А.С. Пушкина «Полтава», фильм Акиры Куросавы «Семь самураев»; уравнения Максвелла «Свойства:» – P67 может ссылаться на любой другой объект E1 Cущность CRM, (P67.1имеет типE55 Тип);P106 может состоять изE73 Информационный объект,P129имеет тему E1 Cущность CRM RCDL’2009, г.Петрозаводск
Принципы моделирования CIDOC • Открытыймир (OpenWorld) • Монотонность • Минимальность • Сокращения • Непересекаемость • Типы • Расширяемость • Охват RCDL’2009, г.Петрозаводск
Модель CIDOCCRM. Итоги (+) • формальный подход (совместимый формализмом с RDF); • обобщая все многообразие музейных коллекций и задач, модель содержит широкий набор универсальных понятий; • важную роль здесь играютвременные сущности, т.к. они связывают объекты (концептуальные илифизические) с временным диапазоном, местом и субъектами; • CIDOC CRM уже является стандартом ISO. (-) • некоторые понятия CRM разработаны неполно, например классы E39 Актор и E30 Право. RCDL’2009, г.Петрозаводск
Модель FRBR • "Функциональные требования к библиографическим записям" разработана Международной федерацией библиотечных ассоциаций и учреждений IFLA • Концептуальная ER-модель: • сущности, атрибуты, связи • Используется в качестве информационной модели в библиографических системах RCDL’2009, г.Петрозаводск
Модель FRBR различает три группы сущностей: • для описываемых объектов:произведение (work), выражение (expression), воплощение (manifestation), экземпляр (item); • для описателей-субъектов:человек (person) и организация (corporate body); • для описателей-объектов:концепт, объект, событие и место (concept, object, event, place). RCDL’2009, г.Петрозаводск
Модель FRBR RCDL’2009, г.Петрозаводск
Сущности 1-й группы FRBR Произведение (Work) – индивидуальное интеллектуальное или художественное творение Выражение (Expression) - интеллектуальная или художественная форма реализации произведения Воплощение (Manifestation) – физическая реализация выражения произведения. Воплощением может быть сборник произведений, отдельное произведение или составная часть произведения. Воплощение может представлять собой одну или несколько физических единиц. Экземпляр (Item) – один экземпляр воплощения. RCDL’2009, г.Петрозаводск
Примеры произведения (w1), выражения(e1 и e2), воплощения (m1) и экземпляра (i1): (w1)Приключения Оливера Твиста Диккенса (e1) оригинальный текст на английском языке (e2)перевод на русский язык Кривцовой (m1)роман опубликован в 1969 году в издательстве «Художественная литература» (i1) экземпляр, хранящийся в моей личной библиотеке RCDL’2009, г.Петрозаводск
Модель FRBR. Связи • Описаны все логические связи, изображенные на ER-диаграмме: • Между сущностями 1-й группы (произведение, выражение и воплощение, экземпляр); • Связи с сущностями человек и организация; • Предметные (тематические) связи. • Другие (контентные) связи между сущностями 1-й группы (произведение-произведение, выражение-выражение (два вида), произведение-выражение, воплощение-воплощение (два вида),воплощение-экземпляр, экземпляр-экземпляр, а также связи типа часть/целое для каждой сущности). RCDL’2009, г.Петрозаводск
Например, в группе связей произведение-произведение выделены такие типы связей: • имеет продолжение; • имеет приложение (сходство, соответствие); • имеет резюме (обзор, аннотацию); • имеет адаптацию (свободный перевод); • имеет преобразование (стихотворную форму); • имеет имитацию (пародию). RCDL’2009, г.Петрозаводск
Модель FRBR. Итоги (+) • предлагает универсальные библиографические записи для всех типов материалов и пользовательских задач, связанных с библиографическими ресурсами; • богатый набор атрибутов и отношений; (-) • размыты границы между сущностями произведение и выражение; • сущностей всего 10, что явно недостаточно для большинства библиотечных приложений (например, отсутствие «понимания» события). RCDL’2009, г.Петрозаводск
Модель FRBRоо FRBRoo = FRBR + CIDOC CRM FRBRoo – самостоятельный документ, в котором концепция FRBR представлена с использованием объектно-ориентированной методологии и аппарата CIDOC CRM. FRBRoo следует рассматривать как интерпретацию FRBR, а не ее новую версию илизамену. RCDL’2009, г.Петрозаводск
Дополнения FRBR благодаря СІDOC CRM Произведение: • Индивидуальное произведение (Individual Work); • Составное произведение (Complex Work); • Произведение контейнер (Container Work); • Агрегатное произведение (Aggregation Work); • Сериальное произведение (Serial Work); • Издательское произведение (PublicationWork); • Исполнительское произведение (Performance Work); • Записанное произведение (Recording Work). RCDL’2009, г.Петрозаводск
DELOS DLRM(Digital Library Reference Model) В 2006-7 гг. разработали эталонную модель ЭБ DELOS. Цель проекта – разобраться с фундаментальными понятиями, существенными объектами и их отношениями, стандартными функциональными и структурными блоками и процессами, из которых состоит универсум ЭБ. RCDL’2009, г.Петрозаводск
DELOS DLRM и понятие ЭБ: ЭБ – конкретная ЭБ с ее пользователями, правилами, содержимым, интернет-сайтом и ведущей организацией. Например: библиотека института программных систем ISS EPrints http://eprints.isofts.kiev.ua; система ЭБ – программное обеспечение, на основе которого создаются ЭБ. Например: EPrints 3.0; система управления ЭБ – программное обеспечение для создания и управления системами ЭБ. Например: система OpenDLib. RCDL’2009, г.Петрозаводск
DELOS DLRM,категории пользователей ЭБ: • конечный пользователь ЭБ; • разработчик ЭБ; • системный администратор ЭБ; • разработчик приложений для ЭБ. Соответственно DELOS DLRM имеет четыре уровня пользовательских представлений. RCDL’2009, г.Петрозаводск
В DELOS DLRM универсум ЭБ разбит на шесть областей: • контент; • пользователь; • функциональные возможности; • качество; • политики; • архитектура. RCDL’2009, г.Петрозаводск
Иерархия областей ЭБ в модели DELOS DLRM: RCDL’2009, г.Петрозаводск
Ресурс ЭБ в DELOS DLRM: • имеет идентификатор; • организован в соответствии с форматом ресурса. Формат здесь выражен онтологией. Ресурс может быть сложным и структурированным, состоять из меньших ресурсов и иметь связи с др. ресурсами; может • выражаться, напр., через информационный объект; • быть описан или дополнен информационным объектом, обычно – метаданными и аннотациями; • характеризоваться параметрами качества; • регулироваться политиками, управляющими его жизненным циклом RCDL’2009, г.Петрозаводск
Область контента ЭБ в модели DELOS DLRM RCDL’2009, г.Петрозаводск
Область контента в DELOS DLRM Информационный объект (ИО) по уровню абстракции: - произведение, - выражение, - воплощение • по связи: • - первичный ИО, • - метаданные, • - аннотация RCDL’2009, г.Петрозаводск
Область пользователя в DELOS DLRM содержит все объекты, которые являются "внешними по отношению к системе ЭБ и с ней взаимодействуют: люди и неодушевленные объекты, например, программы или физические инструменты или даже другая ЭБ может быть пользователем ЭБ". Главная сущность в этой области – актор является ресурсом, наследует все его свойства. RCDL’2009, г.Петрозаводск
Область функций в DELOS DLRM Здесь наиболее общим понятием является функция. Каждая функция является ресурсом и потому наследует все его свойства. Все функции разделены на пять классов: • доступа к ресурсам; • управления ресурсами; • совместной работы; • управления ЭБ; • настройки ЭБ. RCDL’2009, г.Петрозаводск
Модель DELOS DLRM. Итоги (+) • наибольшая полнота охвата среди существующих концептуальных моделей ЭБ (-) • недостаточно формализованы определения, оставляющие размытыми границы многих сущностей (например, сущности, заимствованные из FRBR, или граница между метаданнымии аннотацией); • в некоторых местах остаются не ясными критерии выделения сущностей; • неоднородность описания различных областей ЭБ, скрытая за внешне однообразным описанием. RCDL’2009, г.Петрозаводск
Информационная модель ЭБ:иерархия сущностей RCDL’2009, г.Петрозаводск
Типы хранимых объектовв ЭБ Предусматривается хранение: • рукотворных объектов– основного типа объектов информационного контента, а также некоторых других объектов, имеющих к ним отношение: • организации,отделыорганизаций ииздательства, где создавались или публиковались рукотворные объекты; • люди (на схеме это объектчеловек), работающие в этих организациях (отделах) – авторы рукотворных объектов; • проектыв рамках которых создаются рукотворные объекты; • научныежурналы(периодические издания) иконференцииих публикующие RCDL’2009, г.Петрозаводск
Свойства хранимых объектовв ЭБ Объект(в тексте докладафизический объект) – корневой объект в иерархии представляемой модели • идентификатор физического объекта; • название; • тема; • ключевые слова; • версия; • аннотация. Эти свойства наследуются всеми другими объектами представленной иерархии RCDL’2009, г.Петрозаводск
Информационная модель ЭБ,связи RCDL’2009, г.Петрозаводск
А что же дальше будет? • Дальнейший выборобъектов ЭБ, их наименование и определение их свойств с учетом известных моделей (CIDOC, FRBR…). • Типизация связей. Хорошо разработана связь наследования (“является”), а агрегирования (“содержит”, “состоит из”)? • Рассмотрение временного аспекта модели. • … СПАСИБО! RCDL’2009, г.Петрозаводск