210 likes | 333 Views
Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотеках. Новицкий А.В. Институт программных систем НАН Украины. Цели. Выделить проблемы интеграции данных при онтологическом подходе Сделать обзор существующих проектов по интеграции данных в электронной библиотеке
E N D
Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотеках Новицкий А.В. Институт программных систем НАН Украины
RCDL 2009 Цели • Выделить проблемы интеграции данных при онтологическом подходе • Сделать обзор существующих проектов по интеграции данных в электронной библиотеке • Семантической аннотации как необходимый компонент интеграции данных
RCDL 2009 Что такое интеграция данных (ИД) ? • Под процессом интеграции данных мы понимаем построение единого унифицированного метода доступа к гетерогенным распределенным преимущественно структурированным данным
RCDL 2009 Проблемы интеграции данных Гетерогенность: • Синтаксическая • Структурная • Семантическая
RCDL 2009 семантическая гетерогенность • семантические конфликты • описательные конфликты • структурные конфликты
RCDL 2009 Виды сопоставлений онтологий: • Расширение • Гармонизация • Выравнивание
RCDL 2009 Семантическая интерпарабельность в Европейских проектах • Проект SWHi • Проект eCulture • Проект IPISAR (Испания) • Проект EPOCH и AMA
RCDL 2009 Проект SWHi Онтология SWHi для ЭБ, построенная на базовой онтологии PROTON в результате сопоставления с отологиями: • таксономии предметной классификации NewsBank/Readex • Дублинского Ядра • словаря FOAF Vocabulary
RCDL 2009 Проект eCulture • eCulture это семантическая поисковая система для одновременного поиска в нескольких коллекциях учреждений культурного наследия
RCDL 2009 IPISAR
RCDL 2009 Проект EPOCH и AMA библиотек культурного наследия • EPOCH представляет собой библиотечную сеть из более ста европейских культурных институтов • Для интеграции и обмена используется модель данных CIDOC CRM AMA MappingTool - для отображения источников данных (неструктурированная информация) в онтологию CIDOC CRM
RCDL 2009 Семантическая аннотация Для автоматической обработки контента ЭБ метаданных недостаточно. Необходимы более детальные формальное объяснения (аннотации), доступные через Интернет. Эти механизмы заложены в Sematic Web.
RCDL 2009 Проблемы SemanticWeb • Множество рекомендаций и направлений • Отсутствие онтологий и RDF данных • Отсутствие приложений для роботы с семантическими данными
RCDL 2009 RDFa • это способ выражения RDF-данных в XHTML, в рамках которого данные, предназначенные для человека, используются повторно для автоматической обработки.
RCDL 2009 Пример
RCDL 2009 Пример работы GRDDL (GleaningResourceDescriptionsfromDialectsofLanguages)
RCDL 2009 Использование в ЭБ (автоматическая публикация) Liked Data
RCDL 2009 Дальнейшее развитие • Связывание аннотированных документов с моделью данных Linked Data • Расширение построенной модели с хранилищем Linked Open Data
RCDL 2009 Linked Open Data
RCDL 2009 Спасибо за внимание !
RCDL 2009 Принципы Linked Data • Use URIs as names for things • Use HTTP URIs so that people can look up those names. • When someone looks up a URI, provide useful information, using the standards (RDF, SPARQL) • Include links to other URIs. so that they can discover more things.