140 likes | 319 Views
А. М. Е лизаров , Е. К. Л ипачев , М. А. М алахальцев Система управления разнородным естественнонаучным контентом на основе c емантического веба Работа поддержана грантом РГНФ (проект № 07–01–12146). Электронные научные ресурсы Казанского университета.
E N D
А. М.Елизаров, Е. К. Липачев, М. А.МалахальцевСистема управления разнородным естественнонаучным контентом на основе cемантическоговебаРабота поддержана грантом РГНФ (проект № 07–01–12146)
Электронные научные ресурсы Казанского университета • Электронные журналы по естественнонаучной тематике • Печатные журналы с электронными версиями • Учебные материалы • Методические и вспомогательные лекционные материалы
Электронные журналы http://www.ksu.ru/infres/index1.php http://mrsej.ksu.ru http://ljm.ksu.ru http://fccl.ksu.ru
Пример разнородного контента в рамках одного журнала • Серии журнала: • Гуманитарные науки • Естественные науки • Физико-математические науки
Проблемы • представление статей в электронной форме; • использование разных форматов в рамках одной журнальной серии; • конвертация в универсальный формат; • общее управление журнальным контентом
Как решать эти проблемы? Существующие подходы: Управление научным контентом в НЭБ программная среда, в основу которой положен алгоритм выделения элементов текста и присвоения им меток полей собственного XML-формата Sarcticle Отличительные особенности Sarcticle: • вложенность полей, • описание любого количества информации одним файлом, • проверка правильности составления файлов описаний на стороне издательств, • использование файлов описаний для наполнения собственных сайтов издательств и совместимости с другими форматами обмена метаданными, основанными на XML
Электронный математический журнал • Схема управления электронным хранилищем на примере электронного математического журнала • Особенности: • TeX • MathML • XML/XSLT
Перспективные подходы: Семантический веб – это «...расширение традиционного веба в направлении существенно лучшего определения смысла информации, позволяющего компьютерам и людям эффективнее выполнять совместную работу. Мы хотим, чтобы данные в вебе были определены и связаны ссылками так, чтобы их можно было легче находить, интегрировать, автоматизировать и повторно использовать в различных приложениях, ... чтобы данные были разделяемыми и могли обрабатываться как автоматизированными средствами, так и людьми» Бернерс Ли
Электронные хранилища: нужен ли новый тип? • Разнородность контента • Возможности интеллектуального поиска по специализированным документам • Новый тип интерфейса
Разнородность контента • разнообразие предметных областей (математика, физика, химия, биология, геология и т. д.) • разнообразие типов документов (научные статьи, результаты наблюдений и экспериментов, программные продукты) • разнообразие форматов (текстовый, графический, звуковой, видео). • нетрадиционная структура документов хранилища Пример: документ по астрономии может включать одновременно текст, математические расчеты, данные наблюдений и программы обработки этих данных
Интеллектуальный поиск по специализированным документам • динамические интеллектуальные связи • структурированный комплекс документов Новый тип интерфейса.
Спектр языков разметки • MathML • MeML (Mathematics Education Markup Language) • CML (ChemicalMarkupLanguage) • CellML (CellMarkupLanguage) • GML (Geography Markup Language) • RoboML (Robotic Markup Language) • …
Выводы: Имеющиеся на сегодняшний день технологии семантического веба, включая языки разметки естественнонаучного контента, позволяют решить задачу управления разнородным контентом в электронных хранилищах