1 / 68

Развитие электронных библиотек – путь к Открытой Науке

Развитие электронных библиотек – путь к Открытой Науке. Сергей Паринов, Центральный экономико-математический институт РАН. Структура презентации. Десять перспективных направлений развития ЭБ для поддержки научных исследований

nishi
Download Presentation

Развитие электронных библиотек – путь к Открытой Науке

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Развитие электронных библиотек – путь к Открытой Науке Сергей Паринов, Центральный экономико-математический институт РАН

  2. Структура презентации • Десять перспективных направлений развития ЭБ для поддержки научных исследований • Международные инициативы за открытый доступ к результатам исследований как движущая сила развития ЭБ • Новая модель научно-исследовательской деятельности под названием «Открытая Наука» как результат действия движущих сил и реализации ключевых направлений развития ЭБ

  3. Десять Перспективных направлений развития ЭБ

  4. Current Research Information Systems (CRIS) – современная модель комплексной научно-организационной информационной системы, см. www.eurocris.org Распространение технологий ЭБ вширь и вглубь: Расширение использования технологий ЭБ на случаи управления нетрадиционнымиинформационными объектами (люди, проекты, имущество и т.п.) Подключение ЭБ к системам управления научными CRISами Как результат ЭБ начинают управлять комплексом информационных объектов, достаточно полно представляющих действующих лиц науки и результаты их деятельности 1.Трансформация ЭБ в CRIS

  5. The R&D Process: Recording Workprogramme CRIS DATABASE Proposal Project Results Exploitation WealthCreation

  6. CERIF-CRIS at One Organisation Web pages Directory Services CERIF-CRIS This is fine for one organisation but research is international, so… Publication repository Dataset Software repository Finance system Human Resources system Project Management system

  7. Пример от Соционет • Начиналось в 1997 г. с архива эл. публикаций (тип paper), сейчас в ЭБ Соционет 16 типов данных • Дисциплина «экономика»,всего материалов 124973   Главы и разделы в книгах (chapter) 12212Данные об организациях (institution) 119Диссертации и авторефераты (thesis) 160Каталоги библиотек и издательств (book) 39475Научные новости (news) 813Научные рецензии и комментарии (comment)18 Персональные данные авторов (person) 7396Подборки публикаций (secondary) 14 Программное обеспечение (software) 4 Публикации в журналах (article) 55951Рабочие документы (paper) 8804Результаты научно-тех. деят. (РНТД) (result) 7  

  8. Интеграция метаданных локальных ЭБ на принципах федерации, право собственности хозяина на контент Признак - создание в ЭБ технических входов для харвестинга данных, по протоколу OAI-PMH Примеры: Соционет (http://socionet.ru/), ЕНИП РАН (http://enip.ras.ru/), OAIster (http://oaister.org/), DRIVER (http://www.driver-repository.eu/), OpenDOAR (http://www.opendoar.org/) и др Как результат – переход от изолированных ЭБ к сети взаимосвязанных ЭБ 2. Интеграция локальных ЭБ

  9. Archives In Celestial Records US 289 224 9019902 UK 149 134 704009 Germ. 108 88 920932 Japan 70 64 906284 Brazil 70 48 428646 Spain 55 42 731025 Canada 49 43 150658 France 49 42 361023 Austral. 47 36 1101874 India 45 24 53847 Archives In Celestial Records Italy 45 35 76049 Sweden 34 33 158583 Nether 27 24 635942 Russia 27 24 26472 Portugal 25 18 34194 Taiwan 24 15 347078 Belgium 18 16 170526 Greece 16 13 270138 Colomb 15 8 4059 Malaysia 15 8 35856 S.Africa 15 9 20950 Кол-во ЭБ с техническим входом на основе OAI-PMH,в мире Всего архивов 1447 из них с технич. входом 1108 общее кол-во записей 18,961,658 Источник: Registry of Open Access Repositories http://roar.eprints.org/index.php?action=browse

  10. … и в России (всего 24)

  11. Потребовалась специализированная информационная система для харвестинга открытого контента из множества разнородных ЭБ по структуре и их принадлежности предложена модель информационного хаба Нужна развитая модель структуры научных данных есть рекомендованная ЕС модель научных данных CERIF Нужны гибкие подходы для харвестинга и экспорта данных есть OAI-PMH,RSS, программные конвертеры на заказ Выбор эффективной схемы обновления и синхронизации есть модель RePEc.org – ежедневная синхронизация массивов метаданных между ЭБ и центральной базой Как результат – операционализация /стандартизация входных и выходных потоков метаданных 3. Появление информационных хабов

  12. Модель научных данных CERIF2008 • Представлены основные информационные объекты научно-организационной деятельности, возможно расширение • Модульность для повторно используемых объектови предусмотрена многоязыковость • Выделены специальные связующие объекты, имеющие семантические атрибуты • Реализована «машина времени» и многое другое, см. http://www.eurocris.org/cerif/ • CERIF рекомендован Европейской Комиссией как единая модель для конструирования CRISов и организации интероперабельности (обмена данными) между ними

  13. CERIF: Common European Research Information Format Funding Programme Organisation Organisation Person Person Project Project Service Skills Publication Equipment CV Patent Classification Classification Product ( ( ) ) Semantics Semantics Event

  14. CERIF 2nd Level Entities Facility Equipment Funding ExpertiseAndSkills Service Qualification ElectronicAddresse Prize PostalAddress CV Country Citation Currency Metrics Event Language

  15. Some CERIF Multiple Language Features

  16. Some CERIF Semantic Features role=author1 institute role=author role=deliverable1.2 role=CEO role=funder role=coordinator Semantic Features are associated with Link Entities

  17. 3. Получатели данных: 1. Поставщики данных: ЕНИП РАН (3.1) ОРМ (1.1) OAI каталог (3.2) RSS (1.2) OAI-PMH архивы (2.1) Eprints реестр (3.3) (2) Соционетинформационный хаб OAI (1.3) Службы новостей (3.4) RSS каналы (2.2) Другое(1.4) Личный RSS импорт (3.5) IST-WORLD (3.6) BirchBob (3.7) Информационный хаб Соционет Статьи и коллекции из онлайновых рабочих мест Каталог Open Archives Initiative Препринты ГУ-ВШЭ Реестр Open Access to Research Содержание Открытых Архивов Различные новостные агентства Журналы и коллекции Пользователи Интернет через браузеры и гаджеты

  18. ИП предназначены для визуализации текущей структуры и содержания стандартизованных информационных ресурсов, собранных с ЭБ Работают на федеративных принципах: нельзя менять чужие объекты, можно создавать из них производные и связи между ними Минимальная функциональность ИП – навигация и поиск Как результат - упрощается многократное и многоплановое использование информационных объектов для создания новых информационных продуктов и сервисов 4. Создание информационных пространств (ИП)

  19. Пример ИП ЕНИП РАН • Единое научное информационное пространство РАН • Главный исполнитель ВЦ РАН • http://enip.ras.ru/ • Только поиск, навигации по каталогу нет

  20. Пример ИП Соционет • Визуализирует все данные на socionet.ru, собираемые и обновляемые ежедневно информационным хабом Соционет: более 1000 архивов, 2500 коллекций, 900 тыс. материалов по 13 дисциплинам и 16 типам данных • Имеет навигацию по: а)иерархическому каталогу «архив:коллекция:материал»; б)структуре данных «дисциплина-раздел-коллекция-материал» • Имеет сквозной структурированный по полям текстовый поиск, включая тематические рубрикаторы по всем дисциплинам,а также многое другое

  21. Международные инициативы в области научных ИП • Появился новый термин«DIS» - Data and Information Spaces • В ERCIM создана рабочая группа DIS: «…to develop methods and tools to make digital, cultural and scientific content available, searchable and accessible for all kinds of users. Interoperability should be achieved on schema levels, repository levels as well as system levels.”, http://wiki.ercim.org/wg/DIS/

  22. Информационный хаб + ИП = платформа для децентрализованного создания информационных продуктов и услуг для научного сообщества, SOA Используются подходы и технологии ЭБ, но результат в данном случае имеет вид онлайновой инфраструктуры Как результат – появились условия для децентрализованного развития и обогащения метаданных и объектов ИП, создания новых информационных продуктов и сервисов в интересах научного сообщества 5. Формирование онлайновой научной инфраструктуры

  23. Программы Европейской Комиссии по теме research e-infrastructure • FW7 Work Program 2010 • “The e-Infrastructures activity supports a number of interrelated topics designed to foster the emergence of a new research environment in which 'virtual communities' of scientists and engineers are empowered to share and exploit the collective power of the European ecosystem of scientific and engineering facilities” • Бюджет –с 2007 г. уже потрачено 211 млн. евро, на 2010 г. - 115 млн. евро

  24. European Strategy Forum on Research Infrastructures(ESFRI) • ESFRI is a strategic instrument to develop the scientific integration of Europe … • ESFRI разработал документ "European Roadmap for Research Infrastructures – Roadmap 2008" • Источник - http://cordis.europa.eu/esfri/

  25. Проект BELIEF • BELIEF - Bringing Europe’s e-Infrastructures to Expanding Frontiers • BELIEF-II will coordinate the efforts of many e-Infrastructure projects to further enlarge the e-Infrastructure Community. • Источник - http://www.beliefproject.org/

  26. Соционет как сегмент национальной онлайновой инфраструктуры • Предлагает интерфейсы для свободного включения новых архивов/коллекций научных материалов, визуализируемые в ИП • Через интерфейсы ИП (RSS) и созданные в Соционет OAI-PMH репозитории позволяет харвестить стандартизованные метаданные • Предлагает набор собственных сервисов для развития и использования метаданных • Открыт для присоединения к нему внешних сервисов, использующих его ИП

  27. Принципы федерации метаданных ЭБ допускают развитие разнокачественных сетей связей между информационными объектами в ИП Связи являются информационными объектами ИП, несут семантическую информацию и могут свободно создаваться пользователями ИП Для пользователей это означает возможность формирования профессиональных социальных сетей и другого использования объектов ИП Как результат – ученые могут создавать семантические связи над полным пространством информационных объектов, включая и уже созданные связи 6. Формирование сетей связей между объектами ИП

  28. Пример CERIF Link Entities

  29. Пример CERIF Semantics [Person-Publication Roles] is author of is author (numbered) of is publisher of is author (percentage) of Person_Publication Scheme is subject of is editor (numbered) of is editor of is translator of is reviewer of

  30. Пример CERIF Semantics number of citations number of incoming citations number of self citations claims IPR of number of authors received Best Paper Award Publication_Metrics Roles number of external institutes ISI Impact Factor number of downloads is of publication type number of access number of requests area/type of research

  31. Пример типов связей для статьи в Соционет

  32. Пример типов связей для профиля ученого в Соционет

  33. Пример типов связей для профиля института в Соционет

  34. Пример графа связей персонального профиля в Соционет

  35. Возможность создания связей типа «цитирование» означает появление новой сущности «электронное цитирование» Электронное цитирование в отличие от бумажного может быть усовершенствовано Как результат – оно позволяет автору электронной статьи уточнить в каком именно качестве он использовал чужие результаты исследований 7. Развитие связей цитирования

  36. Цитирование в модели CERIF2008 number of citations number of incoming citations number of self citations claims IPR of number of authors received Best Paper Award Publication_Metrics Roles number of external institutes ISI Impact Factor number of downloads is of publication type number of access number of requests area/type of research

  37. Электронное цитирование с качественными атрибутами • Предлагается оформлять цитаты как: • самостоятельные информационные объекты, • создавать семантические связи между документом и цитатой • Связи цитирования могут иметь в т.ч. следующие атрибуты: • цитируемый результат является основанием для получения моего результата»; • мой результат подтверждает или подтверждается цитируемым результатом; • цитируемый результат является иллюстрацией моего результата или имеет с ним логическую связь; • мой результат опровергает цитируемый результат

  38. Оформление цитат и связей цитирования в Соционет (проект) При написании статьи автор создает связь с выбранной цитатой, указывает атрибуты связи и включает ее в свой текст Создаются коллекции цитат. Выше – структура полей цитаты. Цитаты создаются как авторами, так и другими лицами.

  39. International Repositories Infrastructure • Проект Citation Service • In collaboration with Microsoft Research, to develop author support tools to improve and assist the deposit of material in repositories, including reference lists from articles • To develop an API that can be connected to repository software programs which will enable the recognition and analysis of items cited by articles in repositories • To enable the extension of the capabilities of the Citebase software   • This will be an international effort involving a team of collaborators in Europe, North America and Asia. • Источник - http://repinf.pbworks.com/

  40. Электронное цитирование нарушает баланс сил в потенциальном конфликте интересов между учеными в пользу автора статьи Требуется средство для публичной профессиональной оценки субъективных мнений автора Предлагается создание семантических связей типа «оценка влияния» между профилем ученого и заданным материалом Как результат – ученые будут иметь равные права в процессе «борьбы» мнений, определяющей научную истину 8. Необходимость нового типа связей "оценки проф. влияния"

  41. Пример реализации в Соционет «оценок влияния» (проект) Заполняя форму, ученый создает связь между своим профилем и выбранным объектом. Объекты могут быть любые: цитата, связь цитирования, статья, комментарий, оценка влияния и т.п. Эта связь и ее атрибуты видна читателям при просмотре, как профиля автора связи, так и объекта, к которому она сделана.

  42. Неконтролируемые и децентрализованные изменения в объектах ИП нарушают созданные пользователями сети связей между этими объектами Создаются средства мониторинга за изменениями в объектах, если с ними установлены связи Разрабатываются сервисы для информирования владельцев объектов и связей о важных для них изменениях в ИП Как результат – возникает более высокий уровень связанности и согласованности деятельностей членов научного сообщества 9. Мониторинг и поддержка сетей связей в ИП

  43. Реализация поддержки «живых» документов в Соционет (проект) • Связи цитирования нарушаются, если меняются цитируемые документы • В Соционет создается система мониторинга связей цитирования и оповещения заинтересованных лиц: • авторов статей о создании/уничтожении связей цитирования с их статьями • авторов цитат об изменениях в цитируемых статьях • читателей статей о статусе цитат в них, если они не были пересмотрены после изменения статей-источников

  44. Сбор всей доступной статистики о развитии ИП, результатах работы ученых и исследовательских организаций, включая учет всех видов связей и их семантики Как результат – формирование открытой онлайновой наукометрии, включая индикаторы результативности ученых и организаций профессиональной сигнальной системы информационной модели научного сообщества 10. Мониторинг развития ИП и активности действующих лиц

  45. Пример статистики для профиля организации в ИП Соционет

  46. Статистические портреты ученого и организации в Соционет (проект) • Персональные сведения об ученом, и история их изменений; • Динамика роста количественных показателей активности ученого, в т.ч. числа статей, результатов исследований, материалов других типов и т.п.; • Динамика количеств и структуры цитирования результатов данного ученого, а также цитирований чужих результатов, сделанные данным ученым; • Параметры распределения качественных характеристик для цитирований, выполненных данным ученым, а также для результатов данного ученого, выполненных другими учеными; • Динамика количеств, структуры и распределение качественных характеристик оценок профессионального влияния работ данного ученого, сделанных научным сообществом, а также чужих работ, сделанных данным ученым; • Распределение цитирования и оценок влияния между различными результатами данного ученого.

  47. Проект мониторинга использования результатов исследований в Соционет • На основе обработки семантики связей цитирования предполагается получить статистику характера использования научных результатов: • какие результаты кем используются как основа научного вывода; • какие результаты подтверждают или подтверждаются другими результатами; • какие результаты повторяют уже известные; • упоминание результатов в качестве общих иллюстраций; • какие результаты кем критикуются и имела ли данная критика позитивные для науки последствия.

  48. Проект MESUR – карта науки Источник - http://www.mesur.org/services/

  49. Информационная модель научного сообщества • При определенных условиях собираемая онлайновая статистика будет: • содержать репрезентативные статистические портреты всех действующих лиц (ученых, проектов, организаций и т.п.) научного сообщества • фиксировать все значимые для научного сообщества процессы и их результаты • Открытый доступ к этим ежедневно обновляемым данным позволит получить картину текущего состояния и развития научного сообщества, объединенного соответствующим ИП

  50. Движущая сила развития Электронных Библиотек

More Related