490 likes | 693 Views
Итоги и перспективы проектной деятельности АРБИКОН. Племнек Александр Иванович, Ассоциация региональных библиотечных консорциумов (АРБИКОН) Корпоративные библиотечные системы: технологии и инновации 23-29 июня 2008 г . Россия, Финляндия, Швеция. История вопроса.
E N D
Итоги и перспективы проектной деятельности АРБИКОН Племнек Александр Иванович, Ассоциация региональных библиотечных консорциумов (АРБИКОН) Корпоративные библиотечные системы: технологии и инновации 23-29 июня 2008 г. Россия, Финляндия, Швеция
История вопроса Alvin Toffler(*) обращает наше внимание на тот факт, что «…если последние 50 000 лет существования человека разделить на отрезки жизни приблизительно в 62 года каждый, то окажется около 800 таких отрезков жизни. • Из этих 800 полных 650 прошли в пещерах. • Только за последние 70 таких отрезков жизни стало возможным эффективно передавать информацию от одного поколения к другому благодаря письменности. • Только в последние шесть отрезков жизни люди использовали печатное слово. • Только за последние четыре стало возможным измерить время с требуемой степенью точности. • Только в последние два использовался электрический двигатель. • И подавляющее большинство всех материальных благ, которыми мы пользуемся в повседневной жизни в настоящее время, были придуманы в течение настоящего, 800-го отрезка жизни». * Амер социолог и футуролог один из авторов концепции “сверхиндустриальной цивилизации”
Справка Кило = 10(3) 1KB = 1024B 2(10) Мега = 10(6) 1MB = 1024KB2(20) Гига = 10(9) 1GB = 1024MB 2(30) Тера = 10(12) 1TB = 1024GB 2(40) Пета = 10(15) 1PB = 1024TB 2(50) Экзо = 10(18) 1EB = 1024PB 2(60) Зетта = 10(21) 1ZB = 1024EB 2(70) Йотта = 10(24)1JB = 1024ZB 2(80)
Насколько реальна угроза информационного беспредела? • Информационный бумажный беспредел перешел в информационный цифровой беспредел
Почему возникает проблема объемов информации? • Началась эра исследований с высокой скоростью порождения данных • Глобальное большинство информации появляется в цифровом виде • Данные порождаются в полуавтоматическом либо полностью автоматическом режиме
Информация к размышлению • В 1996 году пользователей Интернет – 48 Млн. человек • В 2006 году пользователей Интернет – 1 100 Млн. человек • К 2010 году ожидается 1 600 Млн. человек Сегодня темпы роста производства информации в цифровом виде в развивающихся странах выше на 30-40%
Информация к размышлению • В 2002 году суммарный объем: Cохраненной информации включая бумажные носители, пленки, ленты и пр. составил 5 EB (пять миллиардов миллиардов байт). Из них 92% сохранены на магнитных носителях (50% диски, 42% ленты(фото, аудио, видео)) Переданной по сетям информации составил 18 EB. Из них 97% - телефонные разговоры, 2% - трафик Интернет, <1% CD&DVD * В исследовании не учитывалось тиражирование информации – только однократная публикация • В 2006 году объем сохраненной информации составил уже161 EB • В 2010 году ожидается увеличение объема до 988 EB что составляет 6 кратный прирост
Предполагаемый профиль сохраняемого информационного массива к 2010 году Из 998 EB в 2010 году: Прирост новой информации составит 25% Неструктурированная информация составит 95% (мультимедия, нетекстовое представление) 70% новой информации будет создано отдельными пользователями 85% данных будет находиться в институциональных хранилищах и будет контролироваться фирмами (что приведет к решительному изменению системы работы с информацией как в процессе производства так и в процессе использования)
Библиотеки и читатели в информационном контексте • Совокупный объем информации на бумажных носителях всех видов составляет 0.001% от учтенного общего объема информации (причем эта доля учитывалась не в форме текста а в форме изображения страниц с разрешением 600 точек на дюйм). Большинство из этих документов составляют офисные. • КНИГИ составляют всего 2.4% от 0.001% (в сканированном виде) • БУМАГА – самый дорогой из современных носителей • Читающий человек за всю жизнь потребляет максимум 1GB информации в текстовом формате • За год в мире порождается 4 TB информации в текстовом виде
Феномен открытых информационных массивов • Новые научные инструменты Большой Адронный Коллайдер(CERN) генерирует 1.5GB в секунду, что приводит к порождению 1 EB в день! Для сохранения используется дисковый массив площадью 1 кв.км. • Новые научные модели Раскрытие генома человека потребовало анализа 1 Млрд. цепочек Глобальные модели климата • Новые научные коллективы Для изучения генома мухи дрозофилы создано 195 научных коллективов • Новые знания о свойствах больших информационных массивов Большинство открытий из наблюдений телескопа Hubble сделано при анализе открытых массивов
Мы уже находимся в состоянии кризиса • Скорость порождения информации не позволяет производить даже грубый отбор • Современные технологии уже не справляются с необходимостью регистрации информационного потока • Хранение информации требует существенных затрат • В ряде случаев стоимость затрат на репозитарное хранение значительно превышает стоимость самой информации • Практически не решена проблема сохранности и архивации. Уже были прецеденты потери значительных объемов информации • Человечество не успевает осмыслить накопленные объемы информации
Некоторые факты • Уже накоплены значительные информационные массивы – так банк данных о солнечной системе содержит более 1 миллиарда документов (примерно 250.000 документов о каждой планете). В США есть архивы превышающие 100PB(аэропорты, медклиники, морские порты, военные архивы). Архивы France Telecom превысили 25 PB. Объем цифровой библиотеки LC на сегодня составляет 7 PB • Зачастую извлечение информации из цифровых библиотек занимает часы • Ненадежность устройств хранения влечет проблему логической и физической миграции данныхпрактически не разрешенную на сегодня. • Новые данные порождаются быстрее, чем осуществляется перезапись старых данных • Все чаще термин “архивное хранение” подразумевает ВЕЧНОЕ ХРАНЕНИЕ • Хранение – дорогое удовольствие
Факты • Дилемма с дисками – На сегодня максимальный объем диска = 1 TB. 1PBможно записать примерно на 1200 дисков. Диск потребляет 15 ВТ в час. Таким образом 1200 дисков потребляют 18 КВт в час по цене 0.32 USD = $5.76. За 10 лет - 87.600 часов => 504,576.00 USD Учитываем примерно равные затраты на охлаждение -- получаем 1,000,000 .00USD По теореме Мура сумму можно удвоить. ИТОГОпримерно: 2,000,000.00 USD
Факты • Дилемма с сохранностью – срок службы носителей определяет время сохранности. Срок службы дисков – 5 лет! Срок службы лент – 7-10 лет (требуется перемотка до 4 раз за этот срок)! Срок жизни информации от 1 дня до пожизненного. • Прочие носители Папирусы – более 3000 лет. Низкокислотная бумага – книги Гутенберга живы. Фотопленка – 140 лет и остаются в приемлемом состоянии Живопись – 21000 лет и сохраняется в нормальном состоянии (Французские пещеры)
Тенденция изменения стоимости различных систем хранения
Реальность • Необходимость перезаписи архивов каждые 5-7 лет • Время перезаписи в ряде случаев превышает недели и месяцы • Скорость поступления новых данных выше, чем скорость перезаписи архивов • Процесс миграции данных бесконечен, что влечет бесконечные финансовые траты • На сегодня только дисковые массивы гарантируют 100% корректную миграцию информационных массивов
Лавина информации: бедствие или шествие свободы? Одна из возможных тем для обсуждения на конференции АРБИКОН
Тенденции • Использование интеллектуальных обьектно-ориентированных хранилищь • Переход к глобальному сетевому сервису хранения(архивирования) данных • Использование больших файлов(сейчас терабайты, в перспективе петабайты) • Увеличение количества файлов • Хранение информации в сети • Широкое использование GRID – технологий Таким образом мы стремимся к обеспечению прозрачного и унифицированного доступа на логическом уровне к гетерогенным информационным ресурсам распределенным в сети
Наше “библиотечное” будущее – БИБЛИОГРИД? • GRID дает возможность объединить вычислительные ресурсы в единое множество и управлять этим множеством как единой системой, что снижает затраты на администрирование. Поскольку невозможно администрировать программное обеспечение на сотнях и тысячах компьютеров одновременно, реализуется целая инфраструктура самонастройки, самотестирования, самоконфигурации. Т.е. необходимость сложного администрирования отдельных узлов отпадает и это тоже снижает затраты на администрирование. Управление всей GRID системой возможно "с единого пульта« • Grid не следует рассматривать как абсолютно новую и не совместимую с существующими технологию, напротив, Grid может успешно использоваться как дополнение к уже существующим протоколам и сервисам для предоставления и получения более качественных услуг в рамках чёткой стандартной модели.
Технологические требования, предъявляемые к Grid, определены следующим образом: • Гибкиеотношениядоступа (client-server, peer-to-peer). • Чёткий высокоуровневый контроль над использованием ресурсов. • Многоуровневый контроль прав доступа, локальные и глобальные политики доступа. • Поддержка распределения различных ресурсов - программ, данных, устройств, вычислительных мощностей. • Поддержка различных моделей пользования - многопользовательской, однопользовательской, режимов performance-sensitive и cost-sensitive. • Контроль над качеством предоставляемых услуг, планирование, резервное предоставление услуг. ВАМ это ничего не напоминает???
Итог 10 лет сотрудничества • 1 этап (1996 – 2003) – создание инфраструктуры распределенной корпоративной библиотечной сетиРоссии • 2 этап (2003 -- 2006) – стабилизация межкорпоративной базовой (универсальной) инфраструктуры • 3 этап (2006 -- ) – переход к специализированным сервисам на основе базовой инфраструктуры (Реорганизация АРБИКОН)
Направления реорганизации-1 • признать созданную базовую инфраструктуру основой для развития корпоративных сервисов АРБИКОН; • дать возможность каждому члену АРБИКОН участвовать только в тех направлениях, которые совпадают с целями и задачами данной конкретной организации; • ввести проектный принцип в развитие новых сервисов, когда заинтересованные организации объединяются для развития нового корпоративного сервиса;
Направления реорганизации -2 • отойти от принципа общедоступности всех ресурсов и сервисов– теперь доступными и бесплатными для библиотеки становились сервисы только тех проектов, в которых она участвует, а так же базовый сервис распределенного поиска и заимствования БЗ между партнерами ассоциации; • сделать проекты АРБИКОН открытыми для участия организаций, не являющихся членами АРБИКОН; • ресурсы и сервисы проектов АРБИКОН сделать доступными для внешних пользователей, при этом члены АРБИКОН имеют льготу на их использование.
Основные принципы функционирования проектов АРБИКОН • Интеграция через специализацию – каждая организация обеспечивает качественно подготовленный ИР по своей отрасли знаний • Специализация через интеграцию – каждая организация использует ресурсы партнеров для формирования полного виртуального фонда по своей отрасли знаний • Однократный ввод и многократное использование - минимизация дублирования при создании, вводе и описании ИР
Cервисы проектов • Проект МАРС (межрегиональной аналитической росписи журнальных статей), создающий информационный ресурс аналитической росписи около 1300 российских журналов (800.000 аналитических записей, пополнение – 1000 записей в день) • Проект ЭДД электронного заказа и доставки документов на основе сводного каталога журналов (около 5000 наименований журналов, доставка около 1200 страниц в день) • Проект распределенной электронной библиотеки ЭПОС (электронное полнотекстовое собрание) 38000 документов
Статистика по участникам проектов • МАРС • 154 участника (60 – члены АРБИКОН, 94 – не члены АРБИКОН) • 65 пользователей (46 –члены АРБИКОН, 17 – не члены АРБИКОН, в т.ч. 1 физ. лицо) • 16 кандидатов • ЭДД • 136 участников (59 – члены АРБИКОН, 77 – не члены АРБИКОН) • 8 кандидатов • ЭПОС • 73 участника (51 – члены АРБИКОН, 22 – не члены АРБИКОН) • 9 кандидатов
Проект ЭДД • Цель - создание современной службы электронного заказа и доставки копий статей за счет распределения обязанностей по обслуживанию заказов между организациями – участниками Проекта. • Впервые в стране создается сводный каталог журналов ( с указанием списка библиотек-держателей) на основе оригинальной технологии автоматизированного сбора данных. • Программное обеспечение формирования заказа и доставки информации потребителю предоставляется всем участникам Проекта бесплатно.
Инновационные решения • Набор компонентов, позволяющих «собрать» систему требуемой функциональности • Открытые стандарты – гарант совместимости • Использование программных систем с открытым исходным кодом • Портальные компоненты для объединения ресурсов и сервисов
О стандартах • Форматы записей (MARC, DC) Протоколы: • HTTP – интерфейс пользователя • Z39.50 – распределенный поиск, доп. сервисы • SRU, SRW, OAI - поиск, доп. сервисы • Механизмы взаимодействия компонентов – XML/RPC, WSDL,…
Новые проекты АРБИКОН 2008 года • ПроектКОРСАР - Сводный издательский план учебной и методической литературы • Проект «Сводный каталог периодики библиотек России»
Проект КОРСАР • Круглый стол на V конференции АРБИКОН, июль 2007 г. – идея • Издательство «БХВ-Петербург» (член АРБИКОН) • Февраль 2008 г. – проект открыт для библиотек
Проект КОРСАР В рамках проекта предполагается: • изучение потребности в переиздании литературы среди организаций - членов проекта; • обобщение заявок и формирование сводного плана издания учебной и методической литературы; • заключение авторских договоров на переиздание учебной и методической литературы; • издание по согласованному плану учебной и методической литературы, имеющей общий спрос; • поставка изданной литературы участникам проекта по льготным ценам.
Приглашение к участию • Любая библиотека, после прохождения подготовительного этапа, может стать участником проекта вне зависимости от того, какая именно библиотечная система используется для автоматизации библиотечных процессов. • Естественно, более современные библиотечные системы, в состав которых включены функции обмена данными и взаимодействия с библиотеками-партнерами, позволят использовать корпоративные сервисы наиболее эффективно. • Все сервисы АРБИКОН реализованы на основе компонентов АБИС «Руслан».
Сводный каталог периодики библиотек России • обеспечить перевод информационного массива сводного каталога периодики России в формат RUSMARC; • разработать программного и организационно-методического обеспечения для создания и использования сводного каталога периодики России, включающего информационный ресурс аналитических записей из 1500 российских журналов; • обеспечить доступность сводного каталога периодики России для библиотек Росси в режиме 24*7*365; • довести обьем сводного каталога периодики России до 1 000 000 записей; • оказать содействие библиотекам РФ, привлекая их в качестве участников и пользователей сводного каталога периодики, для оптимизации процессов обработки литературы и обслуживания пользователей в части периодических изданий.
Ближайшие перспективы развития Проектов АРБИКОН • Взаимодействие с крупнейшими коммерческими провайдерами контента на взаимовыгодной основе • Привлечение в проекты зарубежных партнеров, локализация технологии на иностранных языках • Установление партнерских отношений с корпоративными сетями ближнего и дальнего зарубежья • Совместный проект с OCLC
Спасибо за внимание ! http://www.arbicon.ru E-mail: plm@arbicon.ru г. С-Петербург, 2008 г.