990 likes | 1.24k Views
十年来数字图书馆技术发展研究. 中国科学院国家科学图书馆 张智雄 2010-09-29. 说明. 全文发表于 数字图书馆论坛, 2010 年第 3-4 期(创刊 5 年专刊) 二十一世纪前十年数字图书馆技术研究和系统建设的 9 个思潮. 序. 世纪之交之时,全球数字图书馆技术的研究正处于一个承上启下的时代 Digital Libraries Initiative(DL-I) 已经结束 (1994-1998) Digital Libraries Initiative - Phase 2 (DLI-2) 已经开始 (1998-2004). 序.
E N D
十年来数字图书馆技术发展研究 中国科学院国家科学图书馆 张智雄 2010-09-29
说明 • 全文发表于 • 数字图书馆论坛,2010年第3-4期(创刊5年专刊) • 二十一世纪前十年数字图书馆技术研究和系统建设的9个思潮
序 • 世纪之交之时,全球数字图书馆技术的研究正处于一个承上启下的时代 • Digital Libraries Initiative(DL-I)已经结束(1994-1998) • Digital Libraries Initiative - Phase 2 (DLI-2)已经开始(1998-2004)
序 • 世纪之交之时,全球数字图书馆技术的研究正处于一个承上启下的时代 • 欧盟(EU) • 5th Framework Programme (1998-2002) • User-friendly information society (IST)
序 • 世纪之交之时,全球数字图书馆技术的研究正处于一个承上启下的时代 • 英国 • eLib计划进入第三期(1993-2001) • The Research Support Libraries Programme (RSLP)(1999-2004)正在开展
序 • 世纪之交之时,全球数字图书馆技术的研究正处于一个承上启下的时代 • 学术界 • 2000年两个数字图书馆会议合并 • ACM Digital Libraries Conference • IEEE的Conference on Advances in Digital Libraries • 发起新的ACM/IEEE CS Joint Conference on Digital Libraries(JCDL)
序 • 回顾二十一世纪00年代数字图书馆研究和建设的历程 • 活跃繁荣、与时俱进 • 以“思潮”来反映数字图书馆的研究和系统建设过程中出现 • 相关核心问题 • 技术理念 • 项目实践 • 系统建设 • “9”大思潮
9大思潮 • 数字化和数字资源研究与建设 • 门户研究与建设 • 集成和互操作研究与建设 • “下一代数字图书馆”研究与建设 • 数字仓储研究与建设 • 数字保存研究与建设 • 本体和语义网研究与建设 • Web 2.0 • 开放存取和开源
9大思潮 • 数字化和数字资源研究与建设 • 门户研究与建设 • 集成和互操作研究与建设 • “下一代数字图书馆”研究与建设 • 数字仓储研究与建设 • 数字保存研究与建设 • 本体和语义网研究与建设 • Web 2.0 • 开放存取和开源
1.数字化和数字资源研究建设思潮 • 数字化和数字资源建设是数字图书馆建设的基础 • 将主要精力投入到数字化项目中的数字图书馆,被称为“第一代数字图书馆” • Abby Smith • Harvard的Dale Flecke
1.数字化和数字资源研究建设思潮 • 20世纪90年代就是建设重点 • 1994年,美国国会图书馆发起了国家数字图书馆项目,以American Memory为标志性建设内容 • 1995年,在NSF和University of Michigan Digital Library Project资助的JSTOR项目(the Journal Storage Project)
1.数字化和数字资源研究建设思潮 • 近十年,两次数字化和数字化资源建设高潮 • 第一次在20世纪90年代末和21世纪00年代之初。 • 第二次在2004年10月Google发起Google Print项目之后
1.1 第一次 • 百万图书计划项目(The Million Book Project) • 美国Carnegie Mellon University和中国、印度 • “欧洲图书馆”项目(TEL) • 第五框架计划,2001年 • The European Library:Gateway to Europe‘s Knowledge, 9个国家图书馆 • Global Memory Net项目 • 2000年,NSF • Ching-chih Chen, Simmons College • 人类文化历史遗产图像资源 • 高校数字图书馆项目 • University of California,发起了California Digital Library(CDL),1997 • Harvard,图书馆数字计划(Library Digital Initiative,LDI), 1998年
1.1 第一次 • 百万图书计划项目(The Million Book Project) • 美国Carnegie Mellon University和中国、印度 • “欧洲图书馆”项目(TEL) • 第五框架计划,2001年 • The European Library:Gateway to Europe‘s Knowledge, 9个国家图书馆 • Global Memory Net项目 • 2000年,NSF • 人类文化历史遗产图像资源 • 高校数字图书馆项目 • University of California,发起了California Digital Library(CDL),1997 • Harvard,图书馆数字计划(Library Digital Initiative,LDI), 1998年
第二次 • 2004年12月Google Print Library Project项目 • 5家图书馆 • University of Michigan • Harvard (Harvard University Library) • Stanford (Green Library) • Oxford (Bodleian Library) • the New York Public Library • Google签署合作协议,将在十年内,实现1500万卷图书的数字化,并通过Google Books提供服务。 • 到2009年10月,Google宣布已经扫描了1000多万卷图书
第二次 • 2005年欧洲图书馆(TEL)联网服务开始 • 2008年Europeana开始上网服务 • 被认为是欧洲数字图书馆 • 在i2010计划的eContentplus 项目支持下 • 欧洲的100多家机构 • 目前数字资源包括了6百万条数字内容,内容类型涉及图像、文本、音频、视频等多种形式
第二次 • Internet Archives • 来源微软名为“Live Search Books” 的项目(2006年) • Gallica 2 • 法国国家图书馆的数字化图书项目 • Gallica 2 digitised book project( 2008年) • HathiTrust • Indiana University和University of Michigan来领导和构建 • (2008年)
第二次 • 全球数字图书馆(WDL) • 2009年4月 • 联合国教科文组织(UNESCO) • 美国国会图书馆 • 其它图书馆 • 高质量的、反映UNESCO成员国家的文化历史遗产
1.数字化和数字资源研究建设思潮 • 从技术上讲 • 推动了OCR、DRM(数字版权管理)、内容管理、数字对象、数字仓储等技术研究和发展 • 大规模数字化 • IMPACT项目(欧盟) • Goobi软件系统(SUB Göttingen)
9大思潮 • 数字化和数字资源研究与建设 • 门户研究与建设 • 集成和互操作研究与建设 • “下一代数字图书馆”研究与建设 • 数字仓储研究与建设 • 数字保存研究与建设 • 本体和语义网研究与建设 • Web 2.0 • 开放存取和开源
2 门户研究与建设 • 门户 • 客观上存在着资源和系统分散、独立存在的情况 • 如何将各类分布资源和服务按照相互关系进行有机组织,实现信息资源、信息服务和信息系统的整合,提供集成连贯的信息环境是数字图书馆建设的一个重要要求 • 随着互联网门户技术的发展,在数字图书馆界也出现了利用“门户”来解决上述资源和系统整合集成的思潮
2 门户研究与建设 • 门户 • 信息门户(Information Gateway) • 学术门户(Scholars Portal) • 主题门户(Subject Gateway) • 侧重于信息资源(特别是网络资源)整合的角度来构建门户 • Portal • 从技术框架和系统集成的角度出发 • 将各个独立存在的系统有机整合起来,提供一个集成连贯的用户环境
2.1信息门户 • 早期 • Electronic Libraries(eLib)项目 • 二十一世纪 • 英国 • 2000年发起了资源发现网络(Resource Discovery Network,RDN)项目 • 2006年,Intute信息门户 • 欧盟第五框架支持的Renardus项目 • 美国研究图书馆(ARL)于2002年发起的Scholars Portal Project项目 • 德国2003年开始在线服务的vascoda-portal项目
2.1信息门户 • 软件系统 • SPT • Scout Portal Toolkit • University of Wisconsin-Madison的The Internet Scout Project项目 • Andrew W. Mellon Foundation资助(2000年) • iVia • Library of the University of California, Riverside • 网络内容爬行、下载和索引的功能 • MyLibrary • Cornell University Library (2000年) • MyLibrary@NCState ( 2000年) • The North Carolina State University Library
2.2 Portal • 能够将各个独立存在的系统有机整合起来的一种软件系统框架 • 实现单点登录,集成许多其它系统 • 实现内容聚合,在一个页面上聚合来自其它多个来源的内容和信息 • 实现信息的有效传递,将适当的信息传递给适当的用户 • 构建面向用户的视图,使用户可以定制自己的门户界面 • 实现科研资源的集成和导航
2.2 Portal • 主要项目 • 英国JISC的Portals Programme • Portal技术 • Portlet技术 • 门户软件 • uPortal • Liferay • 单点登录软件(SSO) • Shibboleth系统
9大思潮 • 数字化和数字资源研究与建设 • 门户研究与建设 • 集成和互操作研究与建设 • “下一代数字图书馆”研究与建设 • 数字仓储研究与建设 • 数字保存研究与建设 • 本体和语义网研究与建设 • Web 2.0 • 开放存取和开源
3 集成和互操作研究与建设 • 在上世纪90年代末,数字图书馆互操作协议研究开始起步 • 1998到2000年间Herbert Van de Sompel及其同事完成了SFX的研究 • 1999年10月,4机构发起了OAI计划 • CLIR(图书馆和信息资源委员会) • DLF(数字图书馆联盟) • SPARC(学术出版和学术资源联盟) • ARL(研究图书馆协会) • 1999年10月的法兰克福图书展销会上,基于DOI和CrossRef的期刊全文(和参考文献)链接系统开始出现
3 集成和互操作研究与建设 • 21世纪,数字图书馆集成和互操作技术研究与系统建设的高潮 • CrossRef于2000年6月开始正式投入运行 • 2001年, OAI-PMH(The Open Archives Initiative Protocol for Metadata Harvesting)1.0版本发布 • 2004年OpenURL成为美国国家标准
3 集成和互操作研究与建设 • 检索协议 • 2002年推出了实验性质的SRW/SRU /CQL 1.0版本 • 2004年2月第一个正式的1.1版本发布 • 2007发布1.2版本在 • 2009年7月,OASIS Search Web Services Technical Committee推出了SRU 2.0和CQL 2.0草案
3 集成和互操作研究与建设 • 数字参考咨询 • 2004年由NISO Standards Committee AZ 发布问题/答案交换协议(QATP) • OAI-ORE • Open Archives Initiative Object Reuse and Exchange • Web资源聚合体进行描述和交换用的标准 • 2006年10月发起,2008年10月发布了OAI-ORE 规范的v1.0版本
3 集成和互操作研究与建设 • 元数据编码和传输标准 • 2001年由DLF提出元数据编码和传输标准(METS) • 2005年5月发布了PREMIS保存元数据字典
3 集成和互操作研究与建设 • 数字图书馆系统的参考模型 • 利用组件方式构建数字图书馆资源和服务的OCKHAM 框架 • 2007年DELOS提出的数字图书馆参考模型-Digital Library Reference Model
9大思潮 • 数字化和数字资源研究与建设 • 门户研究与建设 • 集成和互操作研究与建设 • “下一代数字图书馆”研究与建设 • 数字仓储研究与建设 • 数字保存研究与建设 • 本体和语义网研究与建设 • Web 2.0 • 开放存取和开源
4 “下一代数字图书馆”研究与建设 • 随着网络技术的进步,特别是00年代中期Web Services(包括Semantic Web Services)、P2P、GRID技术的盛行,SOA框架的兴起,很多数字图书馆研究者提出了“下一代数字图书馆框架”的理念
4 “下一代数字图书馆”研究与建设 • “下一代数字图书馆”框架 • 目标: • 将原先集中的、中心控制的系统转换成为一种基于P2P网络和SOA(Service-oriented Architectures)框架,可以根据数字图书馆的资源和服务的需求,灵活集成装配的架构 • 特点: • 分散的 • 灵活分布的 • 可按需组装的架构 • 支持数字图书馆项目的协作共建
4 “下一代数字图书馆”研究与建设 • 主要要求: • 可以按照一定的授权方式实现成员间数字内容、服务和计算资源的共享 • 可以根据需要动态地聚集相关的共享资源,以实现数字图书馆的按需构建
4 “下一代数字图书馆”研究与建设 • DelosDLMS • 2006年推出 • DELOS的下一代数字图书馆管理系统的原型系统 • 核心是构建大规模支撑的、可信赖的中间件系统环境OSIRIS • 封装了ISIS数字图书馆服务 • 实现文本、音视频的检索、可视化
4 “下一代数字图书馆”研究与建设 • OpenDLib • 2002年开发 • 2006年利用了gLite网格框架 • BRICKS • Building Resources for Integrated Cultural Knowledge Services • 基于P2P(peer-to-peer)架构 • 欧盟第6框架支持 • 文化遗产领域内知识和资源的共享
4 “下一代数字图书馆”研究与建设 • DILIGENT • 欧盟第6框架项目 • A Digital Library Infrastructure on Grid Enabled Technology • 将网格技术和数字图书馆技术有机集成 • 目标在于构建一个基于Grid的数字图书馆的实验平台,以促进相关的e-Science团体可以按一种安全、协调、动态和有效的方式来实现数字资源和知识的共享协作 • gCube目前已经成为一个被广泛应用的、基于网格的虚拟团队建设环境
4 “下一代数字图书馆”研究与建设 • 云计算技术 • 资源收集 • 信息存储 • 海量计算 • Apache hadoop开放云计算平台 • HDFS (Hadoop Distributed File System) • MapReduce • HBase (Hadoop database)
9大思潮 • 数字化和数字资源研究与建设 • 门户研究与建设 • 集成和互操作研究与建设 • “下一代数字图书馆”研究与建设 • 数字仓储研究与建设 • 数字保存研究与建设 • 本体和语义网研究与建设 • Web 2.0 • 开放存取和开源
5 数字仓储研究与建设 • “仓储” Repository • 21世纪的热词, • 数字内容管理系统 • 三特点:对数据、元数据进行管理;有具有提交、存储、导出功能;检索查询功能 • 20世纪90年代 就已经出现 • Los Alamos National Laboratory的arXiv.org • 英国University of Southampton的CogPrints • 存储电子硕博论文的NDLTD (The Networked Digital Library of Theses and Dissertations) • 当时它们被称为E-print Archive • OAI计划 • 对“Repository”进行了明确的定义,并提供了互操作的标准规范,客观上对Repository热潮的形成起到了推动作用
5 数字仓储研究与建设 • 21世纪,遵循OAI协议的开源仓储软件 • 2000年University of Southampton推出Eprints系统 • 2001年Cornell University发布了Fedora(Flexible Extensible Digital Object Repository Architecture)系统 • 2002年Hewlett-Packard和MIT开发出了Dspace软件系统 • 数字仓储类型 • 机构仓储(Institutional Repository) • 主题仓储(Subject Repository) • eScholarship(如CDL) • Digital Commons(如DigitalCommons@ILR)
5 数字仓储研究与建设 • 开放存取仓储登记系统 • ROAR • 开放存取仓储登记系统 • University of Southampton于2005年建立 • 1645个数字仓储 • OpenDOAR • 开放存储仓储目录 • 2006年University of Nottingham大学构建 • 1593个数字仓储
5 数字仓储研究与建设 • 数字仓储联盟建设 • ARROW项目 • 澳大利亚2003年,(Australian Research Repositories Online to the World) • NARCI门户 • 荷兰于2006年 • DRIVER • 欧盟支持的项目 • Digital Repository Infrastructure Vision for European Research • 33个国家、249个仓储内容的查询。 • OAIster • OCLC的OAIster服务则实现了1100家数字仓储中2300万条元数据的收割和索引,被认为是数字仓储内容的联合目录
5 数字仓储研究与建设 • 数字仓储在教学、科研、实验等各个方面的深入应用 • eSciDoc项目 • 德国Max Planck Society 和FIZ Karlsruhe • JISC R4L • 英国 • R4L(Repository for the Laboratory) • JISC X4L • Exchange for Learning • JORUM学习对象仓储服务 • Hydra • University of Hull • 在RepoMMan、REMAP的基础之上,国际合作项目 • 目标构建一个数字仓储支撑的学术工作平台(Scholars' Workbench)
5 数字仓储研究与建设 • 数字仓储的互操作 • OAI-PMH • OAI-ORE • Deposit API • 英国的SWORD(Simple Web service Offering Repository Deposit)项目推动
9大思潮 • 数字化和数字资源研究与建设 • 门户研究与建设 • 集成和互操作研究与建设 • “下一代数字图书馆”研究与建设 • 数字仓储研究与建设 • 数字保存研究与建设 • 本体和语义网研究与建设 • Web 2.0 • 开放存取和开源
6 数字保存研究与建设 • 数字保存 • Digital Curation • Digital Archival • Digital Preservation • 发端于20世纪90年代末,风行于21世纪的00年代 • 早期 • Cedars(CURL Exemplars in Digital Archives)项目 • 欧洲的NEDLIB(Networked European Deposit LIBrary)项目 • 两者都开始于1998年