1 / 99

十年来数字图书馆技术发展研究

十年来数字图书馆技术发展研究. 中国科学院国家科学图书馆 张智雄 2010-09-29. 说明. 全文发表于 数字图书馆论坛, 2010 年第 3-4 期(创刊 5 年专刊) 二十一世纪前十年数字图书馆技术研究和系统建设的 9 个思潮. 序. 世纪之交之时,全球数字图书馆技术的研究正处于一个承上启下的时代 Digital Libraries Initiative(DL-I) 已经结束 (1994-1998) Digital Libraries Initiative - Phase 2 (DLI-2) 已经开始 (1998-2004). 序.

salvatore
Download Presentation

十年来数字图书馆技术发展研究

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 十年来数字图书馆技术发展研究 中国科学院国家科学图书馆 张智雄 2010-09-29

  2. 说明 • 全文发表于 • 数字图书馆论坛,2010年第3-4期(创刊5年专刊) • 二十一世纪前十年数字图书馆技术研究和系统建设的9个思潮

  3. • 世纪之交之时,全球数字图书馆技术的研究正处于一个承上启下的时代 • Digital Libraries Initiative(DL-I)已经结束(1994-1998) • Digital Libraries Initiative - Phase 2 (DLI-2)已经开始(1998-2004)

  4. • 世纪之交之时,全球数字图书馆技术的研究正处于一个承上启下的时代 • 欧盟(EU) • 5th Framework Programme (1998-2002) • User-friendly information society (IST)

  5. • 世纪之交之时,全球数字图书馆技术的研究正处于一个承上启下的时代 • 英国 • eLib计划进入第三期(1993-2001) • The Research Support Libraries Programme (RSLP)(1999-2004)正在开展

  6. • 世纪之交之时,全球数字图书馆技术的研究正处于一个承上启下的时代 • 学术界 • 2000年两个数字图书馆会议合并 • ACM Digital Libraries Conference • IEEE的Conference on Advances in Digital Libraries • 发起新的ACM/IEEE CS Joint Conference on Digital Libraries(JCDL)

  7. • 回顾二十一世纪00年代数字图书馆研究和建设的历程 • 活跃繁荣、与时俱进 • 以“思潮”来反映数字图书馆的研究和系统建设过程中出现 • 相关核心问题 • 技术理念 • 项目实践 • 系统建设 • “9”大思潮

  8. 9大思潮 • 数字化和数字资源研究与建设 • 门户研究与建设 • 集成和互操作研究与建设 • “下一代数字图书馆”研究与建设 • 数字仓储研究与建设 • 数字保存研究与建设 • 本体和语义网研究与建设 • Web 2.0 • 开放存取和开源

  9. 9大思潮 • 数字化和数字资源研究与建设 • 门户研究与建设 • 集成和互操作研究与建设 • “下一代数字图书馆”研究与建设 • 数字仓储研究与建设 • 数字保存研究与建设 • 本体和语义网研究与建设 • Web 2.0 • 开放存取和开源

  10. 1.数字化和数字资源研究建设思潮 • 数字化和数字资源建设是数字图书馆建设的基础 • 将主要精力投入到数字化项目中的数字图书馆,被称为“第一代数字图书馆” • Abby Smith • Harvard的Dale Flecke

  11. 1.数字化和数字资源研究建设思潮 • 20世纪90年代就是建设重点 • 1994年,美国国会图书馆发起了国家数字图书馆项目,以American Memory为标志性建设内容 • 1995年,在NSF和University of Michigan Digital Library Project资助的JSTOR项目(the Journal Storage Project)

  12. 1.数字化和数字资源研究建设思潮 • 近十年,两次数字化和数字化资源建设高潮 • 第一次在20世纪90年代末和21世纪00年代之初。 • 第二次在2004年10月Google发起Google Print项目之后

  13. 1.1 第一次 • 百万图书计划项目(The Million Book Project) • 美国Carnegie Mellon University和中国、印度 • “欧洲图书馆”项目(TEL) • 第五框架计划,2001年 • The European Library:Gateway to Europe‘s Knowledge, 9个国家图书馆 • Global Memory Net项目 • 2000年,NSF • Ching-chih Chen, Simmons College • 人类文化历史遗产图像资源 • 高校数字图书馆项目 • University of California,发起了California Digital Library(CDL),1997 • Harvard,图书馆数字计划(Library Digital Initiative,LDI), 1998年

  14. 1.1 第一次 • 百万图书计划项目(The Million Book Project) • 美国Carnegie Mellon University和中国、印度 • “欧洲图书馆”项目(TEL) • 第五框架计划,2001年 • The European Library:Gateway to Europe‘s Knowledge, 9个国家图书馆 • Global Memory Net项目 • 2000年,NSF • 人类文化历史遗产图像资源 • 高校数字图书馆项目 • University of California,发起了California Digital Library(CDL),1997 • Harvard,图书馆数字计划(Library Digital Initiative,LDI), 1998年

  15. 第二次 • 2004年12月Google Print Library Project项目 • 5家图书馆 • University of Michigan • Harvard (Harvard University Library) • Stanford (Green Library) • Oxford (Bodleian Library) • the New York Public Library • Google签署合作协议,将在十年内,实现1500万卷图书的数字化,并通过Google Books提供服务。 • 到2009年10月,Google宣布已经扫描了1000多万卷图书

  16. 第二次 • 2005年欧洲图书馆(TEL)联网服务开始 • 2008年Europeana开始上网服务 • 被认为是欧洲数字图书馆 • 在i2010计划的eContentplus 项目支持下 • 欧洲的100多家机构 • 目前数字资源包括了6百万条数字内容,内容类型涉及图像、文本、音频、视频等多种形式

  17. 第二次 • Internet Archives • 来源微软名为“Live Search Books” 的项目(2006年) • Gallica 2 • 法国国家图书馆的数字化图书项目 • Gallica 2 digitised book project( 2008年) • HathiTrust • Indiana University和University of Michigan来领导和构建 • (2008年)

  18. 第二次 • 全球数字图书馆(WDL) • 2009年4月 • 联合国教科文组织(UNESCO) • 美国国会图书馆 • 其它图书馆 • 高质量的、反映UNESCO成员国家的文化历史遗产

  19. 1.数字化和数字资源研究建设思潮 • 从技术上讲 • 推动了OCR、DRM(数字版权管理)、内容管理、数字对象、数字仓储等技术研究和发展 • 大规模数字化 • IMPACT项目(欧盟) • Goobi软件系统(SUB Göttingen)

  20. 9大思潮 • 数字化和数字资源研究与建设 • 门户研究与建设 • 集成和互操作研究与建设 • “下一代数字图书馆”研究与建设 • 数字仓储研究与建设 • 数字保存研究与建设 • 本体和语义网研究与建设 • Web 2.0 • 开放存取和开源

  21. 2 门户研究与建设 • 门户 • 客观上存在着资源和系统分散、独立存在的情况 • 如何将各类分布资源和服务按照相互关系进行有机组织,实现信息资源、信息服务和信息系统的整合,提供集成连贯的信息环境是数字图书馆建设的一个重要要求 • 随着互联网门户技术的发展,在数字图书馆界也出现了利用“门户”来解决上述资源和系统整合集成的思潮

  22. 2 门户研究与建设 • 门户 • 信息门户(Information Gateway) • 学术门户(Scholars Portal) • 主题门户(Subject Gateway) • 侧重于信息资源(特别是网络资源)整合的角度来构建门户 • Portal • 从技术框架和系统集成的角度出发 • 将各个独立存在的系统有机整合起来,提供一个集成连贯的用户环境

  23. 2.1信息门户 • 早期 • Electronic Libraries(eLib)项目 • 二十一世纪 • 英国 • 2000年发起了资源发现网络(Resource Discovery Network,RDN)项目 • 2006年,Intute信息门户 • 欧盟第五框架支持的Renardus项目 • 美国研究图书馆(ARL)于2002年发起的Scholars Portal Project项目 • 德国2003年开始在线服务的vascoda-portal项目

  24. 2.1信息门户 • 软件系统 • SPT • Scout Portal Toolkit • University of Wisconsin-Madison的The Internet Scout Project项目 • Andrew W. Mellon Foundation资助(2000年) • iVia • Library of the University of California, Riverside • 网络内容爬行、下载和索引的功能 • MyLibrary • Cornell University Library (2000年) • MyLibrary@NCState ( 2000年) • The North Carolina State University Library

  25. 2.2 Portal • 能够将各个独立存在的系统有机整合起来的一种软件系统框架 • 实现单点登录,集成许多其它系统 • 实现内容聚合,在一个页面上聚合来自其它多个来源的内容和信息 • 实现信息的有效传递,将适当的信息传递给适当的用户 • 构建面向用户的视图,使用户可以定制自己的门户界面 • 实现科研资源的集成和导航

  26. 2.2 Portal • 主要项目 • 英国JISC的Portals Programme • Portal技术 • Portlet技术 • 门户软件 • uPortal • Liferay • 单点登录软件(SSO) • Shibboleth系统

  27. 9大思潮 • 数字化和数字资源研究与建设 • 门户研究与建设 • 集成和互操作研究与建设 • “下一代数字图书馆”研究与建设 • 数字仓储研究与建设 • 数字保存研究与建设 • 本体和语义网研究与建设 • Web 2.0 • 开放存取和开源

  28. 3 集成和互操作研究与建设 • 在上世纪90年代末,数字图书馆互操作协议研究开始起步 • 1998到2000年间Herbert Van de Sompel及其同事完成了SFX的研究 • 1999年10月,4机构发起了OAI计划 • CLIR(图书馆和信息资源委员会) • DLF(数字图书馆联盟) • SPARC(学术出版和学术资源联盟) • ARL(研究图书馆协会) • 1999年10月的法兰克福图书展销会上,基于DOI和CrossRef的期刊全文(和参考文献)链接系统开始出现

  29. 3 集成和互操作研究与建设 • 21世纪,数字图书馆集成和互操作技术研究与系统建设的高潮 • CrossRef于2000年6月开始正式投入运行 • 2001年, OAI-PMH(The Open Archives Initiative Protocol for Metadata Harvesting)1.0版本发布 • 2004年OpenURL成为美国国家标准

  30. 3 集成和互操作研究与建设 • 检索协议 • 2002年推出了实验性质的SRW/SRU /CQL 1.0版本 • 2004年2月第一个正式的1.1版本发布 • 2007发布1.2版本在 • 2009年7月,OASIS Search Web Services Technical Committee推出了SRU 2.0和CQL 2.0草案

  31. 3 集成和互操作研究与建设 • 数字参考咨询 • 2004年由NISO Standards Committee AZ 发布问题/答案交换协议(QATP) • OAI-ORE • Open Archives Initiative Object Reuse and Exchange • Web资源聚合体进行描述和交换用的标准 • 2006年10月发起,2008年10月发布了OAI-ORE 规范的v1.0版本

  32. 3 集成和互操作研究与建设 • 元数据编码和传输标准 • 2001年由DLF提出元数据编码和传输标准(METS) • 2005年5月发布了PREMIS保存元数据字典

  33. 3 集成和互操作研究与建设 • 数字图书馆系统的参考模型 • 利用组件方式构建数字图书馆资源和服务的OCKHAM 框架 • 2007年DELOS提出的数字图书馆参考模型-Digital Library Reference Model

  34. 9大思潮 • 数字化和数字资源研究与建设 • 门户研究与建设 • 集成和互操作研究与建设 • “下一代数字图书馆”研究与建设 • 数字仓储研究与建设 • 数字保存研究与建设 • 本体和语义网研究与建设 • Web 2.0 • 开放存取和开源

  35. 4 “下一代数字图书馆”研究与建设 • 随着网络技术的进步,特别是00年代中期Web Services(包括Semantic Web Services)、P2P、GRID技术的盛行,SOA框架的兴起,很多数字图书馆研究者提出了“下一代数字图书馆框架”的理念

  36. 4 “下一代数字图书馆”研究与建设 • “下一代数字图书馆”框架 • 目标: • 将原先集中的、中心控制的系统转换成为一种基于P2P网络和SOA(Service-oriented Architectures)框架,可以根据数字图书馆的资源和服务的需求,灵活集成装配的架构 • 特点: • 分散的 • 灵活分布的 • 可按需组装的架构 • 支持数字图书馆项目的协作共建

  37. 4 “下一代数字图书馆”研究与建设 • 主要要求: • 可以按照一定的授权方式实现成员间数字内容、服务和计算资源的共享 • 可以根据需要动态地聚集相关的共享资源,以实现数字图书馆的按需构建

  38. 4 “下一代数字图书馆”研究与建设 • DelosDLMS • 2006年推出 • DELOS的下一代数字图书馆管理系统的原型系统 • 核心是构建大规模支撑的、可信赖的中间件系统环境OSIRIS • 封装了ISIS数字图书馆服务 • 实现文本、音视频的检索、可视化

  39. 4 “下一代数字图书馆”研究与建设 • OpenDLib • 2002年开发 • 2006年利用了gLite网格框架 • BRICKS • Building Resources for Integrated Cultural Knowledge Services • 基于P2P(peer-to-peer)架构 • 欧盟第6框架支持 • 文化遗产领域内知识和资源的共享

  40. 4 “下一代数字图书馆”研究与建设 • DILIGENT • 欧盟第6框架项目 • A Digital Library Infrastructure on Grid Enabled Technology • 将网格技术和数字图书馆技术有机集成 • 目标在于构建一个基于Grid的数字图书馆的实验平台,以促进相关的e-Science团体可以按一种安全、协调、动态和有效的方式来实现数字资源和知识的共享协作 • gCube目前已经成为一个被广泛应用的、基于网格的虚拟团队建设环境

  41. 4 “下一代数字图书馆”研究与建设 • 云计算技术 • 资源收集 • 信息存储 • 海量计算 • Apache hadoop开放云计算平台 • HDFS (Hadoop Distributed File System) • MapReduce • HBase (Hadoop database)

  42. 9大思潮 • 数字化和数字资源研究与建设 • 门户研究与建设 • 集成和互操作研究与建设 • “下一代数字图书馆”研究与建设 • 数字仓储研究与建设 • 数字保存研究与建设 • 本体和语义网研究与建设 • Web 2.0 • 开放存取和开源

  43. 5 数字仓储研究与建设 • “仓储” Repository • 21世纪的热词, • 数字内容管理系统 • 三特点:对数据、元数据进行管理;有具有提交、存储、导出功能;检索查询功能 • 20世纪90年代 就已经出现 • Los Alamos National Laboratory的arXiv.org • 英国University of Southampton的CogPrints • 存储电子硕博论文的NDLTD (The Networked Digital Library of Theses and Dissertations) • 当时它们被称为E-print Archive • OAI计划 • 对“Repository”进行了明确的定义,并提供了互操作的标准规范,客观上对Repository热潮的形成起到了推动作用

  44. 5 数字仓储研究与建设 • 21世纪,遵循OAI协议的开源仓储软件 • 2000年University of Southampton推出Eprints系统 • 2001年Cornell University发布了Fedora(Flexible Extensible Digital Object Repository Architecture)系统 • 2002年Hewlett-Packard和MIT开发出了Dspace软件系统 • 数字仓储类型 • 机构仓储(Institutional Repository) • 主题仓储(Subject Repository) • eScholarship(如CDL) • Digital Commons(如DigitalCommons@ILR)

  45. 5 数字仓储研究与建设 • 开放存取仓储登记系统 • ROAR • 开放存取仓储登记系统 • University of Southampton于2005年建立 • 1645个数字仓储 • OpenDOAR • 开放存储仓储目录 • 2006年University of Nottingham大学构建 • 1593个数字仓储

  46. 5 数字仓储研究与建设 • 数字仓储联盟建设 • ARROW项目 • 澳大利亚2003年,(Australian Research Repositories Online to the World) • NARCI门户 • 荷兰于2006年 • DRIVER • 欧盟支持的项目 • Digital Repository Infrastructure Vision for European Research • 33个国家、249个仓储内容的查询。 • OAIster • OCLC的OAIster服务则实现了1100家数字仓储中2300万条元数据的收割和索引,被认为是数字仓储内容的联合目录

  47. 5 数字仓储研究与建设 • 数字仓储在教学、科研、实验等各个方面的深入应用 • eSciDoc项目 • 德国Max Planck Society 和FIZ Karlsruhe • JISC R4L • 英国 • R4L(Repository for the Laboratory) • JISC X4L • Exchange for Learning • JORUM学习对象仓储服务 • Hydra • University of Hull • 在RepoMMan、REMAP的基础之上,国际合作项目 • 目标构建一个数字仓储支撑的学术工作平台(Scholars' Workbench)

  48. 5 数字仓储研究与建设 • 数字仓储的互操作 • OAI-PMH • OAI-ORE • Deposit API • 英国的SWORD(Simple Web service Offering Repository Deposit)项目推动

  49. 9大思潮 • 数字化和数字资源研究与建设 • 门户研究与建设 • 集成和互操作研究与建设 • “下一代数字图书馆”研究与建设 • 数字仓储研究与建设 • 数字保存研究与建设 • 本体和语义网研究与建设 • Web 2.0 • 开放存取和开源

  50. 6 数字保存研究与建设 • 数字保存 • Digital Curation • Digital Archival • Digital Preservation • 发端于20世纪90年代末,风行于21世纪的00年代 • 早期 • Cedars(CURL Exemplars in Digital Archives)项目 • 欧洲的NEDLIB(Networked European Deposit LIBrary)项目 • 两者都开始于1998年

More Related