380 likes | 502 Views
数字图书馆的发展趋势及关键技术. 主要内容. 1 、数字图书馆发展趋势 2 、数字图书馆技术分类 3 、数字图书馆关键技术. 1.1 图书馆发展总体趋势. 资源数字化 服务网络化 管理知识化. 1.2 图书馆学五法则. 书是为用的 每个读者有其书 每本书有其读者 节省读者的时间 图书馆是一个不断生长的有机体. 1.3 图书馆范式的变化. 1994 年,新加坡国家图书馆编 《2000 年的图书馆 》 中对图书馆发展范式的演变的描述: 从图书的保管者到面向服务本位的信息提供者 从单一媒体到多媒体 从本馆收藏到无边界图书馆
E N D
主要内容 • 1、数字图书馆发展趋势 • 2、数字图书馆技术分类 • 3、数字图书馆关键技术
1.1图书馆发展总体趋势 • 资源数字化 • 服务网络化 • 管理知识化
1.2图书馆学五法则 • 书是为用的 • 每个读者有其书 • 每本书有其读者 • 节省读者的时间 • 图书馆是一个不断生长的有机体
1.3图书馆范式的变化 1994年,新加坡国家图书馆编《2000年的图书馆》中对图书馆发展范式的演变的描述: • 从图书的保管者到面向服务本位的信息提供者 • 从单一媒体到多媒体 • 从本馆收藏到无边界图书馆 • 从我们到图书馆去到图书馆来到我们中间 • 从按时提供到及时提供 • 从馆内处理到外包处理 • 从区域服务到国际服务 ——摘自《战略思考——图书馆发展十大热门话题》,吴建中,上海图书馆
1.4图书馆的发展示意图 提升 服务 能力 数字服务 数字化 自动化 手工 文献传递 电子文献 网上咨询 学科馆员 拓展服务内容
1.4图书馆的发展示意图(二) 数字资源 系统 数字服务 环境 自动化 系统 数字图书馆 实体图书馆 手工 自动化 数字化 数字服务
1.4.1自动化阶段(一) • 特征 • 以自动化集成管理系统为核心开展服务 • 工作的重点 • 回溯编目、业务规范 • 提高服务能力与效益;拓展服务项目 • 大学图书馆系统(University Library System)
1.4.1自动化阶段(二) • 难点 • 谁来消灭自动化系统的死角? • 系统商?还是自动化部门? • 众多离散系统的读者认证 • 图书馆自动化管理系统、电子阅览室管理系统、图书馆门禁系统、馆际互借与文献传递系统 • 与信息化校园的接口 • 部门协调
1.4.2数字化阶段(一) • 特征 • 稳步增长的数字资源,用户培训 • 本馆资源的数字化 • 工作的重点 • 有步骤地建立核心数字资源馆藏 • 建立数字资源分级保障机制 • 馆际互借与文献传递 • 用户培训
1.4.2数字化阶段(二) • 难点 • 买什么?加工什么? • 谁来加工整理? • 数据加工标准? • 资源如何整合? • 存储体系的建立? • 在线、近线、离线、备份
1.4.3数字服务阶段(一) • 特征 • 大量的、较完善的数字资源体系 • 众多的服务系统 • 虚拟参考咨询、学科馆员成为发展重点之一 • 工作重点 • 数字资源的整合、评估、调整与管理 • 数字图书馆系统的选型与构造 • 图书馆管理范式的调整
1.4.3数字服务阶段(二) • 难点 • 数字图书馆标准规范 • 专业人才:尤其是业务与技术双修的人才 • 巨大的资金缺口:建设与维护
1.5新的动向 • E-learning • Open Access • 智能化
2 数字图书馆的核心技术分类 • 以系统为中心的核心技术 • 以内容为中心的核心技术 • 以用户为中心的核心技术
2.1以系统为中心的核心技术: 数字图书馆必须利用高端服务器、多类网络通信技术、智能存储系统、将面向对象的软件技术、人工智能技术与先进的知识组织和调度系统相结合,建立具有很好的可扩展性、易用性、可管理性和高可用性以及较强的可持续发展能力的数字图书馆系统和群体。
基于并行和集群技术的数字图书馆中心服务器;基于并行和集群技术的数字图书馆中心服务器; • 通用数字对象命名体系的设计和实现; • 大型分布调度系统设计与实现; • 数字图书馆的信息通信基础设施:无线网络、有线网络、宽带网络、P2P网络等相关技术; • 通用数字图书馆支撑平台的设计和开发; • 信息安全机制和技术; • 海量多媒体信息的采集、压缩、表现和数字化技术等; • 基于分布、异构、海量环境下的数字图书馆体系结构的研究和设计; • 基于多种主体(Agent)的人工智能技术在数字图书馆的应用; • 中间件技术; • 数字图书馆系统的运行与维护等。
2.2以内容为中心的核心技术: 以内容和收藏为基础的数字图书馆研究注重于更好理解并完善获取新的电子内容和收藏的途径,鼓励跨学科研究,鼓励所有学科领域的参与。建设数字图书馆的核心是内容建设,也就是用一套中性技术(例如:XML)对数字知识内容资源加以组织与管理。具有超大规模、分布式的、可扩展的多媒体知识资源库,是发挥数字图书馆作用的基础;加工内容资源必须采用多种国际标准与工业规范去标引和组织,以达到一次加工、长期使用、以及多种内容资源可互操作的目的。
元数据的标准和规范 • 知识资源(含声、像、图、文)的通用型加工系统; • 语法层次的大容量文献自动采集;自动篇名生成、自动标引、自动文摘生成的实用化技术。 • 知识概念(语义)体系的建立;实现语义层次的自动标引、自动文摘生成。 • 分布式藏品元数据的聚集与元数据库的构建; • 超大规模多媒体数字资源的长久保存、归档和存储管理技术,包括档案系统等; • 数字内容藏品的版权管理系统; • 数字对象和媒体的新型经济与商务模型研究; • 与创建和使用数字收藏有关的社会经济法律问题的技术、方法、过程;
2.3以用户为中心的核心技术: 数字图书馆的建设以不断改善用户服务为最终目标,必须为用户在知识发现与利用上提供高效方便的工具,并且使得用户可方便地透过数字图书馆的多个资源库无缝获取所需的知识。以人为中心的数字图书馆研究试图进一步了解数字图书馆在增强人类在创造、探索、使用信息方面的活动中的影响和潜力,并促进为这些活动设计的技术的研究。
先进的高效导航系统; • 适用于TB级数据的高效搜索引擎; • 开发实用的多语言、多文字、多文化以及个性化用户界面; • 个性化、智能的主动服务技术; • 保证藏品的安全和完整性技术;包括信息过滤系统;隐私权保护技术; • 实现数字图书馆群与科学数据库群内容的集成性服务; • 对新型媒体知识产权处理形成合乎法律框架的新的经济和商业模型; • 用户工具软件;基于因特网的协同工作技术和工具 • 用户和可使用性研究,包括人-机交互、以人为中介的交流、有特殊需求的用户和机构。
3 关键技术 • 分布式技术 网格技术、P2P • 智能技术 人工智能、知识网络、神经网络、专家系统 • 开放源码 自动化系统、服务软件 • 数据挖掘、数据仓库 自建数据库、联机检索、智能标引 • 虚拟技术 虚拟现实、虚拟学习( e-Learning ) • 其他技术
3.1 基于网格的数字图书馆 • 3.1.1 网格是什么? • 3.1.2 Grid Classification • 3.1.3 Five Main Grid Projects in China • 3.1.4网格服务的特征和目标 • 3.1.5 网格图书馆系统结构
3.1.1网格是什么? 网格是把整个网络整合成一台虚拟的巨大超级计算机,实现计算资源、存储资源、数据资源、信息资源、文献资源、知识资源、专家资源等的全面共享。总之,网格可以实现分布在全球的硬件资源、软件资源和各种信息知识资源全面的连通,达到资源的最大共享。
Service Grid Sharing of Application Software & Information Resource 3.1.2 Grid Classification Sharing of High Performance Computer System Computational Grid Sharing of Database & File System Data Grid
3.1.2 Grid Classification • 由于网格的不同作用,它被划分成不同的类型。 如:计算网格、设备网格、数据网格、远程沉浸网格、信息服务网格等。
3.1.3 Five Main Grid Projects in China • China National Grid – CNGrid (Ministry of Science and Technology ) • China Education and Research Grid – ChinaGrid (Ministry of Education) • China Semantic Grid Project (Ministry of Science and Technology ) • China Science Grid Project (National Science Foundation) • Shanghai City Information Grid
3.1.4网格服务的特征和目标 • 一次登录,访问全球分布式信息资源 • 全世界有用的信息资源可共享 • 基于自然语言的语义检索并进行资源整合 • 可提供学科的个性化服务 • 基于知识挖掘、过滤、推荐等提供最小化的知识子集 与数字图书馆的建设目标完全一致
基于网格的数字图书馆服务模式 全球数字图书馆可以提供基于语义的检索服务、虚拟参考咨询服务、主动推送服务、定题信息服务、个性化信息服务、培训服务等。这些都要建立在多语言库的基础之上,需要全球的各个数字图书馆协同服务。
3.2 智能技术 利用智能技术中的专家系统、语义网络等可实现: • 智能参考咨询 • 智能藏书决策(采访)、决策支持 • 智能分编 • 智能标引 • 智能搜索 • 智能信息推送……
网上参考咨询平台 • FAQ Database---->KW DB • Email,Web Form • E--Learning Center • Expert System • Collaborative VRS • VRS Real-time System Based on Knowledge Database • Technology: PagePush, Co-Browse, Sharing-Application, WhiteBoard
专家系统结构图:专家系统由两大部分组成:开发环境、咨询环境四大主要部件:知识库、推理机、用户接口、动态库专家系统结构图:专家系统由两大部分组成:开发环境、咨询环境四大主要部件:知识库、推理机、用户接口、动态库 用户 专家 人机接口 动态库 文档 知识获取 解释机构 知识库 推理机 数据库
3.3 开放源码 • 开放源码(open source)软件是一个新名词,它被定义为描述其源代码可以被公众使用的软件,并且此软件的使用、修改和分发也不受许可证的限制。 • 开放源码软件通常是有版权(copy-right)的,它的许可证可能包含这样一些限制:着意保护它的开放源码状态,著者身份的公告,或者开发的控制。 • 美国OSI(Open Source Initiative)是国际公认的开放源码产业模式的非官方、非赢利的社会团体,在业界具有一定的权威性。声明为“开放源码”的软件可以由OSI给予认证标志。
3.4 数据挖掘、数据仓库 • 数据挖掘的概念 • 从数据中抽取有价值的信息,其目的是帮助决策者寻找数据间潜在的关联,发现被忽略的要素,而这些信息对于预测趋势及决策行为是十分有用的 • 数据仓库与数据挖掘之间的关系 • 数据仓库是数据挖掘的基础 • 数据挖掘促进并指导数据仓库的建设
3.5 虚拟技术 • 虚拟学习 提供虚拟学习、虚拟实习、虚拟考试的环境。
3.6 其他技术 • 信息的传递技术、压缩技术 • 权限管理技术 • WEB2.0技术 • 信息抽取技术 • IPv6技术 • 数字图书馆的支撑技术 系统集成、网络、web、数据库、服务器、存储、系统安全