400 likes | 498 Views
数字图书馆标准规范建设与应用 北京交通大学图书馆 张 彦 2008 年 4 月. 目录. 开放环境下的数字图书馆 数字图书馆标准规范的建设框架 数字图书馆内容创建的标准规范 数字图书馆对象描述的标准规范 数字图书馆信息服务与管理的标准规范. 1. 开放环境下的数字图书馆. 1.1 我们所面临的环境 用户角度:以用户为中心的信息环境 信息环境:多元、关联、交互的数字信息过程 信息服务:基于馆藏、基于集成、基于用户. 1. 开放环境下的数字图书馆. 1.2 我们所遇到的问题 处于分布、异构和动态变化的信息资源和服务环境中
E N D
数字图书馆标准规范建设与应用 北京交通大学图书馆 张 彦 2008年4月
目录 • 开放环境下的数字图书馆 • 数字图书馆标准规范的建设框架 • 数字图书馆内容创建的标准规范 • 数字图书馆对象描述的标准规范 • 数字图书馆信息服务与管理的标准规范
1.开放环境下的数字图书馆 1.1 我们所面临的环境 • 用户角度:以用户为中心的信息环境 • 信息环境:多元、关联、交互的数字信息过程 • 信息服务:基于馆藏、基于集成、基于用户
1.开放环境下的数字图书馆 1.2 我们所遇到的问题 • 处于分布、异构和动态变化的信息资源和服务环境中 • 必须能够被用户在复杂的网络环境下方便利用 • 能被第三方系统方便利用,能够方便利用第三方系统
1.开放环境下的数字图书馆 1.3 我们要做的:可使用性、互操作性、可持续性 • 可使用性:资源和服务能够在网络环境和复杂的技术条件下被用户方便的使用 • 互操作性:在网络环境上与其它系统进行信息交换功能、组合; 服务集成;流程协同的能力 • 可持续性:在变化的环境下长期使用的能力
1.开放环境下的数字图书馆 遵循开放标准规范是数字图书馆建设的基本原则。 这不是技术选择的自由 而是对用户和历史的责任
目录 • 开放环境下的数字图书馆 • 数字图书馆标准规范的建设框架 • 数字图书馆内容创建的标准规范 • 数字图书馆对象描述的标准规范 • 数字图书馆信息服务与管理的标准规范
2.数字图书馆标准规范建设框架 实施指南 建设规范 加工规范 标识规范 基本元数据 专门元数据 检索规范 资源集合元数据 高层元数据 规范预研 元数据等级系统 发展战略 建设机制 核心标准规范体系 开放发展机制
目录 • 开放环境下的数字图书馆 • 数字图书馆标准规范的建设框架 • 数字图书馆内容创建的标准规范 • 数字图书馆对象描述的标准规范 • 数字图书馆信息服务与管理的标准规范
3.数字图书馆内容创建的标准规范 • 3.1数字内容加工过程的标准规范 前加工过程、加工的内容标准、加工过程规范、后加工过程 • 3.2内容编码标准规范 内容编码、格式组织、内容标识、复合对象格式 • 3.3格式标准规范 格式体系,文本,图像,视频,音频等 • 3.4数字对象标识规范 唯一标示符命名体系,优先采用URI或者Info命名域 图书期刊论文集:推荐标准---最低标准 报纸海报年画剪纸:推荐标准---最低标准 古籍(善本家谱方志):推荐标准---最低标准 手稿乐谱草图:推荐标准 照相缩微胶片:推荐标准 音频资料:推荐标准---保存、应用 视频资料:最低标准---保存
目录 • 开放环境下的数字图书馆 • 数字图书馆标准规范的建设框架 • 数字图书馆内容创建的标准规范 • 数字图书馆对象描述的标准规范 • 数字图书馆信息服务与管理的标准规范
4.数字图书馆对象描述的标准规范 • 4.1 基本元数据标准 • 4.2 基本元数据扩展标准、基本元数据应用规范 • 4.3 专门元数据
4.1 基本元数据标准 元数据的基本概念 元数据:对信息资源进行结构化描述的数据,用来规定数字化信息的组织和描述规则的一种数据结构标准。 • 元数据的内涵:由语义、内容标准和句法三部分构成。
4.1 基本元数据标准 • 元素定义说明 定义:对元素概念与内涵说明 数据类型:元数据值所表现的数据类型 频次范围:元素识用频次范围[0,∞) 注释:关于元素或者应用的其他说明
基本元数据核心集(15个元素) 名称:名称 标签:title 统一资源定位符:http://cdls.nstl.gov.cn/basic/terms/title 定义:资源名称及说明文字 必备性:由则必备 可重复性:可重复 术语类型:元素 元素修饰词:交替名称
4.2 基本元数据扩展标准 • 4.2.1 术语概念 • 4.2.2 扩展集元素定义规则 • 4.2.3 扩展集的组成结构* • 4.2.4 扩展集元素定义
4.2.1 术语概念 • 修饰词: 修饰词是元素修饰词和编码体系修饰词的统称。 修饰词和元素一样识资源的一个属性 • 元素修饰词: 对元素细化或者限定时期更具有专职性和精确性 • 编码体系修饰词: 用来帮助解析某个术语值的上下文信息或解析规则。 形式包括受控词表、规范标示或解析规则。 编码体系修饰词包括两类:词表编码体系修饰词 句法编码体系修饰词
4.2.2 扩展集元素定义规则 • 定义:对修饰词概念与内涵的说明 • 数据类型:元素值中所表现的数据类型 • 频次范围:术语使用的频次范围 • 注释:修饰词的应用注释 • 修饰:指出该术语所修饰的元素 • 术语类型:元素修饰词还是编码体系修饰词
4.2.3 扩展集的组成结构 元素修饰词和编码体系修饰词列表
4.2.4 扩展集元素定义 • 基本元数据标准定一了15个核心元数据30个扩展元数据 • 在所定义的修饰词不能满足专门领域活具体应用的识继续趋势,可以服用其他方案的修饰词,也可以根据应用规范补充和修饰元素
4.2 基本元数据扩展规则 横向元素扩展:尽可能复用本领域相关元数据 纵向限定扩展:遵循(dumb-down)向上兼容原则 从横向纵向两个方向扩展形成专门元数据规范
Marc到基本元数据的映射 1.CNMARC到基本元数据的映射
4.3专门元数据 • 4.3.1专门元数据基本结构 • 4.3.2专门元数据元素组成 • 4.3.3专门元数据扩展规则
4.3 专门元数据 • 基本元数据和专门元数据的关系 拓片 论文元数据 古籍元数据 基本元数据 电子图书元数据 拓片元数据
4.3 专门元数据 • 4.3.1基本结构 核心元素: 在各类资源对象中通用,核心元素复用DC的15个基本元素,在该层上与其它系统进行交换,支持通用的检索工具。 资源类型核心元素: 根据资源对象特点,参照其他元数据标准制定,在同一类型数字资源中通用。不同的资源类型可有不同的资源类型核心元素设置及其予以定义,应用时要求遵守本资源类型的相关规则和定义。 个别元素: 以某种特定的资源对象为基础制定,尽是用于这类对象,不用于交换。
4.3专门元数据 • 4.3.2专门元数据元素组成---核心元素集
4.3专门元数据 • 4.3.2专门元数据元素组成—资源类型核心元素 • 古文献系列核心元素 • 版本类别载体形态 • 馆藏信息 • 视音频系列:版本、受众、背景、源载体 • DC-LIB应用纲要中的三个要素:edition\location\audience
4.3专门元数据 • 元素组成---个别元素 • 学位论文 学位 • 元素组成—修饰词 元素修饰词 编码体系修饰词 • 元数据医院数据规范结构举例
4.3专门元数据的扩展规则 • 横向扩展:元素层面 • 应遵守核心元素,资源类型核心元素,个别元素的结构组成 • 各元数据标准尽可能采用核心元素集推荐的元数据项,并在语义上保持一致 • 对推荐的元素不能描述特征的可以增加元素,但与已有元素不能有任何语义上的重复
4.3专门元数据 • 纵向扩展原则 • 为了更准确的描述对象,可以使用修饰词的方式向下扩展一层 • 尽可能使用DCMI制定的修饰词,以及各个应用方案中的修饰词,例如dc-education,dc-lib. • 尽可能遵守dumb-dowm向上兼容原则
4.3专门元数据 参考资料: 期刊、会议、学位论文元数据规范及著录规则 肖珑.中文元数据概论与实例.北京图书馆出版社.2007 http://cdls.nstl.gov.cn/2003/SpcMetadata 期刊论文元数据规范 期刊论文元数据著录规则 会议论文元数据规范 会议论文元数据著录规则 学位论文元数据规范 学位论文著录规则
专门元数据参考资料 • 张晓林.元数据研究与应用.北京:北京图书馆出版社,2002 • 中国高等教育文献保障系统管理中心.中国高等教育数字图书馆技术标准与规范,2004 • 曾蕾,张甲,张晓林.元数据标准的演变.中国图书馆学报,2003(4),p10-14 • 中国高等教育数字图书馆 • 肖珑,陈凌.中文元数据标准扩昂价一其应用.大学图书馆学报,2001,19(5) ,p29-35 • http://www.w3.org • http://dublincore.org • http://www.cadlis.edu.cn • http://cdls.nstl.gov.cn/cdls2/w3c • http://62.105.139.81:8080:metac
目录 • 开放环境下的数字图书馆 • 数字图书馆标准规范的建设框架 • 数字图书馆内容创建的标准规范 • 数字图书馆对象描述的标准规范 • 数字图书馆信息服务与管理的标准规范
5.数字图书馆信息服务与管理的标准规范 • 依赖元数据收集的仓储/聚合型 --- OAI-PMH元数据获取协议 • 依赖计算机处理能力和标准协议的元搜索 ----Z39.50协议
依赖元数据收集的仓储/聚合型 通过抽取、映射等手段从多个分布的异构资源提供者的仓储中(Repository)收割(Harvest)元数据,将之集中保存在本地系统,并在此基础上提供统一的检索和增值服务。 数据提供者只要遵循OAI协议的相应要求,提供OAI接口,把自己的元数据暴露出来,服务提供者就可按照OAI协议采集元数据,对外提供相应的服务。
依赖计算机处理能力和标准协议的元搜索 元搜索就是用户只递交一次搜索请求,由元搜索引擎负责转换处理后提交给多个预先选定的独立搜索引擎,并将所有查询结果集中起来以整体统一的格式呈现到用户面前。而这种元搜索所采用的标准协议主要就是Z39协议。 • Z39.50协议是分布式虚拟联合数据库检索体系,其目的是实现网上多个数据库检索,规范查询格式,简化检索过程,实现异构系统和不同图书馆系统之间的通信.根据这一标准建立的检索系统可以检索多种不同类型的信息,如文本、图像和多媒体资源等。实现不同数据库系统之间通信,使异构数据库系统及异构网络相互传递信息,目前Z39已经成为一种通用的数据库接口规范。目前国内外的检索系统,尤其是图书馆自动化系统陆续支持Z39.50检索协议,馆际间OPAC系统资源整合主要运用Z39标准。OCLC、CSA、OVID、EBSCO、GALE等国外大型数据库都支持Z39检索协议。
参考内容 • 我国数字化图书馆标准语规范建设网站 • http://cdls.nstl.gov.cn • 《数字图书馆标准规范发展趋势》 • 《我国数字图书馆标准规范建设与应用实施指南》 • 其它数字图书馆标准规范研究报告 • 其它数字图书馆标准规范
版权所有 请勿转载 谢 谢