1.08k likes | 1.29k Views
北京大学研究生课程进修班 2005 上海. 元数据与互操作. 刘炜 wliu@libnet.sh.cn. 元数据的互操作协议和标准. 元数据的互操作 元数据的映射 元数据的互操作机制 — 标准的资源描述框架 OpenURL 标准 Z39.50 协议标准 OAI 元数据互操作协议. 整合检索模式. 集中式 联合目录 联合编目系统 人工上传批处理 采用协议,自动收割 (Harvesting) 元数据 ,如 OAI 分布式联合目录 采用标准协议实时查询各资源站点的元数据 ,如 Z39.50, SDLIP, OpenURL
E N D
北京大学研究生课程进修班 2005 上海 元数据与互操作 刘炜 wliu@libnet.sh.cn
元数据的互操作协议和标准 • 元数据的互操作 • 元数据的映射 • 元数据的互操作机制—标准的资源描述框架 • OpenURL标准 • Z39.50 协议标准 • OAI元数据互操作协议 北京大学研究生课程进修班 2005 上海
整合检索模式 • 集中式联合目录 • 联合编目系统 • 人工上传批处理 • 采用协议,自动收割(Harvesting)元数据,如OAI • 分布式联合目录 • 采用标准协议实时查询各资源站点的元数据,如Z39.50, SDLIP, OpenURL • 采用动态页面分析技术,以元搜索方式实时查询资源站点元数据。 北京大学研究生课程进修班 2005 上海
互操作的现实目标 整合下述资源: • Abstracting/Indexing Services • Publishers (e.g. Elsevier ScienceDirect) – important to be able to pull togther • Aggregators • Electronic reserves • Local databases including digitization projects • OAI resources • Institutional repositories 北京大学研究生课程进修班 2005 上海
总控管理 用户界面 资源定制 检索参数定制 检索结果保存 用户管理 Session管理 认证管理 日志管理 统一检索入口 统一格式结果反馈 针对特定资源的元数据 结果格式转换配置文件 检索请求处理API 连接器引擎 API 检索结果处理API 检索请求处理模块 各协议连接器引擎 检索结果处理模块 HTTP连接器 Z39.50连接器 JDBC连接器 OAI连接器 Internet数据源 Z39.50服务器 本地数据库 OAI服务器 跨库检索系统 北京大学研究生课程进修班 2005 上海
靜態連結 • 是以批次的方式先行演算好 • 在查詢時便是以即時回應的方式呈現 • 而這種方式大都是一對一的形式 • 故使用者無法從此獲得更多的資訊需求。 • 例:Silver Platter’s SilverLinker • 因有執行維護與更新的工作,故不會出現Access Denied的訊息 北京大学研究生课程进修班 2005 上海
靜態連結 北京大学研究生课程进修班 2005 上海
動態連結 • on the fly • 電子期刊文章被查詢時,才產生其連結的URL • 此動態的連結主要是和metadata相配合 • Metadata的品質愈好則連結的效果愈好。 • link-to • 缺乏標準的型式來演算動態連結的URLs • deeper link 北京大学研究生课程进修班 2005 上海
How to interlinking • 開放性的連結機制 • OpenURL • 建立聯合目錄 • OAI開放檔案詮釋資料擷取協定 (Open Archives Initiative Protocol for Metadata Harvesting) • 數位資源的統一編碼(命名)是更基本的問題 北京大学研究生课程进修班 2005 上海
DOI Metadata DOI - CrossRef DOI 參考資料 北京大学研究生课程进修班 2005 上海
DOI link URL to Publisher DOI Metadata DOI - CrossRef 參考資料 DOI http://dx.doi.org/10.1093/toxsci/57.1.95 北京大学研究生课程进修班 2005 上海
OpenURL • 在Web間傳遞訊息的機制 • 定義 • 應用於Web上超連結的一種標準陳述語法。 • 藉由已經定義好的標籤 (Tag),增進Web超連結能力。 • 規範 • 定義一個標準INTERNET資料連結的陳述語法。 • 讓服務提供者(Target)可以輕易解析資料提供者(Source)所傳送的要求。 • 而資料提供者(Source)輕易對服務提供者(Target)送出深度連結服務要求。 北京大学研究生课程进修班 2005 上海
OpenURL 北京大学研究生课程进修班 2005 上海
OpenURL • 協定內容 • 基本語法是與一般Internet上CGI程式所用的HTTP GET與HTTP POST類似 • 完整的OPENURL語法有兩部分: • BASE-URL就是用來接收OPENURL資料的啟始位置,如http://www.sfx.co.il/sfxmenu。 • DESCRIPTION這部分就是要送給服務提供者的metadata物件細節。 每個metadata物件間以&符號區隔。 北京大学研究生课程进修班 2005 上海
OpenURL =BASE URL+ QUERY • 透過Metadata(Value),如:ISSN、ISBN嵌入於URL • http://server.lanl.gov/menu?genre=article&issn=12345678&volume=12&issue=3&spage=1&epage=8&date=1998&aulast=Smith&aufirst=Paul • 還可以透過如該資訊資源的識別資料-DOI • http://server.lanl.gov/menu?id=doi:10.1000/6382-1 北京大学研究生课程进修班 2005 上海
索摘資料庫 • 動態地將metadata 帶給中介的服務機構 OpenURL 電子文件 中介的服務機構 OpenURL OpenURL OPAC OpenURL • 連結系統 • 可描述文件 全文資料庫 透過OpenURL查詢 分散在各處的資料 北京大学研究生课程进修班 2005 上海
索摘資料庫 OpenURL 電子文件 OpenURL OpenURL OPAC server OpenURL 全文資料庫 以SFX為中介的服務機構 的做法 北京大学研究生课程进修班 2005 上海
SFX • 以OpenURL為效尤的開放性連結解決辦法 • 透過標準化的服務做跨系統查詢 • 可實現不同WEB學術資訊資源的動態連結: • 索摘資料庫、引文資料庫、OPAC及WEB資源 • 能提供各種统計報表 • 點選SFX按鈕的次数 • 透過SFX下載全文的次數 北京大学研究生课程进修班 2005 上海
SFX Server • 提供者(source):指資訊代理商的各種資源 • 如:Medline、Web of science、OPAC • 透過SFX的hooks機制,使各圖書館能連結各資源 • 服務提供者(service):用來接受OpenURL的輸入 • 分析和評估傳來的metadata,確定要連結目標 • 如:館藏、全文、目次、摘要服務 • 目標(targets):各種形式的電子資源 • 包括電子期刊、OPAC、ILL、索摘資料庫、百科全書等 北京大学研究生课程进修班 2005 上海
Sourse – Service - Target Service Source Target 北京大学研究生课程进修班 2005 上海
DOI – CrossRef – OpenURL - SFX DOI link OpenURL aware DOI Metadata Server 參考資料 DOI http://dx.doi.org/10.1093/toxsci/57.1.95 北京大学研究生课程进修班 2005 上海
獲得館藏資料 北京大学研究生课程进修班 2005 上海
取得WOS的資料 http://sfxserver.uni.edu/sfxmenu?sid=Provider2:AI1&pid=987641 北京大学研究生课程进修班 2005 上海
Z39.50标准和 协议 • Z39.50标准的名称: 信息检索--应用服务定义与协议规范 • Z39.50协议是在分布式网络环境下, 用以支持信息搜索和信息检索的计算机系统间的通信协议 北京大学研究生课程进修班 2005 上海
标准所依据的相关技术基础 • 标准规定了数据库管理系统的客户端和服务器端对话的规则。 • 这种规则建立在客户机/服务器的体系结构基础之上。 • 数据库客户端和服务器端的通讯通过网络实现。 北京大学研究生课程进修班 2005 上海
标 准 Z39.50--1988 Z39.50--1992 Z39.50--1995 标准规范的协议 Z39.50第一版 Z39.50第二版 Z39.50第二版和第三版 Z39.50标准与协议的 对应关系 北京大学研究生课程进修班 2005 上海
源端与目标端的概念 • Z39.50标准是按典型的客户机/服务器体系结构定义的。 • 在Z39.50标准术语中,客户端计算机和服务器在通讯过程中分别被称为“源端”(Origin)和“目标端”(Target)。 • 使用“源端”和“目标端” 代表客户机与服务器描述数据通讯过程,是为了概念上更准确。 北京大学研究生课程进修班 2005 上海
Z39.50信息检索模型 用户界面 数据库 数据集 搜索 搜索 检索结果 数据库记录 转换 转换 检索 客户端 Z-server 检索结果 北京大学研究生课程进修班 2005 上海
根据Z39.50标准实现的图书馆管理系统 标准数据格式及统一的检索逻辑 Z39.50标准接口 BER编码 TCP/IP或其它协议 北京大学研究生课程进修班 2005 上海
设施、服务与操作 • Z39.50标准规定了源端和目标端互操作的规范。 • 这些操作抽象为设施和服务,并对其过程作出各种约定。 • 这些设施中的服务,需要通过特定的操作指令来表达。 • 配合这些操作指令,还约定了属性集和记录语法,用代码来表示特定的操作属性和记录语法形态。 北京大学研究生课程进修班 2005 上海
Z39.50标准的主要内容 设施名称 服务名称 • 初始化 初始化 • 搜索 搜索 • 获取 提交、分段 • 删除结果集 删除 • 浏览 扫描 • 排序 排序 • 存取控制 存取控制 • 帐务与资源管理 资源管理、触发资源管理、资源报告 • 解释 (使用搜索和获取设施中的服务) • 扩展服务 扩展服务 • 终止 关闭 北京大学研究生课程进修班 2005 上海
机制 记帐/资源控制机制 解释机制 扩展服务群机制 终止机制 机制中的服务 资源控制服务、触发资源控制服务、资源报告服务 扩展服务群服务 关闭服务 Z39.50协议的服务与机制 北京大学研究生课程进修班 2005 上海
Z39.50的操作 Z39.50标准描述了八种操作类型: • Init(初始化) • Search(检索) • Present(提交) • Delete(删除) • Scan(扫描) • Sort(排序) • Resource-report(资源报告) • Extended-services(扩展服务)。 北京大学研究生课程进修班 2005 上海
关于属性集 在Z39.50标准实施中,bib-1是最主要的属性集,包括6组属性或属性类型: • 使用属性:指定搜索过程将要访问的检索点。 • 关系属性:指定用户输入的检索词与数据库索引值的关系。 • 截断属性:指定检索词在索引的哪一部分作为命中条件。 • 完整性属性:指定检索词在索引中是唯一值或非唯一值。 • 位置属性:指定在索引字段中与检索词相关的内容应出现在哪个位置。 • 结构属性:指定搜索的格式。 北京大学研究生课程进修班 2005 上海
关于记录语法 • 简单无格式文本记录语法(Simple Unstructured Text Record Syntax,简称SUTRS)。 • 通用记录语法(Generic Record Syntax,简称GRS-1)。 • 公共目录记录语法(OPAC Record Syntax)。 • 摘要记录语法(Summary Record Syntax,简称Summary)。 • 扩展置标语言(EXtensible Markup Language,简称XML)。 北京大学研究生课程进修班 2005 上海
机读目录的记录语法定义 • Z39.50对机读目录格式记录语法的定义,是为每一种机读目录格式分配一个对象标识号(object identifier number)。下面列出了Z39.50支持的机读目录格式类型: 北京大学研究生课程进修班 2005 上海
关于Profile(描述文件) 由于Z39.50是一个非常灵活的标准,执行这个标准还需要通过制定相应的profile(描述文件)以保证系统的互操作性。图书馆界制定的Bath Profile,就是被图书馆界普遍接受的描述文件。使用描述文件的好处是: • 使多数据库检索过程更为容易。 • 检索结果更为准确。 • 检索结果更为精练。 转下页 北京大学研究生课程进修班 2005 上海
(接上页) • 用户对支持这个描述文件的服务器进行检索时,可以保持同样的界面环境并得到更高质量的检索结果。 • 图书馆不必为每个数据库资源逐一定义检索方式,而是利用国际上由专家在描述文件中设计的方式。 • 提高多数据库检索的效率。 • 借鉴Bath描述文件建立本地的描述文件,可以减少另外设计描述文件的时间。 • 用户只需要向软件供应商了解产品如何支持某个国际标准描述文件,而不是问软件供应商如何定义自己的标准。 北京大学研究生课程进修班 2005 上海
客户机与服务器之间通讯的一般原理 北京大学研究生课程进修班 2005 上海
Z39.50的基本服务 Z39.50应用程序在实现其功能的过程中,根据需要选择这些服务。有三种服务是最基本的服务: • 初始化(Initialization) • 搜索(Search) • 提交(Present) 在各种现有的Z39.50应用中,通常都包括了上述三种服务功能。 北京大学研究生课程进修班 2005 上海
基本服务之一:初始化 初始化是在任何查询过程中的第一步。在这个服务中,源端需要: • 向目标端表明自己的身份 • 与目标端约定某些后续查询处理过程中的基本规则 • 与目标端交换验证信息的具体内容 北京大学研究生课程进修班 2005 上海
基本服务之二:搜索 • 搜索功能包括了系统的主要工作 • 由源端向目标端提交查询请求这些查询请求可以是非常简单的请求,也可能是含有复杂逻辑检索式(与、或、非、大于、小于等等)的请求。 • 服务器端通常使用描述文件(Profiles)说明支持的服务类型和应用程序兼容性,很多描述文件还说明了哪些是本系统能够支持的检索属性。 北京大学研究生课程进修班 2005 上海
基本服务之三:提交 提交功能的作用是说明管理结果被返回用户端时的形态。在提交功能中,用户可以: • 指定提供记录的数量,例如:当命中记录较多时,只提交前十条命中的记录。 • 指定提供记录的格式,例如:要求按英国机读格式标准提交,不要按美国机读格式标准提交。 北京大学研究生课程进修班 2005 上海
Z的下一代 北京大学研究生课程进修班 2005 上海
SRW/U • SRW • Search and Retrieve Web Service • SRU • Search and Retrieve URL Service • SRW/U • Search and Retrieve for the Web 北京大学研究生课程进修班 2005 上海
ZING ZING:“Z39.50 (international) Next Generation” srw sru 北京大学研究生课程进修班 2005 上海
ZING srw sru cql Common Query Language 北京大学研究生课程进修班 2005 上海
ZING srw sru cql 北京大学研究生课程进修班 2005 上海
ZING srw sru zeeRex cql ez3950 ZOOM 北京大学研究生课程进修班 2005 上海
ZING srw sru zeeRex cql ez3950 ZOOM 北京大学研究生课程进修班 2005 上海