520 likes | 641 Views
主要内容. 概述 — 资源整合与门户建设 资源整合 门户建设. 层面 方法 效果. 思路 内容 应用. 资源整合与门户建设. 资源整合与门户建设 ( Integration & Portal) 是相辅相成的两个层面。 资源整合是底层。侧重于资源管理层面,或者说是侧重图书馆员的业务层面,是建立资源门户的基础。 信息门户是窗口。侧重于读者应用层面,是网络环境下图书馆资源和服务的综合体现。 ∴ 国外一些资源整合系统的名称为 Xpotal 。 如 :Chameleon iPortal (美国 VTLS 公司)
E N D
主要内容 • 概述—资源整合与门户建设 • 资源整合 • 门户建设 层面 方法 效果 思路 内容 应用
资源整合与门户建设 • 资源整合与门户建设(Integration & Portal)是相辅相成的两个层面。 • 资源整合是底层。侧重于资源管理层面,或者说是侧重图书馆员的业务层面,是建立资源门户的基础。 • 信息门户是窗口。侧重于读者应用层面,是网络环境下图书馆资源和服务的综合体现。 ∴ 国外一些资源整合系统的名称为Xpotal。 • 如:Chameleon iPortal(美国VTLS公司) • Zportal(英国Fretwell-Downing Informatics Limited)
资源整合与门户建设 • 趋势: • “整合与门户”将成为图书馆在分布环境下重要的业务系统和基础平台,它们的应用将促使图书馆的资源利用和读者服务迈上一个新台阶。 • “整合与门户”的建设与多年以来的图书馆自动化管理系统的建设类似,将给图书馆带来历史性的变革和冲击。未来图书馆在需求牵引和技术驱动下,将应用更多类型的业务系统。 OCLC在2004年发布的“E-Scan”报告中预见…
资源整合与门户建设 • OCLC在2004年发布的“E-Scan”报告中指出,在数字环境中,图书馆业务需要更多系统支持。 • 报告列出的五种业务系统: • 图书馆管理系统(Library management system) • 资源门户(元搜索)系统(Portal or Metaserach system) • 解析/链接服务器(Resolver/linker) • 馆际互借(ILL)/资源共享系统(resource sharing system) • 数字对象管理系统(Digital object management system) • 报告预见,许多图书馆会有不止一个上面提到的系统,大型图书馆将会拥有所有这些系统。
资源整合与门户建设 粗略估计,近几年来,全球大约已有5000多个图书情报机构安装了资源门户(元搜索)系统和解析/链接服务器。
资源整合与门户建设 http://www.libraryjournal.com/article/CA6319048.html 2005年的图书馆信息系统的调查报告
对资源整合的一点认识 数字资源整合由初步试验步入到实用阶段 从上个世纪九十年代末期开始,伴随着数字资源的不断增加,如何有效地管理和利用这些新型资源被提上日程。 最初,人们的关注和追求是实现对所有异构资源的跨库检索,类似DialogWeb的多数据库扫描检索。 多年以来,跨库检索是业界关注的一个热点。
对资源整合的一点认识 清华图书馆在2001年基于页面分析方法开发了对本地异构数据库的跨库检索平台(对应 Ei、INSPEC、CSA)。 随后致力于开发一种通用的接口,希望能够降低开发成本,整合更多资源。
对资源整合的一点认识 在实践中体会,分布异构环境下的跨库检索情况比较复杂。一方面,追求对所有资源的跨库检索只是一种理想状态,实际中只能做到兼容尽可能多的资源。另一方面,对几十种以上的资源笼统地实现跨库检索并无实用价值,用户的需求是针对某个学科主题、文献类型以及个性化需求的资源导航和检索。 近年来,跨库检索作为一种关键技术应用在图书馆的“资源门户”中,与开放链接、资源导航、个性化服务、用户认证和权限管理等功能一起构成一个实用的数字资源整合系统/资源门户。
数字资源整合的层面 回顾来看,全球范围内的数字资源激增,但时间却极其有限(≌10年)。人们对数字资源的组织和揭示能力还远远落后于数字资源的增长速度。 数字资源与传统的书刊文献不同,每种资源都有其物理和逻辑结构,依赖于各自的软件系统并借助于网络传播。数字资源带有与生俱来的异构性、分布性和资源描述的多样性。 随着网络数字化环境的形成,读者迫切需要一个可以快速获得相关信息的理想工具。 图书馆面对资源复杂性和需求迫切性的矛盾和挑战。
数字资源整合的层面 • 近年来,很多图书馆都不同程度地在关注数字资源的整合问题,建立不同层面的导航系统,并对数字资源进行馆藏编目,从多种途径探索组织和揭示数字资源的方法和模式。 • 清华馆2000年以来,提供了如下几个层面的电子资源访问入口: • 电子资源/数据库导航系统 • --- 约320个数据库入口 • 电子期刊导航系统(中文、西文) • --- 约3万种电子期刊入口 • 学科网络资源导航系统 • --- 重点学科的网络资源入口 • 图书馆书目管理系统---OPAC(856字段)
数字资源整合的层面 从资源揭示角度看,这些导航系统只是在数据库名称或者文献的集合级(专著名称)和连续级(期刊名称)的层面上揭示资源。实现的是一个粗线条的资源整合,无法满足读者希望快速定位到目标资源(文章题名及内容)的需求。读者需要更深层面、更细粒度、更小单元的资源揭示、查找和定位。 导航系统相对来说粗线条的揭示方法,在计算机技术和信息检索能力(全文检索)已经相当发达的今天已经远远不够。
数字资源整合的层面 通过先进的知识组织体系和语义检索获取信息是当前的研究热点,但目前尚处于探索阶段,到规模化实用仍有很长的一段路要走。 目前能规模化实用的技术,是针对分布的数字资源,从分析级(文章题名、主题、作者)进行统一揭示和整合,使用户能够快捷地获得深入、合适的检索结果。 这是向着更深层面、更细粒度、更小单元获取信息资源的一个进步。
数字资源整合的层面 从资源获取角度看,通过导航到数据库查找等方法,对目标资源的链接仍然取决于资源本身;链接关系和链接实现完全依赖于资源商的支持;资源之间的链接呈现出体系交错、不可控制的复杂关系。尤其在资源的系统平台升级变化时,链接的重建是一件相当费时费力的事情。 发展趋势是依据开放链接的标准、技术,建立起动态、有序的管理机制,通过图书馆员的工作(经验)和技术的手段(链接解析器)帮助用户更流畅、更恰当的获取资源。图示
数字资源整合的方法 • 资源整合的两种技术方法: • 依赖元数据收集的仓储/聚合型 • 依赖计算机处理能力的元搜索/技术型 • 资源链接的技术方法: • OpenURL--开放链接
数字资源整合的方法 • 依赖元数据收集的仓储/聚合型 • 通过抽取、映射等手段对分布异构资源的元数据/对象数据进行收集和聚合,安装在本地系统中提供统一的检索和服务。 • 优势:数据经过收集转换后不仅格式统一,而且结构清晰,可以按照需求建立各种分类体系,或者按照更高级的知识本体对数据进行再组织和管理。 —图书馆员的用武之地。
数字资源整合的方法 劣势:对于类型不同、分布广泛、更新频繁的数字资源,很难做到即时、准确地将数据收集齐全。 在可行性方面也存在着较大的困难(瓶颈),图书馆目前迫切需要整合的是商业性学术资源,而这些资源提供商绝大多数不同意用户将其资源的元数据/对象数据整体进行二次收集和聚合,安装在另一个本地系统平台上。他们大多数将资源和系统平台绑定在一起销售,以获取商业的最大利益。
数字资源整合的方法 近几年发展势头正健的OAI协议,支持对分布、异构资源在元数据层面的数据收集。 但根据对国内外的调研,采用OAI技术收集元数据的实用案例,基本都是应用在开放存取(OA)的资源或以联盟模式建设的资源(NDLTD、 CALIS_ETD),商业性学术资源一般都不支持遵循OAI的数据收集。 采用OAI技术收集元数据的前提是资源拥有者愿意作为数据提供者开放Data-Provider接口。
数字资源整合的方法 • 依赖计算机处理能力的元搜索/技术型 • 借助于计算机强大的处理能力,实时对分布异构资源进行整合检索。 • 这种方式的实现又分两种情况: • 方法1:通过网络信息检索标准和互操作协议实现 • (主要包括:Z39.50协议、ZING(SRU/SRW)协议、XML Gateway) • 优势:检索效率高且稳定性、即时性好。(深层次整合) • 劣势:相当数量的资源提供商不遵循标准协议。
数字资源整合的方法 方法2:通过对URL和Web页面的分析和编程实现 优势:适用范围大、即时性好。 劣势:查全率、查准率方面不易控制。 由于各个资源平台采用的检索机制、检索技术不同, 1)存在编程实现翻译的查询语法与原有资源平台的检索语句之间在匹配上的差异; 2)存在各资源平台的命中结果能正确解析到统一显示界面的差异。 3)……
数字资源整合的方法 • 根据对国内外图书馆“数字资源门户”应用案例的追踪调研,大多数都是采用元搜索/技术型。 • 国外的系统,比较注重与数据提供商达成协议,尽可能地通过网络信息检索标准和互操作协议实现整合。由于在Z39.50协议之后出现了ZING(SRU/SRW)协议和XML Gateway规范,对标准协议的遵循正在呈现越来越普遍的势头。 • 国内的系统,大部分采用对URL和Web页面的分析和编程,即“页面分析(page-scraping)”技术实现整合。少了与资源提供商打交道的麻烦。
数字资源整合的方法 • OpenURL--开放链接技术成功应用 • 近年来,资源提供商纷纷开始关注和实现资源之间的链接关系, 延伸为用户提供的服务。然而,随着数字资源的大量涌现和不断变迁,即时更新来自四面八方的链接是一个负担,始终保持链接的正确就更加困难。 • OpenURL是一种附带有元数据信息和资源地址信息的“可运行”的URL。由服务提供方(图书馆)维护的链接解析器依照规则动态生成开放链接的URL,实现资源之间一对一,一对多的“恰当”链接,对文献之间错综复杂的关系进行了有序的动态管理和链接。 • 由于OpenURL协议具有可定制、可移植、可扩展的开放特性,已成为数字图书馆应用领域的热门技术。
数字资源整合的效果 整合效果是图书馆在选择资源整合方案时最关心的一个问题。 在图书馆提供服务的电子资源中, 1)有多少种资源能够被整合? 2)有多少种资源能够实现开放链接?
数字资源整合的效果 清华图书馆选用MetaLib & SFX作为资源整合平台。 1)整合检索的效果 最初测试:能够被整合资源库的比例大约占50%; 最终测试:能够被整合资源库的比例大约占91%。 说明:最终对清华馆在校园网上提供服务的320个资源库进行测试。不能被整合的资源库包括一些光盘数据库和采用专门客户端软件的数据库,例如:INIS,SciFinder Scholar等。 本地化开发投入的工作:资源分析、与提供商沟通、参数映射调整、没有配置的资源开发外部程序等。
数字资源整合的效果 2)开放链接的效果 链接源--Source资源: 系统可配置Source 52种,清华馆资源能配置24种。 包括:ELSEVIER_SCIENCE_DIRECT、MATHSCINET、BLACKWELL、PROQUEST、JSTOR、 CSA、 ARXIV、ISI_WEB_OF_KNOWLEDGE、GOOGLE_SCHOLAR、III_INNOPAC、EBSCO、EI_VILLAGE等。 链接目标--Target资源: 系统可配置Target 974种,清华馆配置并激活110个目标资源。 (其中SFX CKB目标资源94个,SFX-LKB目标资源16个)
数字资源整合的效果 • 激活需要链接的目标资源(Target)共110个。 • 包括: • 96个全文库/服务及通过DOI链接的全文服务; • 馆藏信息4类(TH-OPAC、WorldCat、全国联合目录,其他馆OPAC); • 搜索引擎3类(Google Scholar、 Google,、百度等12种); • 清华ILL、参考服务3个(包括链接ISI_JCR、Refwork、MetaLib E_SHELF); • 网络服务2个(清华虚拟参考咨询和清华网络资源导航链接)。 • 激活目标对象(Object Portfolio)148,191个。 • 包括: • 西文电子期刊29,749个、中文电子期刊15,009个; • 西文电子图书27,543个、中文电子图书49,549个; • 会议文集4,623个、标准1,673个; • ISI_JCR期刊对象7,551个,ISI_WOS期刊对象12,294个。
数字资源整合的效果 在技术层面,Metalib通过Z39.50、XMLGataway、专有APIs及HTTP页面分析等方式实现整合检索。 1)Z39.50方式整合的资源可检索获得最充分的元数据并获取SFX扩展服务 清华馆320个库,通过Z39.50方式整合的资源约占25%。需要配置的参数有:Z39.50服务器的URL,端口、授权、数据库代码、获取元数据的格式、OpenURL中涉及的卷期等SFX获取原文必须的信息。 这种方式的配置成本低且检索效率高、稳定性好。
数字资源整合的效果 2)通过XML Gateway方式整合的方式最近两年正悄然兴起,通常数据提供商会提供详细的文档来说明如何配置整合所需的参数。 ProQuest、ISI Web of Knowledge、IEEE Xplore, JSTOR、Ei Village2等平台的数据库支持XML Gateway方式整合。清华馆320个库,通过XML Gateway方式整合的资源约占10%。 3)通过特定的接口程序整合。这种方式通过资源提供商提供的特定接口获得元数据。北京交通大学采用了维普提供的特定API接口对其数据库进行整合。
数字资源整合的效果 4)基于HTTP页面分析的整合方式主要针对那些本身不提供任何接口、也不支持任何标准的数据库。 通过对页面分析,模拟源资源库的检索方法发检索请求,从结果中提取特征元数据实现整合。由于需要编程实现对页面的分析,配置成本较高。不仅首次实现需要编程,之后还需跟踪资源平台的升级,及时维护。 清华320个资源库,基于HTTP页面分析方式整合的资源约占60%(其中1/2在Metalib中已有编程,可通过Metalib中心知识库CKB配置使用;另1/2大多数是国内资源库,在实施中做了编程开发并通过本地知识库LKB配置)。
门户建设的思路 —图书馆建立门户主要是面向用户,对可利用的资源和服务做整体性、深层次的揭示。 图书馆的经费主要都用在购买资源,尤其最近几年,数字资源占了很大比例,资源结构发生了历史性变革。 2005年底统计,清华馆经校园 网提供服务的资源库已达320个;中外文全文电子期刊超出3万种,其中外文期刊约1.7万种;中外文 电子图书40多万种。 年度订购数字资源的经费约占书刊文献总采购经费1/3。 如何让资源被用户了解和使用,充分发挥其作用并创造新的价值?图书馆的服务也在转型,如何让用户了解和利用这些新型服务? —图书馆的资源和服务都迫切需要一个集中展示的窗口。
门户建设的思路 在2005年6月清华图书馆做的 “电子资源使用和读者满意度调查”中,有一个针对利用电子资源主要通过哪些入口”问题,统计结果如下表。 该问题的统计不仅反映了读者已习惯从统一的入口利用电子资源。 也反映了他们的新需求--希望通过一个集中揭示和导航的门户来方便地利用电子资源。
门户建设的思路 • 门户的过渡和发展: • 早期的门户主要致力于将不同信息源聚集在同一个网页上进行揭示,方便用户通过统一入口访问多种信息源。 • 近期的门户增强了技术含量,能够实现对分布数字资源的整合检索和获取目标信息的开放链接;并为注册用户提供个性化服务。 • 新一代信息门户不仅仅是信息资源聚集的平台,还具有信息整合、内容整合、服务整合、流程整合、用户协作的多重功能。 • 在用户层面,通过门户实现用户身份的统一认证和分类管理,可进一步提供个性化服务和安全可控的交互平台。
门户建设的思路 门户的定位和作用: • 为用户构建一个基于网络、远程利用资源的和谐环境。 • 通过系统平台、技术手段和图书馆员的工作,对信息资源进行充分的挖掘、关联和升值,对资源和服务的整体性揭示更全面和深入,使信息的查找和定位更细化和快捷。 • 使用户感受到的图书信息资源是一个整体,不再是零散割裂的“信息孤岛”。免去读者为了查询所需要的资料,需要分别登录不同系统、熟悉不同的检索命令,重复进行检索的烦恼。 • 使用户获得个性化的定制与服务。
门户建设的思路 “清华大学学术信息资源门户”将电子资源的导航与检索、馆藏书刊目录查询、馆际互借和文献传递、虚拟参考咨询、参考文献引用以及网络搜索引擎等扩展服务有机地整合在一起。通过一个门户,读者可以远程访问、无缝获取所需信息和服务,更为有效地利用图书馆提供和揭示的信息资源。
门户建设的内容 • 清华图书馆基于MetaLib建立学术信息资源门户 • 围绕四个方面建立业务流程并提供服务: • 资源揭示和描述 • 资源导航与检索 • 资源管理与用户认证 • 个性化服务
门户建设的内容 资源揭示和描述: 对320个资源库做规范化著录和描述,从方便读者利用的角度,资源揭示到子库。 主要著录字段包括:资源名称及URL、交替名称、资源简介、资源图标、学科分类、资源类型、覆盖范围、时间跨度、语种、出版商、资源检索平台、资源关键词、资源创建者、版权所有者、数据库指南(URL)、咨询反馈(email)、做整合检索时的提示信息等。
门户建设的内容 • 信息导航与检索: • 分为三个层面: • 数据库导航与检索 • 期刊导航与检索 • 整合检索 目前由图书馆员做本地中文期刊的分类
整合检索提供单库检索、跨库检索、快速检索三种方式整合检索提供单库检索、跨库检索、快速检索三种方式 快速检索集 由参考馆员建立
通过整合检索得到的结果,可以从原库直接获取全文,也可以通过SFX开放链接到全文或者扩展获取目标内容和相关服务。通过整合检索得到的结果,可以从原库直接获取全文,也可以通过SFX开放链接到全文或者扩展获取目标内容和相关服务。
整合检索OPAC,通过SFX获取全文期刊的多个途径整合检索OPAC,通过SFX获取全文期刊的多个途径
基于OPAC功能建立的获取全文期刊的多个途径 在全文库地址变化时,需要逐条修改OPAC数据。
门户建设的内容 资源配置管理: 1)资源分析及建立模版,包括:资源名称、资源类型、访问协议、URL、资源供应商:资源的IP地址和端口号、数据库代号(内部代码,供应商提供或图书馆确定)、认证信息、记录格式(UNIMARC,USMARC等)、BIB属性(Z39.50的BIB属性。如:author=1003,title=4,subject=21)、字符编码集(如:ANSEL,ISO8859-1)等。 2)配置参数,包括:构造HTTP请求(包括hostname:port 和 URL MASK);获取检索结果数;返回结果为零的描述等。 3)为尚未支持标准协议的资源开发外部程序并建立配置文件,用Perl语言编程。
门户建设的内容 用户统一认证: MetaLib平台支持LDAP方式的远程用户认证。 清华馆利用Metalib提供的PDS(Patron Directory Service)认证模块,通过参数配置和少量的程序开发,借助多年建立的OPAC系统的读者库完成了门户用户的远程认证功能。 这种方式在图书馆系统的用户统一认证方面做了积极的尝试,图书馆无需再另外建立和维护访问门户的用户库。
门户建设的内容 • 个性化服务: • 建立“我的数据库”、“我的电子期刊”、“我的检索历史”,用于组织、收藏与个人课题或兴趣相关的文献信息、常用数据库集、常用电子期刊列表及检索历史,还可以定制定题通报(Alert)服务。 • 建立“我的电子书架”,可分为不同的文件夹,收藏不同课题的文献信息,通过整合平台检索到的文献,可随时保存到电子书架中。
门户应用的效果 • “清华大学学术信息资源门户”2006年1月开通。 • 截止到6月份,共有3100多位读者注册使用“个人空间”的功能。 • 应读者要求,举办了两次“门户使用”的培训讲座。 • 2006年3-5月的使用统计见下表和后图示。
问题和讨论 • 考虑到读者多年的习惯,目前是几年前建立的“导航系统”和新建的“资源门户”并轨运行,图书馆同时维护两套系统和数据。希望读者逐步习惯、自然过渡到使用新建的“资源门户”,但目前过渡趋势不明显。 • 选用国外整合系统,在外文资源的整合、揭示、分类等方面比较到位,例如,对外文期刊的两级分类。但对中文资源的整合上相差较多,例如,中文资源基本没有采用Z39.50方式整合的,如何走出困境? • ???
谢谢大家! 请指正。