530 likes | 709 Views
数字图书馆系统 平台建设. 李伶 联系电话: 62511030 E-mail :tsgxt@ruc.edu.cn. 2005 年 12 月. 提 纲. 一、人大数字图书馆建设的总体思路 二、人大数字图书馆应用系统建设 三、人大数字图书馆特色数据库建设 四、人大数字图书馆系统运行支撑环境 五、数字图书馆系统平台建设之思考. 一、人大数字图书馆建设总体思路 (一)总体目标 (二)“十一五”数字图书馆建设内容和思路. 一、建设总体思路. (一)总体目标
E N D
数字图书馆系统 平台建设 李伶 联系电话:62511030 E-mail :tsgxt@ruc.edu.cn 2005年12月
提 纲 一、人大数字图书馆建设的总体思路 二、人大数字图书馆应用系统建设 三、人大数字图书馆特色数据库建设 四、人大数字图书馆系统运行支撑环境 五、数字图书馆系统平台建设之思考
一、人大数字图书馆建设总体思路 (一)总体目标 (二)“十一五”数字图书馆建设内容和思路
一、建设总体思路 (一)总体目标 “十五”期间,围绕学校“建设以人文社会科学为主的世界一流大学”的总体目标,我馆制定了图书馆的发展方向,即建成构架在中国教育科研网(CERNET)和中国高等教育保障系统(CALIS)之上的分布式数字图书馆系统,为我校和全国及世界范围的人文社会科学用户提供安全、快捷、准确、完整的数字资源查询和利用服务。
一、建设总体思路 (二)“十一五”人大数字图书馆建设内容和思路 “十一五”期间,数字图书馆建设将向广度和深度发展。 广度:即图书馆要成为学校真正的信息资源中心,学校的学术资源要以图书馆为主体,联合相关单位来统一建设。 深度发展:即资源组织一定要从信息组织向知识组织延伸,服务方式也将从信息服务向知识服务延伸。
二、应用系统建设 人大数字图书馆经过5年的建设,初步建成了基于UNIX/Windows环境下的数字图书馆信息采集、加工、整合、检索、发布等软件系统平台。 36台服务器承担着42个应用和数据库系统的管理与应用。 其中,进行资源加工、采集与管理的系统有5个: 美国SIRSI公司的Unicorn系统 中数创新公司的CDI-CM系统 (包括CDI-CM、CDI FS、CDI RH三个系统) 清华同方的TPI系统 杭州麦达的博文非书资料管理系统 天宇系统
三、人大数字图书馆特色数据库建设 (一)CDI-CM系统应用 (二)TPI系统应用 (三) KingbaseDL数字图书馆个性化信息服务系统
三、特色库建设 (一) CDI-CM系统应用 CDI-CM软件是北京中数创新技术有限公司研发的软件,最初叫资源加工系统,后经改版、升级,形成现在的产品CDI CM内容管理系统。它是针对国内数字图书馆发展以及数字化资源建设的现状开发,集数字资源加工、发布与调度于一体的管理与应用软件。 2005年3月25日,CDI CM CALIS特色版内容管理软件通过CALIS专题特色库参建馆本地系统第一期功能测试。
三、特色库建设 (一) CDI-CM系统应用 系统运行环境: CDI CM采用C/S方式,著录界面采用自定义多窗口集成方式。 服务器操作系统为Windows 2003 Server 服务器为IBM X336-Xeon3.0GHz*2/4GB 数据库为SQL Server 2000 发布服务:Apache,JBOSS,TOMCAT
三、特色库建设 (一) CDI-CM系统应用 1.系统功能 资源加工模块:主要进行数字资源的采集、加工、处理、存储和组织,支持多种元数据和用户自定义数字资源结构,形成RDF封装的XML数据格式,建立起用户所需的资源库。 资源发布模块:采用标准XML数据格式,提供大量的显示模板及灵活的配置功能,对所建的专题资源进行互联网发布,帮助用户快速地建立起应用于网络服务的资源库。 资源调度模块:主要对资源的存贮、发布环境进行统一调度,保证在资源环境发生变化时,数字资源不用做任何改变,就能够迅速准确定位,实现资源共享、资源多级分布存贮与无缝检索。
三、特色库建设 (一) CDI-CM系统应用 2.系统应用思路 我馆选购CDI系统时,最初思路是想将不同类型、不同载体、不同语种、不同地点的学科资源有机地集成与组织在一起,在一个界面能够获得学科基本的文献资料和相关信息,给用户利用学科资料提供很大方便。 CDI-CM可以初步实现上述功能,通过DC元数据标准,实现学科知识资源内容结构的整合。 今后,将知识组织系统(领域本体)融入其体系结构,即能实现对数字资源内容概念关系的整合。这是数字图书馆数字资源建设的最终目标。
三、特色库建设 (一) CDI-CM系统应用 3.特色库建设:经济学学科知识门户 以前,人大馆利用CDI建设的经济学门户,主要是整合馆藏不同载体、不同来源、不同内容的文献。 改版后CDI新特征: (1)将最新搜索网络资源纳入资源整合的范围内。 (2)在使用功能上,增加跨库检索,并可以进行资源类型浏览和分类主题浏览。 (3)增加了“最新更新数据”、“热点学科”和“读者推荐 ”等栏目,以增强针对性和实用性。
三、特色库建设 (一) CDI-CM系统应用 4.CDI CM系统使用中存在的问题 (1)数据标引方式大多为手工标引,著录比较繁琐, 半自动或自动标引程度较低,影响建设速度和效率 (2)内嵌分类表的使用尚不够方便,搜索的数据入库无法归入相应类目,有待进一步改进。 (3)发布页面浏览和检索数据的速度较慢,静态虽然可以解决详显的速度,但增加了发布的工作量,要发2次,新增数据必须发布才能检索。
三、特色库建设 (一) CDI-CM系统应用 (4)发布页面无法独立显示各子库的最新数据,不利于揭示最新资源。 (5)对象数据的安全性问题,不建议使用文件共享。 (6)系统功能强大与系统管理和加工复杂存在矛盾。 (7)字段只要设置了关联,页面上就亮显,有些是没有内容,不能做到有内容了才亮显。 (8)公司的服务机制问题,最好尽可能提供最新的、详细的系统管理文档和说明。
三、特色库建设 (二) TPI系统应用 TPI是基于非结构化文档管理而开发的内容管理系统。该系统以FTS全文检索数据库为核心,采用B/S浏览器的检索方式和三层C/S架构,能够同时管理文字、图片、多媒体等信息,并提供全文检索服务,支持网页的动态发布,是一个面向内容管理的应用、管理和信息发布的工具。TPI能实现从印刷品到电子文档、从静态资源处理到网络资源的实时整合、从单一资源管理到集群的检索服务,从单一数据库到异构数据库的统一检索等。 TPI系统建立的数据库资源与CNKI数据库的检索界面是一致的。
三、特色库建设 (二) TPI系统应用 系统运行环境: 服务器操作系统为Windows 2003 Server 服务器为IBM X336-Xeon3.0GHz*2/4GB 数据库为自己的KBase FTS-Server 发布服务: IIS
三、特色库建设 (二) TPI系统应用 1.系统功能 2003年12月人大购买了TPI基本模块和电子书图书制作工具及文通OCR识别系统。 数字资源加工系统:完成对传统资源的数字化加工和标引分类工 数据库发布与检索系统:实现各种检索服务。全文检索、异构库统一检索、分布式检索,同时实现订阅推送、内容发布、全文传送、光盘出版等功能。数字资源管理系统:实现用户权限管理、数据库维护、统计和计费等功能。
三、特色库建设 (二) TPI系统应用 2.系统应用思路 根据其灵活的内容发布平台,我馆将根据自己的需要把数据以各种形式发布到Internet上 ,实现某一单一资源或整合资源的管理与检索 。 利用TPI系统,我馆建成了“学位论文”、“民国资源库”、“剪报资源库”、“古籍数据库”、“中外文期刊导航” 等。
三、特色库建设 (二) TPI系统应用 3.特色库建设 学位论文数据库: 2004年,我馆开始应用TPI的学位论文系统进行网上提交。两年来网上提交的论文占全部研究生论文的60%以上。目前论文数据约为7000余条。提交的论文当年就可以在网上浏览和检索,并根据IP设置控制检索范围和内容。 论文网上数据库为各院系研究生论文的管理提供服务。 我馆正在利用TPI系统进行论文数据库的回溯建设。
三、特色库建设 (二) TPI系统应用 3.特色库建设 民国资源库:利用TPI系统的跨库检索,将民国时期图书、期刊、报纸、学者和书评等资源建立统一检索平台,分别建库,图书库中题名著者与学者和书评中的被评文献之间建立了关联。目前图书库中有45955条记录,学者中100条记录。 剪报资源库:全部数据有28万条,都有全文,目前主页上展示的数据有4万余条。该库数据完全委托加工,元数据按指定格式著录,保存为文本文件,对象文件全名著录在指定字段内,元数据批量上载后再批量上传对象文件。
三、特色库建设 (二) TPI系统应用 3.特色库建设 古籍数据库:我馆共藏有清代至民国期间出版的普通线装古籍3万余种。读者可以利用馆藏普通线装古籍书目数据库,通过题名、主要责任者、出版信息、主题等多种途径进行检索。该数据库目前只支持繁体字检索。 中外文期刊导航(外文12906条,中文8026条):利用分类导航将期刊分为按学科和字母排序两大类浏览,功能与大部分图书馆自己开发的系统相似,只是界面都是一个面孔。
三、特色库建设 (二) TPI系统应用 4. TPI系统使用中存在的问题 (1)非TPI格式数据的转入转出存在问题。 (2)全文文件下载的版权保护问题。 (3)系统无自动定时备份。 (4)数据库检索频繁时常需重新启动IIS服务。
(三)个性化服务系统 三、特色库建设 KingbaseDL是图书馆、信息学院和人大金仓公司根据教学科研用户利用数字化资源的需求而共同研发的。图书馆提出使用需求,由我校信息学院进行技术攻关,由人大金仓公司设计研发方案,完成产品的开发。 2003年6月完成系统主要功能的研发工作(1.0版),并上网提供试运行。
(三)个性化服务系统 三、特色库建设 “数字图书馆个性化信息服务系统” 建设与研究的基本思路是在图书馆异构数字资源整合的基础上,根据用户的专业特征和研究兴趣,有针对性地向用户提供和推荐教学科研所需要的数字资源,并实现对重要异构数字资源的集成检索。在此基础上,提供对用户的在线实时咨询和Email咨询服务。其直接目的是为我校师生提供一个自由定制信息,有效组织与利用信息,有效获取知识信息的个人数字图书馆,提升图书馆为教学科研服务的整体水平。
四、人大数字图书馆系统运行支撑环境 (一)基础环境建设 (二)安全保障 (三)制度建设 (四)人员培训
四、系统运行支撑环境 (一)基础环境建设 由于领导的重视和学校的支持,从2002-2005年,学校投资600多万对图书馆的网络及服务器机房进行了彻底改造和升级。 目前,图书馆网络主干为光纤千兆网, 100兆到桌面。购置了专业服务器、不间断电源、机房专业空调等设备,建构 了2GB 、10TB SAN架构的全光纤局域网存储环境。 所有设备和采用的方案均具有先进性和扩展性。
四、系统运行支撑环境 (二)安全保障 网络安全和信息安全是保障图书馆业务正常运转的关键。图书馆自组建系统部以来,安全工作一直是系统部的重要工作内容。2002年,我馆就制定了安全规划,计划从边界、网络和主机三个层面对我馆的网络运营进行深层防御。局域网内部安全目前采用了子网间隔离、访问控制、SAN建构、安装防病毒和防火墙等措施,服务器主机安全则采取了安全加固方式。下一步我们将考虑入侵检测问题。
四、系统运行支撑环境 (二)安全保障 网络防病毒软件的运行、主机加固安全策略的设置、网络流量的日常监测、存储和备份机制的制定,都极大地提升了图书馆网络安全和信息安全的管理能力。从总体上看,图书馆范围内计算机感染病毒的种类和台/次逐年明显减少,逐步呈下降趋势。而重要数据的备份也将实现自动操作。
2005年12月图书馆网络拓扑图 校园网 西馆 校园网主干节点 东馆 一层 一层 --- 四层 二层 个性化 CDI 抓取 NC 中经网 主页 天宇 诺顿 三层 NAS 四层 期刊网 TPI 电子书 镜像库 库备份 SIRSI 教学 五层 光纤交换机 2005年图书馆将有微机340台,服务器36台,交换机36台,SAN环境,诺顿防病毒和客户端防火墙 SAN EMC CX700 光纤 以太网
(三)制度建设 四、系统运行支撑环境 自 2002年以来,系统部陆续拟订了已执行或欲执行的57项制度和规范,现已完成20多项岗位流程操作和管理制度。 如:服务器操作系统安装流程 图书馆设备购置申请流程 计算机故障处理流程 网络故障维护流程图 …… 我们每年都要根据图书馆设备购置情况整理和更新全馆8个部门的计算机及网络设备工作统计表数据。
(四)人员培训 四、系统运行支撑环境保障 我馆很重视本馆馆员素质提高问题,尤其是对系统部。 1.本部室人员培训,采取现场培训、免费讲座、研讨会、专业培训、部室工作例会、部室内部培训等方式 2.培训内容包括数字图书馆关键技术、操作系统(Windows2003、Unix、Linux)、存储管理、SQL数据库、Oracle、Microsoft的MCSE培训、SOLARIS的系统管理、网络安全、网络管理等。
五、数字图书馆系统平台建设之思考 (一)数字图书馆系统平台的建设原则 (二)人大数字图书馆系统平台建设优势与不足 (三)系统平台建设与实施需要解决的主要问题
五、系统平台建设思考 (一) 建设原则 (1) 先进性原则 (2) 开放性原则 (3) 可扩展性原则 (4) 可用性原则 (5) 安全性原则 (6) 可持续发展原则
五、系统平台建设思考 (二) 优势与不足 优势: 1.先进的建设理念使系统功能不断完善,满足要求 2.拥有阶段性系统平台建设成果 3.积累了丰富的数图建设实践经验 4.大力的支持,良好的基础设施平台 5.培养了一批甘于奉献的图书馆技术骨干队伍
五、系统平台建设思考 (二) 优势与不足 不足: 1.需求模糊,系统平台建设难以定位 2.标准各异,整合、互操作困难 3.各系统功能没有充分利用和揭示,系统重复建设 4.在法律不健全的大环境下数图建设自身带来的限制
五、系统平台建设思考 (三)系统建设中需要解决的主要问题 1.管理水平与信息化水平发展不平衡问题 2.信息孤岛、设备孤岛 3.不同的数字图书馆发展阶段,做好平台建设中的核心环节 4.要进行用户需求分析 5.元数据获取问题 6.注意可持续发展问题 7.加强系统的宣传和推广
总 结 数字图书馆系统平台建设是数字图书馆建设的重要组成部分,是支撑因素,关键技术的采用,有利于数字图书馆建设的标准化和规范化,有利于数字图书馆信息资源和服务的互连、互通和共享,最终达到为用户提供最最实用、方便、快捷的服务效率。