480 likes | 633 Views
高校特色数据库的建设. 刘 霞 武汉大学图书馆 2011.4.15. 大 纲. CALIS 高校特色库建设回顾 国内外高校特色库建设现状 CALIS 三期特色库建设思路. CALIS 高校特色库建设回顾. CALIS 一期特色库子项目( 1/3 ) 立项原则 具有中国特色、地区特色和高等教育特色的专题数据库(索引题录库、摘要或全文库) 数据库与“ 211 工程”重点学科建设有较突出关系;有利于推进教学、科研发展和国民经济建设 具备一定量的数据,并已有初步成果挂在 CERNET 网上 具有较好的设备和人员条件,网络通讯能力较强.
E N D
高校特色数据库的建设 刘 霞 武汉大学图书馆 2011.4.15
大 纲 • CALIS高校特色库建设回顾 • 国内外高校特色库建设现状 • CALIS三期特色库建设思路
CALIS高校特色库建设回顾 • CALIS一期特色库子项目(1/3) • 立项原则 • 具有中国特色、地区特色和高等教育特色的专题数据库(索引题录库、摘要或全文库) • 数据库与“211工程”重点学科建设有较突出关系;有利于推进教学、科研发展和国民经济建设 • 具备一定量的数据,并已有初步成果挂在CERNET网上 • 具有较好的设备和人员条件,网络通讯能力较强
CALIS高校特色库建设回顾 • CALIS一期特色库子项目(2/3) • 于1999年1月正式启动,2000年底验收 • 共建成专题特色库25个
CALIS高校特色库建设回顾 • CALIS一期特色库子项目(3/3) • 一期特色库建设存在的问题 • 没有统一建库平台 • 没有制定数据标准 • 未明确规定数据库的规模和收录文献的类型
CALIS高校特色库建设回顾 • CALIS二期特色库子项目建设 • 2003年10月启动,2006年验收 • 建设目标 • 遵循“分散建设、统一检索、资源共享”的原则,建成具有相对统一建设标准、由不少于50个专题库组成的特色数据库群 • 在各校建立可独立运行的特色数据库群 • 建立一个基于集中式元数据库的特色资源库中心门户
… CALIS中心门户/跨库检索/特色库服务系统 CALIS全国资源仓库/特色库元数据库 元数据收割服务器(通过OAI协议) 参建单位系统1 参建单位系统2 … 特色库系统总体框架图 资源调度系统(OpenURL)
CALIS高校特色库建设回顾 • 二期特色库选题标准 • 学科特色资源: 与“ 211工程”某重点学科有较突出的关系,或能体现高等教育特色,或具有交叉学科和前沿学科特色 的资源 • 地方特色资源:具有一定的地域和历史人文特色,或与地方的政治、经济和文化发展密切相关的资源 • 馆藏特色资源: 具有他馆、他校所不具备或只有少数馆具备的特色馆藏 ,或散在各处、难以被利用的资源
CALIS高校特色库建设回顾 • 二期特色库建库要求 • 数据库应具有一定规模的数据量 • 数据库应至少包含三种以上的数据类型(题录、文摘、全文、图像、音频、视频等) • 数据库应遵循项目管理组提出的框架体系和栏目设置要求,有统一的页面风格,具有基本的数据库管理功能和服务功能 • 数据库应遵循数据建设规范和标引细则,进行元数据规范处理
CALIS高校特色库建设回顾 • 二期特色库标准规范 • 建库标准采用科技部科技基础条件平台重大项目《中国数字图书馆标准规范建设》项目所推荐的相关标准 • 制定了特色库建设系列规范文件 • 《特色库子项目本地系统基本技术规范》 • 《特色库子项目本地系统数据标准》 • 《特色库子项目本地系统相关接口与规范》 • 《特色库子项目描述元数据规范及相关规则》 • ……
CALIS高校特色库建设回顾 • 二期特色库的服务方式 • 对于二次文献,建设单位应向 CALIS 成员馆提供 WEB 方式的公开免费检索 • 对于一次文献,除涉及版权和保密的由参建单位自行选择发布方式外,原则上应提供对 CALIS 成员馆的公开服务
CALIS高校特色库建设回顾 • 二期特色库建设成果 • 形成了一批极具特色的高校基础数据库群,建成了55个特色数据库 • 数据总量达到445万多条,发布总量达到了416万条,比一期增幅达58.9%。 • 全文数据达到170万条,达到整个数据总量的38% • 13个库的数据量超过了10万条记录弥补了商业数据库的不足
记录数量达到10万条的立项项目 表5:2006年5月底,记录数量达到10万条的特色库
CALIS高校特色库建设回顾 • 二期特色库建设成果 – 类型多样,数据库资源丰富 数据类型更加丰富,不仅仅限于文本型文献,许多数据库收录了图像、音频、视频等信息 表6:2006年5月底,55个立项项目数据类型统计
CALIS高校特色库建设回顾 • 二期特色库建设成果 • 立项项目所涉及的主题广泛 • 地方文献、历史文献、政治、医学、文学艺术、人物、区域文化、农业、经济、教育、材料科学、矿业石油、机械工业、通信技术、电子科学、轻工业、建筑工程、水利工程、交通运输、航空航天、环境科学及其他工业等
全国高校专题特色库主题分布一览表 表4:2006年5月底,55个专题特色库主题分布统计
CALIS高校特色库建设回顾 • 二期特色库建设存在的问题 • 本地建库系统认证工作费时费力,且认证了多个系统给参建馆选择造成困难,商家用户过少也没有积极性 • 元数据OAI收割效果不理想,中心系统的数据更新存在问题 • 服务要求没有完全落实 • 项目的可持续发展问题
大 纲 • CALIS高校特色库建设回顾 • 国内外高校特色库建设现状 • CALIS三期特色库建设思路
国内外高校特色库建设现状 • 国内高校特色库建设现状 • CALIS管理中心的问卷调查(2010.5) • 106所高校包括已建和在建的特色库共300个 • 其中最多的建有13个 • 通用库 • 学位论文库、随书光盘库、教学参考库、机构库、学科导航库 • 特色库 • 地方文史资料、人物资料、古籍特藏、学科专题资料、课程资源等
国内外高校特色库建设现状 • 国内高校特色库建设现状 • 各地图书馆均有建设特色资源库的举措 • 江苏、浙江、天津、四川、东北…… • 各图书馆对CALIS的希望 • 能够统一平台和数据规范 • 更好地共享资源和服务 • 更多的经费资助 • 培训交流
国内外高校特色库建设现状 • 国外高校特色资源数据库建设 • 在网上对世界排名比较靠前的19所大学自建数据库进行调查(2010.6) • 美国哈佛、普林斯顿、耶鲁、斯坦福、MIT、哥伦比亚等大学 • 加拿大麦克吉尔大学 • 剑桥大学、香港大学、东京大学 • 共计92个特色资源数据库
国内外高校特色库建设现状 • 国外同行的体会 • 在建设特色库时应当采取合作的方式进行,包括大学与IT企业合作、大学之间的合作等 • 特色是自建数据库的关键, 要以需求为导向, 以馆藏为特色, 选择独有的、具有资源优势的专题和项目开发建设 • 做好学术信息资源的长期保存
国内外高校特色库建设现状 • 国外同行类似的困难 • 资金:用一个短期的资金来提供一个长期的服务 • 技术:最主要的困难是找一个合适的软件平台 • 相比技术困难,组织和政策方面的困难更难解决
大 纲 • CALIS高校特色库建设回顾 • 国内外高校特色库建设现状 • CALIS三期特色库建设思路
项目指导思想 发掘资源,整合资源,收集资源 发挥特色,深化服务,促进共享 规范建设,培养人才,鼓励创新 CALIS三期特色库建设思路
与二期的不同点 扩大资源的范围 挖掘独有、稀缺资源;搜集网络原生数字资源 更强调需求和服务 申报书要求指明目标用户群 增加定向型项目 明确要求立项数据库最低限度应提供文献传递服务 加强对建库单位的技术支撑力度 开发特色库通用系统 发挥省中心的作用 在省中心部署共享版特色库系统平台;技术支撑点 CALIS三期特色库建设思路
项目建设内容(1/2) 建设80个左右的特色数据库 文献类型覆盖图书、期刊论文、会议论文、学位论文、报纸、专利、标准、音频、视频、古籍、拓片、舆图、地方志、家谱、乐谱、照片、图像等 新增300万条特色资源的目录数据,通过收割汇集至CALIS联合仓储数据库 其中不少于30%的数据具备数字对象信息(如全文、音频、视频、图像、课件等) CALIS三期特色库建设思路
项目建设内容 2/2 建设基于SaaS技术的CALIS本地特色数据库系统共享版免费提供给成员馆使用 进一步完善描述元数据规范、对象数据加工规范等相关标准规范;制定特色资源组织规范、存储规范、发布规范等在内的一整套基于SaaS技术的CALIS特色数据库标准规范体系。 升级CALIS全国高校专题特色数据库中心服务系统,完善管理和服务功能 CALIS三期特色库建设思路
项目选题要求 独有或稀缺资源 即只有本地或本馆独有的;或散在各处、难以收集和利用的;且商业数据库或其他公开渠道难以获得的资源 网络原生数字资源 具有鲜明学科特色、地方特色和民族特色,且有良好前期建设成果的资源。 CALIS三期特色库建设思路
总体技术路线 由“特色数据库中心服务系统”和“参建单位建库系统”二级系统构成,形成统一元数据集和分散对象数据的架构 中心服务系统和参建单位系统均遵循相同的标准和规范,在统一的系统框架下形成二级系统之间的信息共享和信息交换机制,使整个系统具有开放性和可移植性。 CALIS三期特色库建设思路
建库平台 二期建设中已经通过CALIS认证的系统平台,可继续使用 对于未经过CALIS认证,但符合CALIS标准的也可继续使用 新参建的高校图书馆,推荐使用CALIS免费提供的通用共享软件系统 CALIS三期特色库建设思路
服务模式 所有立项特色库均须免费开放元数据并提供公开的元数据检索 所有立项特色库的元数据均须被CALIS专题特色库中心系统收割并发布 所有立项特色库中不涉及知识产权的内容应能够直接提供全文;涉及知识产权的内容应提供文献传递服务 所有立项项目必须承诺永久运行,持续服务;如果遇到特殊情况不能再继续运行,须移交CALIS,允许CALIS进行维护或将该数据库委托其他单位进行维护 CALIS三期特色库建设思路
运行机制 建设方式:集中组织管理、建库标准相对统一、参建学校分散建库、专家监督指导 经费来源:建设和维护主要依靠各校自主投入,CALIS 进行政策和技术引导,并给予经费补贴和奖励 资源归属:元数据及文摘级数据归CALIS所有,全文级资源归建设馆所有 人才培养:建立人力资源培训体系,开展多种方式的建库人员培训和建库学术交流活动 CALIS三期特色库建设思路
CALIS三期特色库建设思路 • 项目进展 • 已经完成了项目申报工作,全国共有197个学校申报了246个项目,预计本月公布评审结果 • 立项后将提供通用特色库系统1.0版(方正DESI)供成员馆免费租用 • 2011年6月进行项目验收
自由项目申报情况统计-院校类型 211院校 31.8 % 63 本科院校 55 22.4 % 高职高专 11 5.6 % 独立学院 2.0 % 4 西部院校 46 23.2 % 新升本院校 14.1 % 28 0% 20% 40% 60% 80% 100% 各类型院校图书馆申报项目情况
自由项目申报情况统计-分省 四川 陕西14 湖南 11 天津 福建 10 河南 9 山西 上海 8 贵州 新疆 6 甘肃 吉林 6 北京 19 山东 17 重庆 江西 4 河北 内蒙 3 浙江 云南 2 辽宁 广西 2 江苏 26 湖北 26 广东 20 西藏 黑龙江 1 宁夏 青海 1 安徽 海南 0 0 - 1个 20个以上 15 - 19个 10 - 14个 5 - 9个 2 - 5个 5-9个 各 省 自 由 项 目 申 报 情 况
自由申报项目的特点-系统 申 报 项 目 选 用 系 统 情 况 112个项目预计使用 CALIS 认证系统 30个项目预计使用 其他自选系统 CALIS 共享版系统 86个项目预计使用
自由申报项目的特点-分类 项目内容分类
几点思考 • 特色库的可持续问题:区别对待 • 历史的、原始的; • 专题的,阶段性的; • 汇聚型:服务导向 • 自建库PK商业库 • 发展阶段不同:内容——平台——功能 • 商业为主,自建补充
参考资料 • CALIS管理中心姚晓霞,章洁. 高校特色库调查分析报告. 2010.6 • Gerard van Westrienen,Clifford A. Lynch. Academic Institutional Repositories Deployment Status in 13 Nations as of Mid 2005. D-Lib Magazine, 2005, 11(9) • CALIS相关工作文件