770 likes | 922 Views
超星集团副总经理 叶艳鸣. 海量资源带来的困惑. 基于知识挖掘的发现. 海量资源带来的困惑 —— 由一组数字说起. 估计现在一年全世界所产生的新信息量大约有 4 千万万亿( 4X10 19 ) 字节 引自 Howie DiBlasi 的 “你知道吗”. 1.8 千万亿兆 字节. 2011 年 全球信息总量突破. 这超过了人类过去 五千年信息量的总和. That is more than in the Previous 5,000 years. 新的科学技术知识 大约每 2 年翻一番. 人类的学习和阅读迈进“无纸化时代”. 数字资源浪潮.
E N D
海量资源带来的困惑 • 基于知识挖掘的发现
海量资源带来的困惑 • ——由一组数字说起
估计现在一年全世界所产生的新信息量大约有4千万万亿(4X1019)字节估计现在一年全世界所产生的新信息量大约有4千万万亿(4X1019)字节 引自Howie DiBlasi的“你知道吗”
1.8千万亿兆字节 2011年 全球信息总量突破
这超过了人类过去 五千年信息量的总和 That is more than in the Previous 5,000 years.
新的科学技术知识 大约每2年翻一番
数字资源浪潮 >1万个 数据库
疑惑 引自电子科技大学图书馆 秦鸿
发现的意义 • 意外惊喜 • 洞察全局 • 价值再生 ——杨晓光 北京航空航天大学航空推进系教授博士生导师 图书馆馆长
400家 600家 300家
Summon • 超星发现系统 中文资源量在summon和超星发现系统中对比 测试时间:2012年7月
中文资源量在primo和超星发现系统中对比 • Primo • 超星发现系统 primo不支持空检索,通过检索词“文化”进行对比 测试时间:2012年9月7日
中文资源量在EDS和超星发现系统中对比 • EDS • 超星发现系统 通过检索词“文化”进行对比 测试时间:2012年9月5日
西安交通大学 图书馆首页
元数据更新:两次/周 空检索 344万篇学位论文 452万种图书 378万篇会议论文 7690万篇期刊 54万篇标准 1亿篇报纸文章 767万篇专利 10亿个网页 200万部视频
13年2月1日数据量 每月更新300万条
专业级强大词表库支持精准发现 30万机构库 40万主题词表 600万作者库 8万同义词表 3500条学科 分类表 20万刊名表 2500万学术 专业词库 600个数据库收录来源表 重要索引库 10亿条引文数据
文章被引用的生命曲线 《图书馆学导论》于良芝 2003 科学出版社
区分自引他引 自引量(3) 自引用
引文分析 • 实现期刊-期刊到图书-图书、图书-期刊、期刊-图书的引用分析 • 完善中文期刊引用分析: 4000万到7600万 • 提供作者、出版社、刊名、作者单位、主题词、 学科、分类等的引用分析 • 最终实现图书、期刊、学位论文、会议论文……之间互引的立体引用关系
馆藏分面 类型分面 关键词分面 年代分面
作者分面 全部可复选 作者机构分面 二级分类可展开 核心期刊分面
知识点与知识点的关联 点击数据仓库
知识点与人的关联 检索“图书馆学” 点击作者 吴慰慈
人与人的关联 点击作者 罗志勇
不同时期图书馆学领域高产出作者变化 1990—1995年 2009—2013年
不同时期图书馆学领域研究热点变化 2009—2013年 1990—1995年
知识关联的意义在于发现 人与人、人与知识、知识与知识、机构与人、机构与机构等之间的相互关系。
多主题分析 网格计算与云计算发展相关性分析