1.12k likes | 1.19k Views
方略 —— 开创知识管理新纪元. 王立旭 北京雷速科技有限公司 2011 年 4 月 20 日. 一、背景. 最近 20 年左右,图书馆等知识服务机构的发展环境发生了重大变化,其中有两个方面的变化特别值得我们关注: ①数字资源对图书馆等知识服务机构馆藏资源结构的改变,图书馆馆藏品种与数量极大丰富。 ②互联网的发展及其在学术领域和图书馆领域的广泛、深入应用。. 一、背景.
E N D
方略——开创知识管理新纪元 王立旭 北京雷速科技有限公司 2011年4月20日
一、背景 • 最近20年左右,图书馆等知识服务机构的发展环境发生了重大变化,其中有两个方面的变化特别值得我们关注: • ①数字资源对图书馆等知识服务机构馆藏资源结构的改变,图书馆馆藏品种与数量极大丰富。 • ②互联网的发展及其在学术领域和图书馆领域的广泛、深入应用。
一、背景 • 这两个方面的变化对于图书馆的发展产生了深远的影响。就前者而言,馆藏资源日趋丰富,既给图书馆带来了新的发展机遇和发展空间,但同时也给图书馆带来了有效服务的巨大压力,读者不仅仅满足于知道图书馆有什么,而是更希望知道在图书馆能找到什么。
一、背景 • 就后者而言,一方面读者对于互联网的依赖越来越强,相当部分的读者在查找资料时首先想到的是互联网而不是图书馆,使得图书馆等知识服务机构的吸引力有逐渐减弱的趋势;另一方面,互联网上高品质学术资源或者太少或者淹没在庞大量级的检索结果中,读者对于互联网的检索效果又不是十分满意。
一、背景 • 图书馆自身采购或者自建的数字资源、分布在互联网上的高品质学术资源,因为检索方便、传输快捷、无复本限制的优点受到知识服务机构和读者的欢迎,因此,随着时间的推移,数字资源将逐步超过非数字资源成为图书馆第一大资源。 • 但是,由于数字资源格式和载体的多样性及其对环境的依赖性,数字资源比印刷版资源更具脆弱性。因此,数字资源的长期保存、保护与管理成功与否直接关系到图书馆战略竞争力的强弱。
一、背景 • 从而,对于馆藏资源和互联网高品质学术资源的深度挖掘、保存、管理、呈现、利用的需求日趋强烈。 • 对于馆藏资源和互联网高品质学术资源的深度挖掘、保存、管理、呈现的终极目的是为了使用,其全部着眼点在于应用,而学科导航和统一检索是实现上述目标的有效方式。
二、标准 • 馆藏资源和互联网资源浩如烟海,学科导航必须有所取舍,有所取舍就必须有所依据,依据即是标准。 • 学科导航涉及到的标准包括知识组织体系、资源遴选标准、元数据标准、质量标准等。
二、标准 • 1、知识组织体系 • 分类法和主题词表是进行知识组织的主要工具。在构建方略的分类知识组织体系过程中,我们依据教育部颁布的《授予博士、硕士学位和培养研究生的学科、专业目录》、国家标准GB/T13745-92《学科分类与代码表》和《中国图书馆分类法》三种分类法,统筹考虑网络资源的分类组织、读者接受程度、具有可扩充性、后续资源重组等因素,编制了《方略知识组织体系》,按照该体系,方略分为哲学、法学等14个门类、108个一级学科、600多个二级学科和3000多个三级学科,较好地实现了概括性、前瞻性、扩充性的结合。
二、标准 • 1、知识组织体系 • 主题词表是在借鉴、吸收《中国分类主题词表》、《中国大百科全书》的基础上,加上几年来项目本身在生产中积累形成的词库,经过去重、遴选建成的,方略主题词表目前包括各个学科的主题词20多万条,以后还会逐步增加。
二、标准 • 2、资源遴选标准 • 我们在综合考虑了定性评估标准与定量评估标准各自的优劣之后,制订了《方略学科导航资源遴选标准》。该标准充分借鉴其他领域的研究成果,采用单一标准与多元标准综合应用的方法,以定性评估为主,较好地解决了遴选的效果与效率之间的关系。据此,宏观上将学术资源分为四个级别:五星级、四星级、三星级、没有星。对站点资源进行宏观遴选时依据星级从高到低逐级选用。
二、标准 • 2、资源遴选标准 • 具体对于每篇文献的遴选,制定有《方略学科导航采编规范》,依据规范将资源分为删除、保留两个类别,每篇文献首先判断是否必须删除,然后才决定是否应该保留,从而很好地杜绝了垃圾记录。而对于每篇文献内部的垃圾信息比如文献中间的广告内容都由人工进行去除。对于保留选用的记录同时根据学术内容给予相应的级别。
二、标准 • 3、元数据标准 • 我们依据DC元数据标准建立了自己的元数据,方略元数据标准建立的依据首先是满足用户的使用习惯,其次满足大规模生产作用需要,而不是为了元数据而元数据。方略元数据的主要字段包括标题、作者、作者单位、关键词、摘要、全文、图片、分类、链接、重要程度、采编时间、创建者等。
二、标准 • 3、元数据标准 • 对于元数据的字段格式标准也做了严格的规定,诸如关于人称、时间、多个作者(关键词、单位等)的区隔、数字格式、字母格式等。例如:许多学术要闻的标题都是以第一人称“我校”、“我院”,根据标准须改成第三人称学校、学院的全称。时间中年的写法须写完整格式,“2008-08-31”、“2008年8月31日”是符合标准的写法,而“08-08-31”、“08-31”、“8月31日”、“上月31日”、“本月1日”等则是不符合标准的写法。两字作者之间不能有空格,多个作者之间是用英文状态下的分号隔开。等等。
二、标准 • 4、质量标准 • 质量标准包括学术质量与编辑质量两种类型的标准。学术质量的标准主要依据《方略资源遴选标准》来控制。根据标准凡是属于必须删除的文献绝对不予收录,对于符合收录条件而收录的文献,严格对照标准检查其所给予的星级是否合适,资源的星级就低不就高,凡是不符合五星级标准的资源决不能给予五星级,宁缺毋滥。同时,对于有政治性错误的文献也不予收录。
二、标准 • 4、质量标准 • 编辑质量标准除了依据国家有关的出版质量标准关于错误率的规定之外,还根据学科导航本身的特点制订了自己的标准。比如:对于断链的比例,方略规定不高于1%。对于文章的标题、作者、关键词、摘要、标点、日期、链接等结构、书写格式都做了规定。 • 为保证质量,我们还制订了《方略质量检查规范》,详细规定了质量检查的范围、周期、方式、处罚、奖励规则,有效地保证了生产质量的稳定性。
三、技术 • 方略采用的开发环境是windows200X,sqlserver2000,java和asp.net。方略系统平台综合应用了web技术、数据库技术、博客技术、RSS技术、搜索引擎技术、维基技术、知识管理技术等最新的技术等,经过几年的持续开发与完善,方略系统平台坚固、强壮、灵活、效率高。
三、技术 • 从应用层面讲,学科导航系统可以分为两个部分:生产系统和读者系统。生产系统包括定向分析子系统、定向获取子系统、采编子系统、存档子系统、索引发布子系统。生产系统通过分析方略欲收录站点的特征进而将符合该特征的网页内容自动获取下来并对这些网页内容进行编辑、标引,最后对符合条件的网页进行本地存档。对于那些高价值网页比较少的站点和非互联网资源可以采取人工采集的方式进行生产,但自动获取网页的效率是单纯人工采集效率的5倍。经过编辑存档的内容通过生产系统的索引子系统建立全文索引文件就可以发布使用了。
三、技术 • 读者系统包括检索子系统、学术社区子系统、博客子系统、在线百科子系统、用户管理子系统、流量子系统、版权保护子系统等。读者系统为读者提供了学科导航的使用环境,读者可以按照学科、主题、栏目浏览相关文献,也可以按照标题、作者、单位、关键词、摘要、网址、图片、全文、精确、模糊、二次检索等检索功能对相关内容进行方便的检索。通过读者子系统,可以进行IP用户、单机用户、流量用户等类型的用户管理。通过读者子系统,读者既可以阅读原文,又可以阅读系统的存档全文,读者不用担心导航资源的不稳定问题。
四、生产 • 持续发展是当今世界的主流发展理念,影响学科导航效果的主要问题在于持续发展问题没有得到很好解决。资源的学术性和稳定性是影响持续发展的最为重要的两个问题,而后者尤为关键,因为稳定性是学术性的基础,资源稳定性问题解决不好,学术性就成为无源之水,无本之木。
四、生产 • 而解决资源稳定性问题,不单纯是一个技术问题,同时也是一个生产组织问题;资源稳定性问题不仅贯穿于整个方略学科导航系统的建设过程中,而且也贯穿于其应用过程中。系统的持续发展需要持续的生产作业和后续的技术支持来保证。几年来,方略形成了一套以良好的运作机制、技术平台、生产平台、生产工艺、管理体制、技术支持为基础的符合市场规律的生产方式。
四、生产 • 在生产的组织管理方面,方略设置了采编员、质检员和项目主管三级岗位。项目主管负责方略的学科设置、内容建设、资源评估等宏观工作,类似于报刊的主编岗位。质检员负责包括若干个学科在内的学科群建设并指导采编员的工作,包括指引学科群的建设重点、平衡学科群各学科之间容量、采编国外资源等。采编员具体负责某些学科的内容建设,包括网络资源的获取、采集和发布等。采编员、质检员和项目主管分别接受后者的业务指导。
四、生产 • 为保证学科的均衡发展,方略在生产过程中严格按照学科建设规划进行生产,每个学科的每个栏目所收录资源的数量都要按照规定的标准执行,不允许出现大的偏差。对于国内学术资源和国外学术资源的比例也做了明确的规定。如果由于各种原因一旦出现了学科或栏目之间的不平衡,会随时根据情况采取措施予以校正。
四、生产 • 特别值得的指出的是,在生产过程中,方略对于所遴选收录的每篇文献都做了原生态存档,以全息的方式“原汁原味”地保存了每篇文献的文本、版式、图片、色彩等内容,从根本上彻底解决了网络资源的稳定性问题。
五、生产 • 方略所遴选的内容由各个学科(不单纯是分类标准所列的学科)以网络形态为主的全球学术资源组成的。方略收录的文献类型包括学术动态、学术人物、学术成果、考试资料、基本典籍和论文等。建设过程中特别重视对西方发达国家以及科学技术发展比较快的发展中国家网络学术资源的搜集整理,并制订了具体的工作计划。在搜集整理国外网络学术资源时,我们采取的是重点与一般相结合的方针,注意不同国家和地区的平衡性,力求使学科导航收录的内容能够全面反应全球学术发展水平。
五、生产 • 通过与方略统一检索系统解决方案的结合,用户可以将学科导航系统与自己订购的各种商用数据库、自建数据库和书目数据库按照学科整合在一起,而且可以根据读者和学科的需要自己采编相关资源,从内容上实现学科门户的个性化要求,真正满足学科、专业、方向的个性化需求。
五、生产 • 需要注意的是,个性化并不排斥学科导航的基础性资源,并不意味着每一条记录都是图书馆自己去亲自采编,实现个性化的重要的而且也是主要的手段是根据学科、专业、方向的需求进行资源重组,这些资源一方面来自图书馆自己订购或者自建的各种非互联网资源,另一方面来自方略学科导航系统遴选收录的互联网高品质学术资源。
三、方略的基本情况 • 方略知识管理系统(http://www.firstlight.cn)是以收录全球高品质互联网学术资源为主的学习研究平台,对于教学、科研、管理、考试等知识工作者有很大的帮助。方略既是一个学科导航平台,又是一个互联网高品质学术资源存档管理平台,无论对于知识工作者个人还是以保存文献传播知识为己任的图书馆来说都是十分有价值的。
三、方略的基本情况 • 方略目前设有14个学科门类,108个一级学科,600多个二级学科,3000多个三级学科,基本上覆盖了国内外的所有学科领域。
三、方略的基本情况 • 根据方略的资源建设规划,方略目前收录的资源种类包括国内外的学术动态(知识要闻、学术动态)、国内外的学术会议(会议中心)、国内外的专家学者(人物)、学术成果目录(学术指南)、各学科的基本典籍、必读书目、课件、研招资料、知识库和学术站点。
三、方略的基本情况 • 学术站点主要收录科研机构、博硕士点、博士后站、政府科研计划项目与基金、重点实验室、教育机构、行业协会、专业媒体、专业站点、政府机构、相关企业、个人站点、国际组织、核心期刊和开放资源等15类学术站点。
三、方略的基本情况 • 研招资料包括招生动态、招生简章、参考书目和试题。对于参加研究生招生考试和博士生招生考试的读者帮助较大。
三、方略的基本情况 • 必读书目包括专科生必读书目,本科生必读书目,硕士生考试参考书目、博士生考试参考书目、博士生必读书目、资深研究必读书目。
三、方略的基本情况 • 到2010年3月31日,方略已经收录了全球高品质学术站点3万多个,遴选上述站点中高品质学术文献和非互联网学术文献75万多篇,原文附件9万多篇,图片7万余幅、存档文本75万多篇,合计所占空间300GB。
三、方略的基本情况 • 截止2010年3月31日,方略所收录的文献745564篇,哲学、经济学等十四大门类中资源分布情况如下:哲学 26805篇(3.60%)、经济学33800篇(4.53%)、法学122195篇(16.39%)、教育学18510篇(2.48%)、文学53611篇(7.19%)、历史15788篇(2.12%)、理学109984篇(14.75%)、工学191374篇(25.67%)、农学64671篇(8.67%)、医学68595篇(9.20%)、军事学6244篇(0.84%)、管理学25942篇(3.48%)、旅游学2398篇(0.32%)、文化学5636篇(0.76%)。
三、方略的基本情况 • 其中,各种题材的文献数量及其所占资源的百分比如下:知识要闻40092篇(5.38%)、国际动态24406篇(3.276%)、人物30192篇(4.05%)、学术站点31478篇(4.22%)、研招资料4676篇(0.63%)、会议中心18390篇(2.47%)、学术指南25113篇(3.376%)、必读书目3949篇(0.53%)、基本典籍5302篇(0.71%)、课件11310篇(1.52%)、知识库550516篇(73.84%)。
三、方略的基本情况 • 其中,方略所收录的全球学术站点数量为31463个,各种类型的站点分布如下:国际组织437个(1.39%)、核心期刊655个(2.08%)、开放资源577个(1.83%)、科研机构4449个(14.14%)、博硕士点959个(3.05%)、博士后站33个(0.10%)、政府科研计划项目与基金247个(0.79%)、重点实验室514个(1.63%)、教育机构8992个(28.58%)、行业协会3800个(12.08%)、专业媒体1418个(4.51%)、专业站点4131个(13.13%)、政府机构2663个(8.46%)、相关企业2067个(6.57%)、个人站点204个(0.65%)、综合站点318个(1.01%)。
四、如何保证方略的学术质量? • 方略所收录资源的学术质量高低,是由两个方面的因素决定的:科学的生产组织体系和受过系统培训的专职学科编辑。
四、如何保证方略的学术质量? • 方略的资源建设是一个持续、系统的工程,其所收录的资源学术质量,首先依赖于科学而严密的生产组织体系,这其中包括资源评估标准、资源加工标准、资源知识组织体系、生产模式、质量控制、持续维护等诸多方面的要素。经过四年多的探索和实践,我们形成了一整套科学、严密、完善的生产组织体系,有效的保证了资源建设的学术质量。
四、如何保证方略的学术质量? • 方略所收录的每一条记录都是经过专业学科编辑人工处理过的,对于每一条记录是否收录都由人工决定。我们的学科编辑都是有一定学科背景,并且具有一定的学科编辑经验。在正式独立工作之前都要接受长达半年的系统培训,培训内容包括方略的资源选取标准、资源评估标准、编辑质量规范、相关学科的知识组织、相关学科的发展状况,这样他们在进行资源加工的时候,就会有效地把握分寸,从微观上保证了每一条记录的学术质量。
五、方略的功能 • 方略提供了标题检索、作者检索、单位检索、关键词检索、摘要检索、全文任意词检索、网址检索、栏目检索、分类检索、主题检索、精确检索、模糊检索、二次检索等检索方法。
五、方略的功能 • 标题精确检索
五、方略的功能 • 另外,在方略的生产和研发过程中,我们开发形成了一套包括20多万条词汇的中英文主题词表。该词表涉及到各个学科领域,主题检索就是依据该主题词表进行的精确聚类检索,有助于读者很快找到自己所需要的内容。