450 likes | 592 Views
第一章 信息检索基础知识. 第一节 文献信息基本知识 第二节 信息资源类型 第三节 信息检索的定义 第四节 信息检索的意义与作用. 文献信息基本知识. 信息的定义 信息与知识的关系 信息与文献的关系 信息与情报的关系. 信息的定义. 哲学角度分析 信息是普遍存在于自然界、人类社会和人类思维活动中的一种现象,它是信息源体存在方式或运动状态以一定形式与外界进行交换的讯号。 信息是事物属性和事物间关系的表征,人们正是通过信息来认识事物的运动现象及其规律的。. 信息与知识的关系. 知识源于表征事物属性和事物间关系的各种信息,成于这各种信息的集合或有序化。
E N D
第一章 信息检索基础知识 • 第一节 文献信息基本知识 • 第二节 信息资源类型 • 第三节 信息检索的定义 • 第四节 信息检索的意义与作用
文献信息基本知识 • 信息的定义 • 信息与知识的关系 • 信息与文献的关系 • 信息与情报的关系
信息的定义 哲学角度分析 • 信息是普遍存在于自然界、人类社会和人类思维活动中的一种现象,它是信息源体存在方式或运动状态以一定形式与外界进行交换的讯号。 • 信息是事物属性和事物间关系的表征,人们正是通过信息来认识事物的运动现象及其规律的。
信息与知识的关系 • 知识源于表征事物属性和事物间关系的各种信息,成于这各种信息的集合或有序化。 • 人交流与传递信息时,需要借助文字、语言、符号、代码、图像、电磁波、实物等加以表现(外化),而知识的这种表现(外化)形式,又成为其它知识接受者的“信息”。其它知识接受者能否将这些“信息”转化为自己的知识,则取决于其认知能力。 • 信息与知识的关系存在于“信息—知识—信息—知识”这样一种循环关系
信息与文献的关系 • 信息是泛指一切音信和消息,是事物属性和事物间关系的表征。并非一切信息都能够被人们感受、被人们有序化、被人们记录下来,只有那些被记录在各种各样的载体上的信息集合或有序化信息(知识),才形成文献。 • 信息集合或有序化信息(知识)构成文献的内核,形式多样的物质载体都可以记载这些信息并以不同方式进行交流、传播,这就是信息(Information)与文献(Document)的关系。
信息与情报的关系 • 情报的内核是信息,是信息的集合(知识)。杂乱无章的信息显然不是情报。再重要的信息必须经过传递才有可能成为情报。 • 信息经传递并能够产生重大效用方可视其为情报,否则就仅仅是一般的知识或文献。正因情报具有重大效用性,所以情报多带机密性质。
信息资源类型 • 不同记录形式划分:文字类信息资源 ;图表类信息资源 ;代码类信息资源 ;语音类信息资源 ;影像类信息资源 ;多媒体信息资源 ;数字化信息资源 。 • 不同载体制作形式划分:刻写型信息资源 ;印刷型信息资源 ;缩微型信息资源 ;声像型信息资源 ;电子信息资源 ;网络信息资源 。
不同文献出版形式划分:图书;期刊 ;报纸;会议文献 ;学位论文 ;政府出版物;标准文献;科技报告 ;专利文献;档案 ;产品资料 ; • 不同文献时序形式划分:零次文献;一次文献;二次文献;三次文献。
信息检索的定义 信息检索是指将信息按一定方式组织和存贮起来,并针对用户的需求找出所需信息的过程,又称为“信息存贮与检索”。对于信息用户来说,信息检索仅指过程的后一部分,即信息的查找过程,信息检索的目的是为了解决特定的信息需求和满足信息用户的需要。
信息检索意义与作用 • 信息检索可以避免研究人员重复研究或走弯路 • 信息检索可以节省研究人员的时间和精力 • 信息检索是获取新知识的捷径
第二章信息检索理论与方法 • 第一节 信息检索策略 • 第二节 信息检索步骤 • 第三节 信息检索方法 • 第四节 信息检索途径
第一节 信息检索策略 信息检索策略是为实现检索目标而制定的计划和方案,对整个检索过程的谋划和指导。 检索策略有两种方式: 手工检索策略和计算机检索策略。
信息检索可分为三种类型: • 普查型:需要全面收集某一主题的文献资料; 比如:2012年全国出版图书种类、比例 • 公关型:需要收集有关某一主题的某一特定方面的文献资料,以解决科研生产中的关键问题; 比如:混凝土中钢筋直径对房屋构件抗压性的影响 • 探索型:需要了解和掌握某一领域的最新研究动向或研究成果查出的文献具有新颖及时的特点。并要明确课题对查新、查全和查准的要求,包括信息的形式需求和内容需求。 比如:H7N9型禽流感病毒对人体免疫系统的干扰
考虑选择计算机检索系统要包含与信息需求结合紧密、学科专业对口、覆盖信息面广、报道及时、揭示信息内容准确、有一定深度的数据库以及系统的检索功能是否完善等。考虑选择计算机检索系统要包含与信息需求结合紧密、学科专业对口、覆盖信息面广、报道及时、揭示信息内容准确、有一定深度的数据库以及系统的检索功能是否完善等。 选择检索系统关键是数据库的选择,如书目文摘型数据库可检索文献信息的题名、作者、出处和文摘; 事实型数据库可检索文字、图形、声像、计算机程序等 选择检索系统
确定检索词 • 检索词是表达信息需求和检索课题内容的基本单元,也是与系统中有关数据库进行匹配运算的基本单元,检索词选择洽当与否,直接影响检索效果。 • 检索词分为四类: 1)表示主题的检索词 2)表示作者的检索词 3)表示分类的检索词 4)表示特殊意义的检索词
检索词的选择与确定要遵循以下两个原则: • 根据检索课题所涉及的学科专业和技术内容选词。 • 对检索词进行处理,使用检索词表进行比较对照,选用规范化的词汇作为检索词。
检索字段的分类 • 数据库中可供检索的字段通常分为基本检索字段和辅助检索字段。 • 基本检索字段主要有题名(TI)文摘(AB)主题词(DE)和标识词(ID),适用于各种数据库。 • 辅助检索字段主要有作者(AU),语种(LA),出版年代(PY)刊物名称(JN)。文献类型(DT)等字段。
实施检索策略 • 手工检索策略的实施,主要将检索策略中信息需求所涉及到的有关提问特征如:主题词、分类号、作者姓名等与检索系统中的检索标识进行比较分析,筛选与信息需求相一致的检索结果。 • 计算机检索策略的实施,是将构造好的检索提问表达式,输入计算机检索系统,使用检索系统认可的检索指令进行逻辑匹配运算,并输出检索结果。
修改检索策略 检索策略的好坏与检索表达式的建立、检索途径的选择、检索词的选用和检索词之间的逻辑关系直接有关,还与检索人员对语言学的了解、对事物的认知能力、专业知识水平的高低有密切关系,另对检索系统的特性和功能的掌握,以及外语水平都会影响到课题检索的结果。检索策略的修改反映在检索前、检索过程中、检索后。
修改检索策略的方法 • 检索前要查询一次文献、词表和数据库指南。 • 检索过程中要充分利用人——机对话的有利条件, 随时据信息反馈情况调整检索策略。 • 检索后对检索结果进行分析评价,建立文档、为今 后的检索积累经验。
第二节 信息检索步骤 信息检索步骤就是根据既定课题要求,利用检索工具查找有关资料的具体过程。它是检索策略的具体化,包括明确需求、分析主题、选择检索工具或数据库,确定检索次、构造检索表达式、提交检索表达式、现实与优化检索结果等。
信息检索步骤流程 分析课题的主题内容 确定课题的文献类型 确定检索时间范围 分析用户的检索评价要求
第三节 信息检索方法 常用的信息检索方法有: 常规检索法 回溯检索法 循环检索法 • 常规检索法。又称常用检索法、工具检索法。它以主题、分类、作者等为检索点,利用检索工具获的信息资源的方法。
根据检索方式,常规检索法又分为直接检索法和间接检索法根据检索方式,常规检索法又分为直接检索法和间接检索法 1)直接检索法。是指直接利用检索工具进行信息检索的方法。如利用字典、词典、手册、年鉴、图录、百科全书等进行检索。这种方法多用于查找一些内容概念较稳定较成熟、有定论可依的指示性问题的答案。即可解决事实性的检索和数据性的检索。 2)间接检索法。利用检索工具间接检索信息资源的方法。
根据检索需求,常规检索法又分为顺查法、倒查法和抽查法。根据检索需求,常规检索法又分为顺查法、倒查法和抽查法。 1)顺查法。根据检索课题的起始年代,利用选定的检索工 按照从旧到新、由远及近、由过去到现在顺时序逐年查找,直至满足课题要求为止的查检方法。 2)倒查法。倒查法与顺查法相反。这种方法多用于新课题、新观点、新理论、新技术的检索,检索的重点在近期信息上,只需查到基本满足需要时为止。此法查处的信息新颖,但查全率不高。 3)抽查法:是利用检索工具进行重点抽查检索的方法。针对某学科的发展重点和发展阶段,拟出一定时间范围,进行逐年检索的一种方法。此法检索效率较高,但漏检的可能性大,检索人员必须熟悉学科的发展特点。
回溯检索法。又称追溯法、引文法、引证法、是一种跟踪查找的方法。即以文献后面所附的参考文献为线索,逐一追溯查找相关文献的方法。在没有检索工具或检索工具不齐美的情况下,利用此法能够获取一些所需要的文献资料,但往往查全率不高,回溯年代越远,所获取的文献越陈旧。回溯检索法。又称追溯法、引文法、引证法、是一种跟踪查找的方法。即以文献后面所附的参考文献为线索,逐一追溯查找相关文献的方法。在没有检索工具或检索工具不齐美的情况下,利用此法能够获取一些所需要的文献资料,但往往查全率不高,回溯年代越远,所获取的文献越陈旧。 这类检索工具著名的有美国的《科学引文索引》《社会科学引文索引》《艺术和人文科学索引》,中国的有《中国科学引文索引》、《中国社会科学引文索引》。
循环检索法。又称交替法、综合法、分段法,检索时,先利用检索工具从分类、主题、责任者、题名等入手,查出一批文献,然后再选择出与检索课题针对性较强的文献,再按文献后所附的参考文献回溯查找,不断扩大检索线索,分期分段地交替进行,循环下去,直到满意为止。循环检索法。又称交替法、综合法、分段法,检索时,先利用检索工具从分类、主题、责任者、题名等入手,查出一批文献,然后再选择出与检索课题针对性较强的文献,再按文献后所附的参考文献回溯查找,不断扩大检索线索,分期分段地交替进行,循环下去,直到满意为止。
第四节 信息检索途径 • 信息检索工具是把众多的各类信息资源进行分析加工后,按照一定的特征标识排检组织而形成的信息集合体。 • 信息检索就是分析一些既定标识,从信息集合中选择信息 。 • 信息检索途径是与文献信息的特征和检索标识相关。据文献外部特征和内部特征,信息检索途径分为两大类。
1.以文献的外部特征为检索途径 • 题名途径。可查找图书、期刊、单篇文献。检索工具中的书名索引、会议名称索引、书目索引、刊名索引等都提供了从题名进行文献检索的途径。 • 责任者途径。包含个人责任者、团体责任者、专利发明人、专利权人、合同户、学术会议主办单位等。号码途径。据文献信息出版时所编的号码顺序来检索文献信息的途径。特定编号如:技术标准的标准号、专利说明书的专利号、科技报告的报告好、合同号、任务号、馆藏单位编的馆藏号、索取号、排架号等。
2.以文献内容为检索特征 文献的内容特征是指从文献所载的知识信息中隐含的、潜在的特征,如:分类、主题等,内容特征作为检索途径更适宜检索未知线索的文献。 • 分类检索。以课题的学科属性为出发点,按学科分类 体系来查找文献信息,以分类作为检索点,利用学科分类表、分类目录、分类索引等按学科体系编排的检索工具来查找有关某一学科或相关学科领域的文献信息。
主题检索。以课题的主题内容为出发点,按主题词、关键词、叙词、标题词等来查找文献。以主题作为检索点,利用主题词表、主题目录、主题索引等按主题词的字顺编排的检索工具来查找有关某一主题或某一事物的文献信息,能满足特性检索的需求。适合查找比较具体的课题。主题检索。以课题的主题内容为出发点,按主题词、关键词、叙词、标题词等来查找文献。以主题作为检索点,利用主题词表、主题目录、主题索引等按主题词的字顺编排的检索工具来查找有关某一主题或某一事物的文献信息,能满足特性检索的需求。适合查找比较具体的课题。 • 分类主题检索。是分类途径与主题途径的结合。
信息检索工具 • 检索工具的定义:检索工具适用于报道、存储、和查找各类信息的工具。包括传统的二次、三次、印刷性的检索工具,面向计算机网络的联机数据库检索系统、光盘数据库系统、搜索引擎等各种网络检索工具。
1、检索工具类型 按检索手段的不同,检索工具可以分为传统检索工 具和网络检索工具两大类型。 传统检索工具主要是各种类型的工具书。工具书是根据一定的需要,比较完备地汇集某一方面的资料,并按特定的方法加以编排,专供读者查考检索有关知识、资料、事实的书籍。据工具书的体例和功能,可分为检索型工具书、参考性工具书、词语性工具书、表谱性工具书、图录性工具书和边缘性工具书6种类型 。
工具书的介绍 简单介绍一下检索型工具书、参考性工具书、词语性工具书。 • 检索性工具书。是在一次文献的基础上整理、编制 出的提供文献信息检索的二次文献。包括书目、索引、 文摘、文献指南。主要用于查找国内外书刊资料。
参考性工具书。指能为读者提供各种所需的具体资 料的工具书,与检索工具书仅提供文献线索相比较,参考工具书提供的资料更具体,包括百科全书、类书、政书、年鉴、名录、手册。 • 词语性工具书。主要包括各类字典和词典,都是汇集字、词、成语、并按一定的次序编排、解释的工具书。词语性工具书可以分为综合类、成语典故类和专科类三种。
2、网络检索 • 因特网通过标准通信方式(TCP/IP协议)将世界各地的计算机网络连接起来,在因特网上,信息存放在世界各地的计算机上,任何网络包括校园网、企业网、国家网,只要通过一个结点介入因特网,整个子网就有可能成为因特网的一个部分,网上用户就可以通过计算机和因特网共享信息资源或者交换信息。开放的信息资源和信息检索工具超文本链接和使用的简便性等特点,使因特网成为知识经济的重要组成部分。
网络检索的特点有以下三点: • 开放性。因特网开放性表现在他提供大量免费信息资源和检索工具,允许用户随时查询,并提供大量信息交换场所,如获得公用共享软件,查询相关的事实和数据信息,还可随时查阅个图书馆目录和文献资料,使用远距离的信息资源。
链接性。因特网的链接性主要体现在环球网(WWW, World Wide Web )上,www是因特网上最受欢迎、最普及、最新的信息检索服务系统,它把网上现有的资源全部链接起来,使用户能够查找已经建立了WWW服务器的站点(Site)的超文本或超媒体信息资源。 • 便捷性。由于不受时间和空间的限制,世界各地的用户可以实时低、全天候地检索并获取各种形式的信息,因特网以交互方式,提供丰富、方便、界面友好的信息检索工具,通过这些工具的使用,用户可以获取所需的信息资源。
网络检索的主要工具主要的工具有:远程登录、文件传输服务、电子邮件、电子公告牌、Archie 、广域消息服务、Gopher 、WWW、代理服务器和NAT。
网络搜索中常见的两种工作方式的搜索引擎 • 全文搜索引擎 通过从互联网上提取的各个网站的信息(以网页文字为主)而建立的数据库中,检索与用户查询条件匹配的相关记录,然后按照一定的顺序(一般按照相关度)将结果返回给用户。 国外代表性的搜索引擎Google 国内代表性的搜索引擎Baidu
目录索引类搜索引擎 由信息管理专业人员在广泛搜集网络资源及有关加工整理的基础上,按照某种主题分类体系编制的一种可供检索的等级结构式目录。在每个目录类及子类下提供相应的网络资源站点地址,用户检索和浏览所需要的信息。比较适合查找综合性、概括性的主题概念,或对检索准确度要求较高的课题。国外代表性搜索引擎Yahoo国内代表性搜索引擎搜狐、新浪、网易