330 likes | 459 Views
§2.6 文献检索语言 -1. 2.6.1 检索语言的含义 检索语言 检索语言( Retrieval Language ):是信息检索系统存储和检索所用的共同语言。 标引:用信息检索语言对文献信息的外表特征和内容特征加以表述的过程称作标引; 标识:通过标引而获得的代表文献信息外表特征和内容特征的信息检索符号或语词被称作标识。. §2.6.2 文献检索语言的功能. 检索语言的功能 ① 标引功能。 ② 集中相关文献信息的功能。 ③ 组织功能。 ④ 匹配功能。 检索语言的分类
E N D
§2.6 文献检索语言-1 2.6.1 检索语言的含义 • 检索语言 • 检索语言(Retrieval Language):是信息检索系统存储和检索所用的共同语言。 • 标引:用信息检索语言对文献信息的外表特征和内容特征加以表述的过程称作标引; • 标识:通过标引而获得的代表文献信息外表特征和内容特征的信息检索符号或语词被称作标识。
§2.6.2 文献检索语言的功能 • 检索语言的功能 ① 标引功能。 ② 集中相关文献信息的功能。 ③ 组织功能。 ④ 匹配功能。 • 检索语言的分类 ⑴ 按结构原理划分:① 分类检索语言 ② 主题检索语言 ③代码检索语言 ④ 引文检索语言。 ⑵ 按组配形式划分:① 先组式语言② 后组式语言。 ⑶ 按照表达文献的特征分:① 表述文献外表特征的检索语言。② 表述文献内容特征的检索语言。
2.6.3 检索语言的分类检索语言分类-1 体系分类语言 按结构原理划分 体系分类语言 分类语言是一种按学科范畴和体系来划分事务的检索语言。用分类 号来表达各种概念。将概念按学科属性进行分类,并按科学体系的层次系统排列。它以科学分类为基础,结合文献的内容特征,运用概念划分的方法,按知识门类的逻辑次序,从总到分、从一般到具体进行层层划分,产生许多不同级别的类目。 • 分类 检索 语言可以分为等级体系分类语言和组配分类 语言,目前常用 的是体系 分类语言。
国内外比较 典型的体系分类语言有:中国图书馆图书分类法、中国科学院图书馆图书分类法、中国人民大学图书馆图书分类法、四部分类法、中国图书资料分类法、南京大学图书馆图书分类法,美国国会图书馆图书分类法、杜威十进分类法、国际十进分类法,等等。
《杜威十进分类法》(Dewey Decical Classification , 简称《杜威法》,DDC): 《美国国会图书馆图书分类法》 (Library of Congress Classification, 简称《国会法》LCC)
分类法:用分类表和分类规则来标引、组织、检索文献信息的方法。分类法:用分类表和分类规则来标引、组织、检索文献信息的方法。 • 体系分类法:按照文献内容所属的学科、专业性质及特征,对文献信息进行系统化组织的一种方法。
我国的中图法 • 《中图法》分5个基本部类、22大类。采用汉语拼音字母与阿拉伯数字相结合的混合号码,用一个字母代表一个大类,以字母顺序反映大类的次序,在字母后用数字作标记。为适应工业技术发展及该类文献的分类,对工业技术二级类目,采用双字母标识。
中图法五大部类 马列毛泽东 邓小平理论 社会科学 自然科学 中图法 五大部类 综合科学 哲学
体系分类法的特点 • 优点 : (1). 分类体系语言能较好地体现学科的系统性,反映事物 的平行、隶属和派生的关系,适合人们认识事物的习 惯,有利于从学科或专业的角度进行族性检索,能达到 较高的查全率。 (2). 采用国际上广泛使用的拉丁字母和阿拉伯数字作为概念 标识的分类号,比较简明,便于组织目录系统。 • 缺点: (1). 体系分类表具有相对稳定性,难以随时增设新兴学科的 类目,不能及时反映新学科、新技术、新理论方面的信 息,对检索结果的查全率和查准率有一定的影响。 (2). 体系分类表属直线性序列和层垒制结构,难以反映因科 学技术交叉渗透而产生的多维性知识空间,对检索结果 的查全率带来了一定的影响。
标题词语言 标题词语言 标题词语言 单元词语言 单元词语言 单元词语言 叙词语言 叙词语言 叙词语言 关键词语言 关键词语言 关键词语言 检索语言分类-2 主题检索语言 是指采用描述文献主题的语词标识并按字顺序列排检的检索语言。 按主题词性质的不同又分为: • 标题词语言 • 单元词语言 • 叙词语言 • 关键词语言 主题检索语言 是指采用描述文献主题的语词标识并按字顺序列排检的检索语言。 按主题词性质的不同又分为: • 标题词语言 • 单元词语言 • 叙词语言 • 关键词语言 主题检索语言 是指采用描述文献主题的语词标识并按字顺序列排检的检索语言。 按主题词性质的不同又分为: • 标题词语言 • 单元词语言 • 叙词语言 • 关键词语言
标题词语言 标题词是从自然语言中选取的、经过规范化处理的、表示事物概念的词、词组或短语 标题词表:将标题词按字母顺序编制的词表 如Ei所用的《工程标题词表》(Subject Headings for Engineering, SHE);《美国国会图书馆标题词表》(Library of Congress Subject Headings, LCSH)
标题词语言的特点 • 标题词表中的主、副标题词已事先固定组配,标引和检索时,只能选用已“定型”的标题词作为标引词和检索词,所反映的主题概念必然受到限制。尤其是代表现代科技主题的内涵与外延越来越复杂,几乎不可能用一对主、副标题词完全 、确切地表达出来,就需要补充其他的主、副标题词,结果不仅增加了标引和检索的工作量,而且还降低了标引和检索的准确性,直接影响到检索系统存储和检索的质量和效率 。
单元词语言 单元词语言是以单元词作为文献内容标识检索的语言。 单元词又称元词,是指从文献中抽取出来的,能够表达文献主题的、不能再分的经规范化处理的最小最基本的词汇单位,是主题词的一种,是一种规范化的后组式检索语言。 特点:单元词具有相对独立性,词与词之间没有隶属关系和固定组合关系,检索时根据需要进行组配。由于单元词的专指度较低,词间无语义关系,对查准率有较大的影响,现已被叙词语言取代。
叙词语言 叙词语言是以叙词作为文献内容标识和检索的主题语言。 叙词又称为描述词或叙述词,是以概念为基础,经过优选和规范化处理并具有概念组配和词语和词间语义关系显示功能,用以表达文献主题和检索需求的语词,也是主题词的一种。 通常使用的叙词表有:国内《汉语主题词表》,英国《科学文摘》使用的《INSPEC Thesaurus》,美国《工程索引》使用的《Ei Thesaurus》等等。 《 INSPEC Thesaurus》由叙词主表和词族表组成
叙词语言的基本特性表现为: • (i)叙词语言的概念组配性 概念相交组配。 “汽车部件*发动机=汽车发动机”。 概念限定组配。电视机*数字化=数字电视机。 概念并列组配。环境污染+环境保护= 概念删除组配 计算机﹣模拟计算机=数字计算机 (ii)叙词的规范性 词义规范(计算机与电脑),(实验与试验),(土豆与马 铃薯), 杜鹃(动物)、杜鹃(植物) 词类规范。具有实质意义的名词或动名词 词形规范。即对词的繁简体、词序、字母符号等做出规定 (iii)叙词的语义性 语义关系主要有同义关系、属分关系和相关关系。叙词语言对语义关系的揭示方法,主要通过各种语义参照符号来反映和联系。
叙词语言的特点 • 叙词语言吸收了其他检索语言的优点,并加以改进。例如,叙词语言吸收了体系分类语言的等级关系,编制了词族表,吸收了标题词语言的规范化处理方法和参照系统,达到了一词一义,发展了词与词之间的逻辑关系 ,形成语义网络,编制了叙词表;与单元词语言的组配原理,并取代了单元词语言; 吸收了关键词语言的轮排方法,编制了各种叙词索引。因而,叙词语言在直观性、单义性、专指性、组配性、多维检索性、网络、语义关联性、手检与机检的兼容性、符合现代科技发展的适应性诸方面,都较其他检索语言更加完善和优越。
选择规范化主题词的注意事项 • 选事物名称或过程作为主题词;如“蘑菇保鲜技术”,应选取“蘑菇”和“保鲜”作为主题词 • 避免使用一些泛指性词;如“技术”“工艺”等 • 适度专指性;有些过分偏窄的词也不适合作为主题词,比如“蘑菇”可能专指太强,未能专门列出,应考虑它的上位类“食用菌”“蔬菜”或“食品”等。
关键词语言 关键词法:是从科学技术文献的篇名、摘要、正文中选出具有实质性意义并能表达文献主题内容的科技名词术语来作为检索标识的。 关键词:具有实质性意义的科技名词,对揭示和描述文献主题内容来说是重要的,带关键性的词语被称为关键词。 分为:普通关键词索引(Keyword Index);题内关键词索引(Keyword In Context Index);题外关键词索引(Keyword Out Contex Index)。
检索语言分类 -3 代码检索语言 是用来标引、检索特定专业文献的某种代码系统。 如化学元素物质登记号,专利号等,检索系统是用代码检索语言来标引的
检索语言分类 -4 引文检索语言 基于文献之间引证关系而形成的一种检索语言。 它以引文为检索标识,根据引证关系将有关文献自然地偶合在一起。检索时通过引文标识可以回溯到一系列内容相关的文献 。
题名途径 引文途径 分类途径 检索 途径 序号途径 主题途径 著者途径 文献检索途径和方法及检索步骤 • 文献检索途径:
文献检索方法: 手工检索条件下常用检索方法有: 直接检索法,工具检索法,追溯检索法,综合检索法
文献检索方法-1 • 直接检索法(直查法):是指不利用检索工具或检索系统,通过直接浏览或查阅原始文献,来获取所需文献信息的一种检索方法。 • 工具检索法:又称常用法或间接检索法,即利用检索工具查找文献的方法。分为顺查法、倒查法和抽查法
文献检索方法-2 ① 顺查法:根据检索课题分析所得出的年代要求,由远及近的时间顺序逐卷逐期查找的方法。 ② 倒查法:根据检索课题分析所得出的年代要求,由近及远的时间顺序逐卷逐期查找的方法。 ③ 抽查法:就是根据学科发展特点,抓住某学科发展速度,文献发表较多的年代,有选择性地检索文献的方法。 • 追溯检索法(引文追溯法):利用文献末尾所附的参考文献为线索,进行追溯查找的一种方法,又称参考文献法。 • 综合检索法:即综合使用工具法和追溯法检索的方法,又称循环法或交替法。
文献检索方法及检索步骤 文献检索的步骤 • 分析课题,制定检索方案。 分析课题的主要内容、所属学科范畴,明确检索要求,确定检索时间范围,制定出整体方案。 • 选择检索工具 根据课题的学科性质和专业性质选择合适的检索工具。
选择检索方法 主要依据课题性质、检索目的和检索范围以及对学科发展状况的了解程度来选取。 • 选择检索途径 根据检索工具的特点和功能来选择。 ① 分类途径。② 主题途径。③ 篇名(书刊名称)途径。 ④ 著者途径。⑤序号途径。文摘号、报告号、专利号、标准号、合同号。 5. 修改检索策略 6. 整理检索结果并获取原始文献 7. 原始文献缩写名称的还原
思考题 • 检索语言的主要类型有哪些?各有哪些特点 • 简述文献检索的一般程序和步骤?