920 likes | 1.04k Views
第 6 章 信息方法的综合利用. 信息方法的综合利用. 选择资源工具 构造检索表达. 分析信息需求,提取查询用词. 确定获取方法 制定查询策略. 步骤. 问 题. 评价调整检索 优化获取原文. 结 果. 创新性成果. 阅读鉴别整理 序化改编整理. 分析组织信息 创新交流利用. 成 果. 参见教材 P207 - 218. 6.1 信息需求分析. 形式需求:主要反映对信息外部特征或信息内容特征以外的其他方面的要求,主要包括对所要求的信息源的类型、级别、作者、语种、时间范围、空间范围的分析,对获取的结果形式的分析,对获取的结果数量的估计等等。.
E N D
信息方法的综合利用 选择资源工具 构造检索表达 分析信息需求,提取查询用词 确定获取方法 制定查询策略 步骤 问 题 评价调整检索 优化获取原文 结果 创新性成果 阅读鉴别整理 序化改编整理 分析组织信息 创新交流利用 成 果 参见教材P207-218
6.1 信息需求分析 形式需求:主要反映对信息外部特征或信息内容特征以外的其他方面的要求,主要包括对所要求的信息源的类型、级别、作者、语种、时间范围、空间范围的分析,对获取的结果形式的分析,对获取的结果数量的估计等等。 参见教材P208-211
6.1 信息需求分析 参见教材P208-211 6.1 信息需求分析 内容需求:主要涉及对用户信息请求所属的学科性质与主题范围的确定,包括对问题的背景知识、概念及知识体系的分析。
6.1 信息需求分析 6.1.2 需求分析方法 参见教材P208-211 • 分析主题的学科或专业范围可以利用体系分类表、分类目录树; • 分析主题概念的含义、了解相关主题的背景知识可以利用参考型工具、综合检索平台的知识搜索功能和分析功能; • 分析信息源的类型、级别、作者、语种、时间范围、空间范围,估计结果数量可以利用综合检索平台的知识搜索功能和分析功能。
例:分类目录树的利用 图3-5 电子技术及信息科学的子目录
3. 参考工具的利用 教材“3.4 数据事实的检索获取”
教材“3.4 数据事实的检索获取” 3. 参考工具的利用
4.平台分析功能:万方数据知识脉络分析 • 知识脉络即以主题词为核心,通过数据预处理技术和数据挖掘技术进行数据分析,并利用可视化技术动态展示知识的研究趋势,帮助用户进行趋势对比,快速掌握学术热点和走势。 • 同时可帮助用户从相关人物、相关期刊、相关机构、相关主题词等多维度进行数据挖掘和知识揭示。
植物修复知识脉络分析:帮助了解植物修复近年来的相 关研究情况,及与研究相关的核心内容的转变。 相关核心词汇
4.平台分析功能:万方数据知识脉络分析 • 检索词: • 是表达信息需求和检索课题内容的基本单元,也是与系统中有关数据库进行匹配运算的基本单元 • 检索词选择恰当与否,直接影响检索效果。
4.平台分析功能:万方数据知识脉络分析 • 确定检索词的基本方法包括: • 选择规范化的检索词 • 使用各学科在国际上通用的、国外文献中出现较多的术语 • 分析找出涉及的隐性主题概念、核心概念作检索词 • 利用检索词的缩写词、词形变化以及英美的不同拼法等方法。
6.2.1 利用词间关系分析精确关键词 上位词:指概念上外延更广的主题词 • 等同词:是某种明确概念的不同的表达词。如缩写和全称、学名和俗名、简繁体、不同语言说法、不同地区说法(美语英语,港台大陆)、不同时代说法(古今、代差)、别称、全角半角、大写小写、错别字、网络通假字、敏感词通假等。 同类词:指与主题词具有某种相同属性的词。 上位词 等同词 检索词 同类词 下位词:指概念上内涵更窄的主题词 下位词
词间关系分析示例 试用词间关系分析课题: 大学生心理健康教育研究 检索词:大学生、心理健康 、心理健康教育、 研究 同位词:心理问题、地域、心理调节、心理健康状况 下位词:贫困大学生、心理健康水平、抽样调查、民族
6.3 检索方法 常规法:根据信息需求从时间上对查找内容进行限定检索的方法。包括了顺查法、逆查法与抽查法。 顺查法:从起始年代,从远到近, 多用于 获取评述性文献; 逆查法:从最近时期,由近及远, 多用于检索新理论新成果等; 抽查法:抽取某一段时间范围, 多用于搜索高峰期代表性文献。
6.4 选择资源工具 6.4 选择资源工具 • 适合原则:数据库的学科范围,文献类型,收录的时间范围、信息量等均与需求相关度高; • 可获原则:就近获取,使用方便; • 熟悉原则:用户熟练掌握资源特色、检索功能;
6.4 选择资源工具 6.4 选择资源工具 • 经济原则:尽量能通过免费获取,或在用户能承受的经济负担范围内; • 学习原则:一是课堂学习;二是学习帮助文件或培训课件;三是网络在线帮助、咨询学习;四指学习不可间断。 参见教材P227-220 没有所谓的“最好”的信息源,只有最“适合”的信息源。
6.4 选择资源工具 6.4.1 依据信息需求 根据不同的检索需求选择不同类型的资源:
6.4 选择资源工具 6.4.1 依据信息需求
6.4 选择资源工具 6.4.2 依据学科属性 学科属性是考察检索工具是否适用的重要因素 • 首先,检索工具与查询问题的学科属性一致; • 其次,要考虑检索系统、数据库内容对课题内容的覆盖面和一致性; • 第三,检索工具在该学科领域的权威性; • 最后,选择跨学科的检索工具。
6.4 选择资源工具 6.4.3 依据功能特点 信息类型 检索功能 友好界面 检索工具 收编范围 服务功能 语言种类 辅助工具 时间地域
6.4 选择资源工具 6.4.3 依据功能特点 • 1.数据库通用检索功能 • 是检索系统在检索界面上提供给用户的基本功能。 • 通用的检索功能有: • 浏览检索、索引功能、基本检索、高级或复杂检索、二次检索或精制检索、专家检索等几种主要检索功能。
6.4 选择资源工具 数据库检索的基本功能 • 分类检索 ——采用中途分类法进行学科分类 • 初级检索 ——提供书名、作者、全部字段单条件检索 • 高级检索 ——提供多条件组合检索 • 专业检索——提供标准检索表达式,直接书写实现
分类检索及示例 • 分类目录一般以树状结构显示,用户通过逐级层层点击浏览,逐步缩小主题,来找寻所需内容。 • 特点: • 查准率相对高,查全率相对低,在检索学科专业属性明显的信息时利用这种方式极为方便, • 数据库信息归类质量与用户对信息类别了解的程度将直接影响到查询结果。 • 分类检索可与其它检索功能结合使用。
初级检索及示例 • 是面向一般读者提供的检索功能。 • 特点:适用于不熟悉多条件组合查询的用户,适宜一些简单查询 • 特点:方便快捷,效率高,但查询结果有很大的冗余。 • 如果在检索时进行二次检索或多加限制条件则可以大大提高查准率。
高级检索及示例 • 借助多种检索技术能进行快速有效的组合查询,包括布尔逻辑检索、位置检索、截词检索、限制检索等。 • 优点:查询结果冗余少,命中率高。 • 缺点:必须掌握一定的检索技术。 • 对于命中率或者专指度要求较高的查询, 建议使用该检索系统。 比初级检索少了17000多篇
专业检索及示例 • 是指使用数据库的所有检索项,采用系统所提供的检索语法,将各种检索条件构造成检索表达式,并将其直接输入(书写)到检索框中进行检索的方法。 • 特点:要查询者非常熟悉检索语法和条件
6.4.3 依据功能特点 • 2.数据库的服务功能 • (1)检索结果的显示主要表现在三个方面: • 一是每屏显示的记录数的限定。 • 二是排序方式的多样化,可按相关度、出版时间、文献标题、著者、来源、语言、出版国等多种方式升序或降序排列。 • 三是显示格式的多样化
6.4.3 依据功能特点 • 2.数据库的服务功能 • (2)检索结果的输出 • 提供在线阅览,存盘、 打印、下载方式 • 利用E-mial发送检索结果 • 将检索结果直接输出到文献信息管理软件( 如ProCite 、Reference Manager、EndNote等中),如ScienceDirect等 • 或可以跨库链接其它资源,如ISI web of knowledgeg平台; • 可对保存的格式进行选择,分为通用的PDF格式和需要用专用浏览器阅读的格式,如CAJ格式等。
6.4 选择资源工具 6.4.4 依据自身条件 从可获原则和经济原则出发,选择检索工具还需要考虑用户的自身条件,包括:个人的获取渠道客观经济条件 能力水平等,
6.5 构造检索表达 6.5 构造检索表达 方法:1.检索词的选定 2.检索途径的选择 3 .检索技术的选用 4 .限定条件的利用 自然语言是人们表达信息需求最方便的方式
6.5.1 例: 组配表达检索 综合页面图
知识搜索 数据库选择 布尔逻辑检索技术 跨库检索 最近词 词频选择 检索项 检索词 与中心词的相关词扩展 期刊导航、初级检索、高级检索、专业检索功能选项 时间限定 截词技术 结果页面显示条数限定 帮助链接 结果更新时间限定 范围限定 结果排序限定 学科范围选择 该数据库资源介绍 浏览器下载 6.5.1 例: 组配表达检索 图3-6 CNKI初级检索界面
6.6 评价检索效果 6.6 评价检索效果 • 查全率(recall factor)是指检出的相关文献量与检索系统中相关文献总量的百分比,是衡量信息检索系统检出相关文献能力的尺度,可用下式表示: • 查全率 =检出的相关文献总量/系统中的相关文献总量× 100% • 即 R=b/a * 100% 参见教材P236-237
6.6 评价检索效果 6.6 评价检索效果 • 查准率(Pertinency factor)是指检出的相关文献量与检出文献总量的百分比,是衡量信息检索系统精确度的尺度,可用下式表示: • 查准率 =检出的相关文献总量/检出文献总量× 100% • 即 P=b/m*100% 参见教材P236-237
6.6 评价检索效果 • 提高查全率的方法,扩检法 减少 and 算符,多使用 or 算符连接多个同义词、相关词 采用检索词的上位词、删除某些不重要的检索词 扩大检索词的可检字段范围,减少文献的外表特征限制 利用二次检索、高级检索扩大检索范围 利用跨库检索扩大数据库利用的数量、类型、范围
扩检示例 6.6 评价检索效果
扩检示例1 去掉了一个不太重要的检索词(研究)
扩检示例2 6.6 评价检索效果 核心期刊->全部期刊 扩大了时间范围
6.6 评价检索效果 6.6.2缩检法 • 提高查准率的方法,缩检法 增加 and 算符,减少 or 算符连接多个同义词、相关词 采用检索词的下位词、增加新的检索词 缩小检索词的可检字段范围,增加文献的外表特征限制 利用二次检索、高级检索缩小检索范围 在有针对性的数据库进行检索 参见教材P227-220