520 likes | 709 Views
计算机检索. 遵义医学院 医学文献检索教研室 8608202 zmcwxjsjys@163.com. 计算机检索. 第一节 计算机检索与数据库 第二节 如何制定检索式. 第一节 计算机检索与数据库. 一、 计算机检索的定义及其优点 二 、计算机检索发展史 三 、数据库的结构与类型 四 、计算机检索步骤. 一、 定义及优点. (一)定义: 就是通过计算机及与其 相连的通讯设备和线路 在存储文献的数据库中
E N D
计算机检索 遵义医学院 医学文献检索教研室 8608202 zmcwxjsjys@163.com
计算机检索 • 第一节 计算机检索与数据库 • 第二节 如何制定检索式
第一节 计算机检索与数据库 • 一、 计算机检索的定义及其优点 • 二 、计算机检索发展史 • 三 、数据库的结构与类型 • 四 、计算机检索步骤
一、 定义及优点 (一)定义:就是通过计算机及与其 相连的通讯设备和线路 在存储文献的数据库中 查找信息的过程。
(二) 计算机检索的优点 • 效率高,速度快 • 检索途径多 • 适合检索复杂课题 • 资源可共享,资源更新快 • 检索结果可直接输出 • 入手容易
二、计算机检索发展简史 脱机检索 联机检索 光盘检索 网络检索
三 、数据库的结构与类型 1、数据库的结构 • 文档--记录--字段 • 文档(file):数据库中一部分记录的有序集合(顺 排文档,倒排文档) • 记录(record):描述原始信息的外部特征和内部特 征。数据库中一条记录代表一篇文献 • 字段(field):比记录更小的单位,是组成记录的 数据项目(如TI、AU、 SO、AB……)
文献信息数据库 全文型数据库 事实型数据库 类型 书目型数据库 数值型数据库 多媒体数据库 2、数据库的类型
(1)书目型数据库 是二次文献数据库,主要存贮相关主题领域的各类文献资料的书目信息,包括机读版的文摘、题录、目录、索引等。 如:EM、IM、CA、BA……
(2)全文型数据库(Full-text atabase) CJFD、BMJ、FMJS、OUP……
(3)事实型数据库(Fact Database):提供有关事物、人物、机构等方面的事实性信息。如: Clinical Trials(临床试验数据库)、中国中药数据库、疾病诊疗数据库、中国医药产品数据库……
(4)数值型数据库(Numeric Database):提供数据性信息,包括各种统计数据、科学实验数据、各种测量数据等 如:WHOSIS和美国疾病控制与预防中心(CDC)的Data and Statistics等。可以获取死亡原因统计、卫生从业人员统计、人口统计、HIV/AIDS信息与数据统计数据和资料等统计数据、中药成方制剂标准数据库……
(5)多媒体数据库(Multimedia Database) :是数据库技术与多媒体技术相结合的产物,是文本、图像、声频、视频等多媒体信息的集合。 如美国的可视人、可视脑计划……
四、计算机检索途径及步骤 • (一)检索途径 • (二)检索步骤
(一)计算机检索途径 • 自由词检索 • 主题词检索 • 题名检索 • 著者检索 • 机构检索 • 刊名检索 • 默认检索 • 分类检索 • 引文检索 • ……
2、 检索步骤 分析检索课题 选择数据库 确定检索词 构筑检索式上机检索 否 浏览结果 是 输出结果
第二节 如何制定检索式
如何制定检索式 一、检索式与运算符的定义 二、运算符类型及其应用 三、检索效果评价
一、 检索式与运算符的定义 • 检索式:用运算符将检索词连接起来构成 的式子称成为检索式 • 运算符:又称为逻辑算符,是用来表达词 与词之间的逻辑关系和限定关系 的运算符号
二、运算符类型及其应用 • (一)布尔逻辑运算符:boolean operator • (二)位置符:position operator • (三)截词符:truncation node • (四)限定符:limit incantations
又称为“布尔算符”,由英国数学家乔治布尔提出又称为“布尔算符”,由英国数学家乔治布尔提出 (一)布尔逻辑运算符: • 用来连接两个或多个检索标识的符号 包括:AND、OR、NOT。
1、布尔算符 AND 的含义及应用 A B (1)含义:AND又称为逻辑“与”,表示“相交”关系,用于缩小检索范围(查准率) (2)应用形式:A AND B
例1 在CBM中找干扰素治疗白血病的文献 检索式为:干扰素AND白血病
2、布尔算符 OR 的含义及应用 (1)含义:“OR”又称为逻辑“或”,表示“并列”关系,扩大检索范围(查全率) (2)应用 表示形式:A OR B B A 例如:查找有关艾滋病的文献 检索式为:艾滋病 OR 爱滋病 OR AIDS OR 获得性免疫缺陷综合征
总结:提高查全率从以下几个方面考虑 • 全称、简称及缩写同时使用; • 规范词兼顾自由词(包括同义词、近义词); • 查上位词时勿忘下位词; • 注意外来词译写变化; • 采用多途径检索。
例2:用CBM查找1978年以来乳腺癌的检索结果 用CBM查找1978年以来脑梗塞的检索结果
例4: 用CBM查找脑血管疾病的有关文献 下位词 上位词
3、布尔算符 NOT 的含义及表示形式 (1)含义:NOT又称为逻辑“非”,用于 排除不需要的检索结果 (2)应用 表示形式:A NOT B B A 例如:白血病非放射性治疗的文献
4、运用“布尔算符”的注意事项 布尔逻辑运算符运算顺序为: NOT→AND→OR 1)运算符遵循数学运算法则; 2)在检索式中只有AND、OR前后的检索标 识可以交换; 3)检索式中有NOT时前后检索词不能交换。 备注: ( )必须在半角和英文状态下输入
(二)位置符 作用: 表示两个检索词之间位置的检索符。用于缩 小检索范围 包括: NEAR WITH 1、表示前后两个检索词出现在同一个句子中; 2、near后加上数字时,表示两个检索词之间 所间隔单词的数量为0至数字-1个 要求左右两个检索词出现在同一个字段中。
应用举例(一) • NEAR • 形式: A NEAR(n) B • 实例:检索乳腺肿瘤的检索式可简化为: breast near1 (cancer or neoplasms or Tumor or sarcoma or carcinoma)
应用举例(二) • WITH • 形式: A WITH B • 实例:Leukemia with complications
(三)截词符 • 作用:表示不确定字符的检索运算符,用于 扩大检索范围 • 包括:“*”(%、$)无限截词符“?”有限截词符(通配符)
应用举例(一) “*”的应用 如:1、急性*胰腺炎:可检出急性胰腺炎、急性重症胰 腺炎、急性出血坏死型胰腺炎、急性胆源性胰 腺炎、急性出血性胰腺炎等急性胰腺炎的所 有文献。 2、immun*: 可检出immune、 immunity、 immunology、 immunohistochemical 等所有含immun前缀的检索词的文献。
检索结果(CBM新版数据库) 可检索出急性胰腺炎、急性重症胰腺炎、急性胆源性胰腺炎、急性出血坏死型胰腺炎等
使用MEDLINE(06/7-06/10)查找免疫相关的文献结果使用MEDLINE(06/7-06/10)查找免疫相关的文献结果
应用举例(二) “?”的应用 例如:拉米?定:可检出含拉米夫定和拉米呋定 定的文章; Protein?:可检出含 Proteins 和 Protein的所有文章 注:“?”必须在半角或英文状态下输入
(四)限定符 作用:对特定字段的限定检索, 包括:“in”、“=”、“[]”、“.”等 表现形式:检索标识 限定符 字段名 实例:PY=2003; shi j sin au; shi j s[au] shi j s.au
总结:提高查准率从以下几个方面着手 • 检索结果多时采用“AND”缩小检索范围 • 检索下位词时不使用上位词 • 使用 “NOT”将不需要的检索标识排除 • 将“AND”改为限制词语间位置关系的位置符 • 使用限定符限定检索标识所在字段
三、检索效果评价 (一) 评价标准 查全率、查准率、漏检率、误检率 查全率P=a/(a+c)×100% 查准率R=a/(a+b)×100% (a:检出的相关文献量;b:检出的非相关文献 量;c:系统中未检出的相关文献)
(二)影响检索效果的因素 1、影响查全率的因素 文献存储:收录不全;词汇缺乏控制和专指;词 表结构不完整;标引不详或遗漏等 信息检索:策略简单;逻辑组配不当;途径和方 法太少;业务不熟;系统不具备截词 功能等。