1 / 14

信息检索基础知识与信息 检索技巧专题讲座

信息检索基础知识与信息 检索技巧专题讲座. 天津商学院图书馆 吴凤玉 E-mail : wu5148@tjcu.edu.cn 电话: 26684017. 淘花 / 百度专用. 1. 一、信息检索. 信息检索是将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程和技术 。 对于信息用户而言,就是从信息集合中找出所需信息的过程。 信息检索基本原理: 提问标识(检索式)与文献标识的对比. 淘花 / 百度专用. 2. 二、信息检索途径. 检索途径: 又称为检索点。 依据文献的 外部特征 (题名、责任者、 出版者、出版时间等)

Download Presentation

信息检索基础知识与信息 检索技巧专题讲座

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 信息检索基础知识与信息检索技巧专题讲座 天津商学院图书馆 吴凤玉 E-mail:wu5148@tjcu.edu.cn 电话:26684017 淘花/百度专用 1

  2. 一、信息检索 信息检索是将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程和技术。 对于信息用户而言,就是从信息集合中找出所需信息的过程。 信息检索基本原理: 提问标识(检索式)与文献标识的对比 淘花/百度专用 2

  3. 二、信息检索途径 检索途径: 又称为检索点。 依据文献的外部特征(题名、责任者、 出版者、出版时间等) 和内容特征(分类号、主题词、关键词 或自由词等)来确定,是信息检索的入口点。 淘花/百度专用 3

  4. 常用检索途径 题名(篇名)途径:利用篇名中的字词或篇名的一部分进行检索。其结果是所有在篇名中出现该字、该词或该部分的文章。 著者途径:利用文献作者名字进行检索。可查到该作者的所有文献。 分类途径:利用分类名和分类号进行检索。其结果是该类目所有的文献。 淘花/百度专用 4

  5. 主题途径:利用与该篇文献主题相关的规范词(主题词)进行检索,其结果是包含该主题词的所有文献。主题途径:利用与该篇文献主题相关的规范词(主题词)进行检索,其结果是包含该主题词的所有文献。 关键词途径:利用与该篇文献主题相关的关键词(自由词)进行检索,其结果是包含该关键词的所有文献。 序号途径:利用文献的各种代码、数字编制的索引查找文献,如专利号、技术标准的标准号、科技报告的报告号等。 其他途径:如文献类型、参考文献、语种、出版(发表)年份、作者机构、出版机构等。 淘花/百度专用 5

  6. 三、信息检索常用方法 (一)布尔逻辑: 用布尔逻辑算符来表达检索词间的逻辑组配关系,是最基本、最常用的检索技术。 --逻辑或(+,OR):表达检索词间的并列关系。可扩大检索范围,提高查全率。如:A+B,表明结果中含有A或B都为检索命中 A B 淘花/百度专用 6

  7. --逻辑与(*,AND):表达检索词间的交叉关系。可缩小检索范围,提高查准率。如:A*B,表明结果必须同时含有A和B才为命中--逻辑与(*,AND):表达检索词间的交叉关系。可缩小检索范围,提高查准率。如:A*B,表明结果必须同时含有A和B才为命中 --逻辑非(-,NOT):表达检索词间的排除关系。可缩小检索范围,提高查准率,但要慎用。如:A-B,表明结果是A中不包含B的那部分 A B A B 淘花/百度专用 7

  8. (二)截词检索: 又称词干检索、模糊检索。检索时,只需用词干加截词符号,凡是含有与该词干相同的文献均能被检出。该方法能很好避免漏检现象的出现。 检索系统不同,截词符也不同,常用的截词符号有:?,*等。 分为有限截词(即一个截词符只代表一个字符)和无限截词(一个截词符可代表多个字符)。 按截断的位置来分,截词可分为后截断、前截断、中截断三种类型。 淘花/百度专用 8

  9. 举例说明: 后截断,前方一致。如: comput* 表示computer,computers,computing等。 王伟? 可查出所有名字中含“王伟”的作者的文献 前截断,后方一致。如: *Computer 表示minicomputer,microcomputer等。 中截断,中间一致。如 *comput* 表示minicomputer,microcomputers等。 作者=张?静 检索出张亚静、张雪静、张宇静等。 淘花/百度专用 9

  10. (三)限制检索 限制检索是缩小或约束检索结果的方法,主要是指限定字段检索,即是指定检索词在记录中出现的字段。 常用的字段代码有: TI(题名) AU(作者) AB(文摘) JN(刊名) PY(年代) LA(语种) …… 如: information science/TI LA=english 文摘=网络信息资源 淘花/百度专用 10

  11. 四、机检系统常用检索方法 简单检索(basic search):是一种单项检索。一般只需输入一个检索词,辅以相应的途径即可进行检索。 二次检索:在原有简单检索的结果基础上,再进行检索。可反复使用,不断扩大或缩小检索范围。 高级检索(advanced search):是一种多项组合检索,一般输入多个检索词进行组配。有的检索系统也称为复杂检索或扩展检索。 专家检索:用多个检索词与各种运算符组成检索式,功能与高级检索相似。 淘花/百度专用 11

  12. 五、检索技巧 信息检索最重要的两个指标: “检全率”与“检准率” 检准率:指检出的相关文献量与检出文献总量 的比率。反应检索结果的准确性。 检全率:指检出的相 关文献量与检索系统中相 关文献总量的比率。反映检索结果的 全面性。 淘花/百度专用 12

  13. (一)提高检准率的方法 查准率由高到低:题名>关键词>全文 使用限制检索 如:在百度中可以进行多种限制: 限定搜索网站(site: );文档格式(filetype:ppt、doc、pdf、xls等)。 反复使用二次检索(and) 使用“精确检索” 如:百度中的“”(双引号)与《》(书名号)等 维普与CNKI中的“精确检索” 淘花/百度专用 13

  14. (二)提高检全率的方法 查全率由高到低:全文>关键词>题名 使用同、近义词(or) 使用“模糊检索”和“截词检索”等 利用文献后所附“参考文献”进行检索 淘花/百度专用 14

More Related