1 / 68

情报检索与计算机信息检索

情报检索与计算机信息检索. 康忠民 200 8 年 9 月1日 Tel:13970792982Email:jxlgkzm@163.com. 课程目标. 面对日益增长的 Internet 的信息和文献资源,如何通过一种有效的方法,以最少的时间与精力来获取自己所要的信息。──这就是本课程所希望解决的问题. 课程主要内容. 1.理论基础 2. 手工检索 3. 计算机检索. 情报检索基础(第一章 绪论 ). 四个主要概念: 1、信息 2、 文献 3、 情报 4、 情报检索. 1 . 信息.

Download Presentation

情报检索与计算机信息检索

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 情报检索与计算机信息检索 康忠民 2008年9月1日 Tel:13970792982Email:jxlgkzm@163.com

  2. 课程目标 面对日益增长的Internet的信息和文献资源,如何通过一种有效的方法,以最少的时间与精力来获取自己所要的信息。──这就是本课程所希望解决的问题

  3. 课程主要内容 1.理论基础 2.手工检索 3.计算机检索

  4. 情报检索基础(第一章 绪论) 四个主要概念: 1、信息 2、文献 3、情报 4、情报检索

  5. 1. 信息 • 在日常生活中信息常被理解为人们口头、书面或者以其它方式传递的消息。信息不是物质本身,是物质的一种基本属性。是关于事物运动的知识。 • 每个人每天都在不断地通过感觉器官从外界接受信息。从书刊报纸、电视、收音机、交谈中不断获得信息。

  6. 信息的特点 (1)时效性:重要特点。如果信息传递很慢,那么有用的信息也会失去应有的价值。如新闻、预告。 (2)可扩散性:在时间或空间上从一点转移到另一点。“一传十,十传百”。 (3)可扩充性:人们对世界认识是无无限的,因此信息资源的扩充与累积也是无限的。 (4)共享性:信息可以多次传播,不失其内容,与实物交易不同。

  7. 2. 文献 • 记录有知识的一切载体。即用文字、图形、符号、声频、视频等技术手段记录人类知识的一种载体。 • 文献的范围很广。 古代:甲骨文、碑刻、竹简、帛书是文献。 现代:图书、报纸、期刊 现今:机读资料、缩微制品、电子出版物。

  8. 文献的级次(按信息的加工程度划分) • 零次文献信息资源——指尚未被记录下来,只是通过口头携带和传播的信息资源。零次信息资源的出现和传递带有极大的偶然性。其特点是鲜活、生命力旺盛。 • 一次文献信息资源——指经加工或粗略加工的原始信息资源,如正在研究或创造过程中产生的信息,包括会议记录、论文报告、统计报表、专利等。其特点是比较零散,系统性不强,半包括所有的主要内容。 8

  9. 文献的级次(按信息的加工程度划分) • 二次文献信息资源——指在一次信息资源基础上加工整理而成的信息资源,如文摘、索引、目录等,它们是引导和使用一次信息资源必不可少的工具。 • 三次文献信息资源——通过二次信息资源提供的线索,对某范围内的一次文献进行分析、研究加工而成的信息资源,亦称三次文献,包括综述、述评、专题情报研究报告、百科全书、年鉴、指南、手册、词典等。 9

  10. 文献的特征: • 外部特征:与文献精确对应的书名(或篇名)和作者 • 内部特征:与文献模糊对应的主题词和分类号

  11. 3. 情报 • 是一种人工信息,信息与知识都是它的来源。是激活了的,活化了的知识。 • 情报与信息在英文中同为Information,但信息的外延比情报广,信息是包含情报的。情报就是人们在一定时间内为一定目的而传递的有使用价值的知识或信息,它有明确的接收对象。

  12. 4.情报检索 • 情报检索就是从任何信息集合中识别和获得所需信息的过程 • 类型: 文献检索     数据检索     事实检索

  13. (1)文献检索 • 是以文献为检索对象的信息检索。文献检索根据检索内容不同分为: • ①文献的线索检索:利用书目、文摘和书目型数据库检索工具,检索的结果提供了文献的线索; • ②文献的全文检索:这种检索以查找到文献全文为目的。

  14. (2) 数据检索 • 以数值、图表、公式或化学分子式等形式表示的数据为检索对象的信息检索,其检索结果为数据信息。如:“长江有多长,洪水期最高水位有多高?”等。

  15. (3) 事实检索 • 以事实为检索目的和对象的信息检索。其检索对象既包括一些事实、概念、思想、知识等非数值信息也包括一些数据信息。从广义上讲事实也是一种全文,知识内容特殊、比较简短的全文。

  16. 情报检索基础(第二章 情报源与工具书) 2.1 2.2 情报源 • 情报源分为:文献情报源与非文献情报源(电视、广播、交往、实物展览等信息) • 文献情报源又分为:印刷型文献情报源和非印刷型文献情报源(缩微型、机读型、视听型) • 印刷型文献情报源的类型又称文献类型有10种,也可分为3种(图书、期刊和特种文献:会议文献、科技报告、专利文献、技术标准、政府出版物、学位论文、产品样本、技术档案P11)除此之外还有报纸、新闻稿等。 16

  17. 情报检索基础(情报源的整序(2.3)与整序后形成工具书 (2.4)示意图) 检索工具 目录 题录 文摘 索引 文献篇名 全文 全文数据库 外部特征 整序方法(即编排方法) 作者姓名(含团体作者) 等等 定义P17查找文献线索的工具 情报源 工具书 工具类数据库 分类—(表) P15 P26 内部特征 百科 全书 词典 年鉴 手册 名录 规范化处理 定义P16 主题—(词表)P15 参考工具 时序、地序法 定义P21查找数据和事实情报的工具 用户 无序流 情报服务机构 有序流 17

  18. 附加内容:文献著录 • 著录(Description)就是编制文献目录等二次文献时,对文献内容和形式特征进行分析、选择和记录的过程。它将有关某一文献的基本信息摘录下来,供人们间接地了解、识别该文献。 • 下面,我们分别对不同文献情报源的著录特征及其识别方法进行讲述。

  19. 图书: • 图书的著录项目包括书名、著者,出版项(出版地、出版社、出版年)、总页码等。

  20. 目录

  21. 图书的识别主要依据出版项(出版地、出版社、出版年)、ISBN(10位)、总页码(PP or P)等著录项。

  22. ISBN是国际标准书号,International Standard Book Number的缩写,是世界各国广泛使用的书号编码系统。一个ISBN是由10位阿拉伯数字组成,并用连字符分隔为四部分:第一部分表示组号,也叫地域编号,是指国家、地理、语言等地域信息;第二部分是出版社编号;前两部分合称“出版者前缀”;第三部分为书名编号,即该出版社出版的图书种数的流水号;第四部分为校验码。前三部分的数位都是可变的,但其位数之和始终为9位。

  23. 例:ISBN 7➀-5383➁-0276➂-0➃/TP·99➄ • ➀是地域号(国家、地区、语言区)。其中7代表中国,0和1表示英语区、2是法语区、3是德语区、4是日语区、5是俄语区、88是意大利语区、9971是新加坡语区 • ➁是出版社号;➂是该出版社出版的图书种数的流水号 • ➃是计算机检验位;➄是我国出版的图书在ISBN后加的一个中图法的大类类号。

  24. 作用:具有可识别可检验的功能。用加权因数10-2分别与ISBN的1-9位数对应相乘,将乘积与校验数值相加,再以模数“11”相除,如被整除就是正确的编号,否则为错误编号。如:ISBN 7 5 3 8 3 0 2 7 6 0加权10 9 8 7 6 5 4 3 2乘积70+ 45+24+56+18+0+8+21+12+0 总和264/11=24(被整除)

  25. 期刊 • 期刊的著录:刊名(一般用缩写)、出版年月、卷、期、起止页码等。

  26. 文摘

  27. 文摘 • Aesthetics in mast and tower design(1),The very rapidly in the need for……(2) • Fuchs,M.B.(3) (Tel Aviv Univ, Ramat Aviv, Isr)(4), Comput. Struct.(5) v73n4,2001,p1-5(6) • 说明: (1)文献篇名;(2)文摘内容;(3)著者姓名;(4)著者工作单位或通讯地址;(5)刊名缩写;(6)出版卷、期、年份、页码。 • 本条摘自EI

  28. 期刊的识别: • (1)卷号或期号(vol. no or v. n); • (2)刊名缩写(如PE&RS); • (3)ISSN号(8位)

  29. 科技报告 • 著录:篇名;著者和著者工作单位;报告号;出版年月 • 识别:根据报告号 • a、一般有report; b、有时候有PR(progress report)进展报告、AR(annual report)年度报告、FR(final report)年终报告、CR(contract report)合同报告、TR(technical report)技术报告

  30. 摘 • 000,050 ③ PC A04 / MF A01④ PB 90-10490 /GAR(1) • International Potato Center, Lima(Peru)(2) Traditional Potato Storage in peru: Farmers’Knowledge and Practices. Potatoes in food systems research series(3) R. Rhoades, M. Benavides, J. Rechate, E.(4) 1988,629(5).REPT–4, AID–PN–ABC–429(6) Sponsored by Agency for International Development, Washington DC, Office of Agriculture.(7) In the last decade, the importance of reducing food……(8) • 说明:(1)NTIS登记号;(2)团体或报告完成机构名称;(3)报告篇名;(4)个人著者;(5)完成日期、报告页数;(6)原报告号;团体著者或资助招标机构所编代号;(7)资助机构名;(8)文摘。 • 本条摘自美国《政府报告通告与索引》(Govern ment Reports Announce ments and Inder简称GRA&I)

  31. 会议文献 • 著录:论文名称、著者和著者工作单位;会议录名称、会议地点、会议时间;会议录出版情况,论文页码。 • 识别:会议录名称、会议地点、会议时间、会议届次。 会议录名称常含有:congress(会议)、convention(大会)、symposium(专题讨论会)、workshop(专题学术讨论会)、seminar(学术研讨会)、conference(学术讨论会)colloquium(学术讨论会)、proceedings(会议录)

  32. 文摘

  33. 文摘 • Performance analysis of third-order nonlinear wiener adaptive • Systems(1). Shue-Lee Chang • (2)(Dept. of Electr.Eng.,Santa Univ.,CA.USA)(3) • 2002 IEEE International Symposium on Circuits and Systems(4). • Proceedings,Phoenix-Scottsdale,AZ,USA,26-29 May 2002(5),P.II-197-200(6) vol.2(7) • This paper presents a detailed performance analysis of third-order……(8) (16 refs)(9) • 说明:(1)论文题目;(2)著者姓名;(3)著者工作单位或通讯地址;(4)会议录名称;(5)会议召开的地点和时间;(6)论文在会议录中的页码;(7)卷号;(8)文摘内容;(9)参考文献条数。 • 本条摘自SA

  34. 专利文献 • 著录:专利题目;著者;受让人或单位以及专利发表时间;专利国别及专利号 • 识别:有patent;专利国别及专利号。专利国别代码是由国际标准化组织(ISO)规定的,专利文献由各国专利局出版发行,因此,无出版地、出版社等项目。

  35. 文摘

  36. 文摘 • Wastewater treatment process.(1)Reyna,C. (2)(New Working Waters, Llc,USA)(3)U.S Us6319412(4)(Cl.210-666;(5)Co2Fq/00(6)),20 Nov 2001,(7)US Appl. 955182,(8) 21 Oct 1997(9);6pp (10) ,(Eng)(11) ,This invention relates to wastewater treatment……(12) • 说明:(1)专利标题;(2)发明人姓名;(3)专利权所有者;(4)专利国别代号和专利号;(5)美国专利分类号;(6)国际专利分类号;(7)专利公布日期;(8)专利申请号;(9)专利申请日期;(10)专利总页数;(11)文种;(12)文摘内容。 • 本条摘自CA

  37. 标准文献 • 著录:标准制定单位;标准题目;表示标准的词,如standard,recommendation等;标准号。标准号由标准颁布机构代码、顺序号和颁布年份三部分组成。如ANSI TI-601-1988 • 识别:标准号

  38. 文摘

  39. 学位论文 • 著录:论文名称;著者;学位;授予学位的大学名称;时间、论文页码;导师或答辩委员会顾问的姓名。 • 识别方法:学位名称、大学名称。如“dissertation”、”thesis”。例子中的“Ph.D.”博士学位的简称。

  40. 文摘

  41. 文摘 • INVERTIBLE FUNCTIONS(1) order No DA8528622(2) • ALLENDER,ERIC WARREN ,Ph,D(3) • Georgia Institute of Technology,1985(4) • 107PP(5) chair man: K. N. King(6) • This Thesis explores the question of how hard a(7) • 说明:(1)论文题目 ;(2)订购论文的订购号;(3)论文作者和学位类别;(4)授予学位单位和时间;(5)论文页数;(6)学位论文指导教师;(7)文摘。 • 本条摘自《国际学位论文文摘》(Dissertation Abstracts International(简称DAI)

  42. 情报检索基础(第三章 检索语言) • 一、检索语言概述 • 语言是一种人们用以交流沟通的重要工具。人与计算机对话,需要有计算机语言,人与检索系统对话来实施检索,则需要有检索语言(retrieval language)。 • 检索语言是用于描述检索系统中信息的内部及外部特征和表达用户信息提问的一种专门语言,检索的匹配正是通过语言的比较匹配来实现的。检索语言也称索引语言,后者是从检索系统的标引角度出发的,而前者是从用户的信息检索角度出发的。

  43. 也可以说,所谓的检索语言就是组织文献与检索文献时所使用的语言,也就是说,文献存储时,文献的内容特征(如分类、主题等)和外表特征(如书名、刊名、著者等)按照一定的语言来加以描述,检索文献时的提问也按照一定的语言来加以表达,这种在文献的存储和检索过程中,共同使用、共同理解的语言就是检索语言。也可以说,所谓的检索语言就是组织文献与检索文献时所使用的语言,也就是说,文献存储时,文献的内容特征(如分类、主题等)和外表特征(如书名、刊名、著者等)按照一定的语言来加以描述,检索文献时的提问也按照一定的语言来加以表达,这种在文献的存储和检索过程中,共同使用、共同理解的语言就是检索语言。 检索语言是由符号、代码或科技词语组成的。其中符号、代码是按照学科门类严格编制的,科技词语是经过优选的和规范化的。

  44. 二、检索语言与编排方法关联图 检索工具 目录 题录 文摘 索引 文献篇名 全文 全文数据库 外部特征精确 整序方法(即编排方法) 作者姓名(含团体作者) 等等 定义P17 工具书 工具类数据库 情报源 分类—(表P26) 即分类语言族性 内部特征模糊 百科 全书 词典 年鉴 手册 名录 规范化处理 定义P16 主题—(词表) 即主题语言特性 参考工具 时序、地序法 定义P21 用户 无序流 情报服务机构 有序流 44

  45. 体系分类语言 三、检索语言种类 分类语言 组配分类语言 描述文献 内容特征 的语言 混合分类语言 关键词语言 标题词语言 主题语言 叙词语言 检索 语言 单元词语言 题名(书名、刊名、篇名) 描述文献 外表特征 的语言 著者 出版事项 代码/序号

  46. 四、检索语言的桥梁作用 检索工具 匹配 检索式 提问 标 识 语 言 信息 的选 择与 收集 信 息 源 信息 特征 检 索 结 果 数据库 信 息 需 求 用 户 检索 提问 检索 提问式

  47. 情报检索基础(第四章检索程序与检索效率)一、检索程序情报检索基础(第四章检索程序与检索效率)一、检索程序 课题 分析研究课题 制定检索策略 选择检索工具 确定检索途径 调整检索策略 结果评价 检索 获取原始文献 选定检索方法

  48. 1.分析研究课题 • 在查找文献信息之前,必须对检索课题进行分析研究。目的是了解课题的学科和专业范围,弄清检索的真正意图及实质。这是制定检索策略的根本出发点,也是检索效率高低和成败的关键。具体需要明确的问题有:专业范围、时间范围、地理范围、语种范围、文献类型。

  49. 制定检索策略 • 检索策略是指为实现检索目标而制定的检索方案或对策,也就是将课题的提问及其检索词与检索工具的收录内容、编排特点相匹配而确定的检索方案或程序。制定检索策略的主要内容是,在分析课题的基础上,确定要利用那些检索工具,确定查找年限和专业范围的选择,确定检索用词并判明各检索词之间的逻辑关系与查找步骤。

  50. 2.选择检索工具(或数据库) • 根据检索课题的主题及专业范围选择质量较高、检索手段比较完善的检索工具。这就必须了解和掌握各种检索工具的适用范围、收录特点。

More Related