980 likes | 1.15k Views
科技文献检索. 第一节 情报检索与文献检索. 一、 信息、知识、情报与文献的定义 我们所处的时代是一个前所未有的层次上不断产生、传递和利用信息情报的时代。因此,有人称我们的时代为信息时代。那么,究竟什么是信息、什么是情报,它们与本课程大量讨论的文献有着什么关系,这是我们首先需要了解的问题。. 1. 信息的定义
E N D
第一节 情报检索与文献检索 一、信息、知识、情报与文献的定义 我们所处的时代是一个前所未有的层次上不断产生、传递和利用信息情报的时代。因此,有人称我们的时代为信息时代。那么,究竟什么是信息、什么是情报,它们与本课程大量讨论的文献有着什么关系,这是我们首先需要了解的问题。
1.信息的定义 信息是一种十分广泛的概念,它在自然界人类社会以及人类思维活动中普遍存在。不同事物有着不同的特征。这些特征通过一定的物质形式(如声波、电磁波、图象等)给人带来某种信息。例如,人的大脑通过感觉器官所接收到的有关外界及其变化的消息,就是一种信息。因此,信息可以定义为:生物以及具有自动控制功能的系统,通过感觉器官和相应的设备与外界进行交换的一切内容。
2.知识的定义 • 知识是人类社会实践经验的总结,是人的主观世界对于客观世界的概括和如实反映。知识是人类通过信息对自然界、人类社会以及思维方式与运动规律的认识,是人的大脑通过思维重新组合的系统化的信息的集合。因此,人类不仅要通过信息感知世界、认识和改造世界,而且要根据所获得的信息组成知识。可见,知识是信息的一部分。
3.情报的定义 • 关于情报的定义,国内外学术界还没有定论的说法。但如果要找以下共同的认识,情报是指传递着的有特定效用知识。知识性、传递性和效用性是情报的三个基本属性。
1)情报的知识性 • 人们在生产和生活活动中,通过各种媒介手段(书刊、广播、会议、参观等),随时都在接收、传递和利用大量的感性和理性知识。这些知识中就包含着人们所需要的情报。情报的本质是知识,可以说,没有一定的知识内容,就不能成为情报。
2)情报的传递性 • 情报的传递性是说知识要变成情报,还必须经过运动。钱学森说情报是激活的知识,也是指情报的传递性。人的脑海中或任何文献上无论贮存或记载着多少丰富的知识,如果不进行传递交流,人们无法知道其是否存在,就不能成为情报。情报的传递性表明情报必须借助一定的物质形式才能传递和被利用。这种物质形式可以是声波、电波、印刷物或其它,其中最主要的是以印刷物等形式出现的文献。
3)情报的效用性 • 运动着的知识也不都是情报,只有那些能满足特定要求的运动的知识才可称之为情报。例如,每天通过广播传递的大量信息,是典型的运动的知识。但对大多数人来说,这些广播内容只是消息,而只有少数人利用广播的内容增加了知识或解决了问题。这部分人可将其称之为情报。
4.文献的定义 • 文献是用文字、图形、符号、声频、视频等技术手段记录人类知识的一种载体。文献不仅包括各种图书和期刊,而且包括下节介绍的会议文献、科技报告、专利文献、学位论文、科技档案等各种类型的出版物,甚至包括用声音、图象以及其他手段记录知识的全部现代出版物。 • 由上述可见,情报是知识中的一部分,文献是情报的一种载体。文献不仅是情报传递的主要物质形式,也是吸收利用情报的主要手段。
二、文献的级别、出版类型及其识别 • 现代文献依照载体形式、加工程度和出版类型可以区分出以下一些类型: • 文献的载体类型 • 文献的级别 • 文献的出版类型及著录特征识别
1.文献的载体类型 1)印刷型Printed form :通过铅印、油印和胶印等手段,将知识固化在纸张上的一类文献。例如,图书、期刊以及各种印刷资料。这是一种有着悠久历史的传统文献形式,至今仍广为应用。它的主要优点是便于阅读和流传,缺点是体积大,信息密度低。
2)缩微型Microform Microfilmmicrofiche :以印刷型文献为母本,采用光学摄影技术,把文献的影象固化在感光材料上的一类文献。常见的缩微型文献有缩微平片和缩微胶卷两种。这种文献的优点是体积小,信息密度高,缺点是阅读必须借助阅读机或利用缩微复印机。
3)声像型(视听型)Audio-Visual form Compact audio/video form :这是一种非文字形式的文献。常见的有各种视听资料,如唱片、录音带、电影胶片、激光声视盘(CD-ROM)、幻灯片等。着类文献记录声音和图象,通过唱机、录音机、录象机、放影机和投影机等予以重现,可以使人闻其声、观其形。
4)机读型Machine Readable form Electronic Publication :这是近年来由于计算机的广泛应用而产生的一种新文献。常见的是各种已录有内容的磁带、磁盘和光盘。这种文献的存贮、阅读和查找利用都须通过计算机才能进行,所以既有信息量大、查找迅速的优点,又有设备昂贵、使用费用高的缺点。 近年出现的多媒体(multimedium)是一种崭新的文献载体。它将声音、图象、文字、数据录入光盘,通过计算机实现重放或检索,因此具有前几种文献载体的优点,发展特别迅速。
2.文献的级别 依内容性质和加工程度的不同,文献可分为以上四个级别: 1)零次文献primary Literature/ info :未经出版发行的文献,包括手稿、个人通信、原始记录等。
2)一次文献secondary literature /info :首次出版的各种文献,也称原始文献。如期刊论文、科技报告、会议论文、专利说明书等。一次文献是以科研生产活动的第一手成果为依据而创作的文献,内容丰富,参考价值大,是我们利用的主要对象。 Journal literature, Sci-Tech report, Proceedings Patent specification, Paper, Thesis, Dissertation,
3)二次文献Tertiary literature/ info :报道和查找一次文献的检索书刊,如各种目录、题录和文摘等。二次文献是图书情报工作者在大量收集原始文献的基础上,经过分析、归纳、重组后出版的。二次文献是一次文献的集约化、有序化的再次出版,是贮藏、利用一次文献的主要的、科学的途径。 条目:entry reference citation record 文摘Abstract 索引Index 目录Catalog 题录Bibliography
4)三次文献:利用二次文献提供的线索,选用大量一次文献的内容,经综合、分析和评述再度出版的文献,如各种述评、进展报告、动态综述、手册、年鉴和百科全书等。我们使用的各种教科书也属三次文献。4)三次文献:利用二次文献提供的线索,选用大量一次文献的内容,经综合、分析和评述再度出版的文献,如各种述评、进展报告、动态综述、手册、年鉴和百科全书等。我们使用的各种教科书也属三次文献。 • Reference book,
上述的零次文献由于没有进入出版、发行和流通这些渠道,收集利用十分困难,一般不能作为我们利用的文献类型。而后三种文献是一个从分散的原始文献到系统化、密集化的过程。一般说,一次文献是基础,是检索利用的对象;二次文献是检索一次文献的工具,故又称之为检索工具;三次文献是一次文献内容的高度浓缩,也是我们利用的一种重要情报源。上述的零次文献由于没有进入出版、发行和流通这些渠道,收集利用十分困难,一般不能作为我们利用的文献类型。而后三种文献是一个从分散的原始文献到系统化、密集化的过程。一般说,一次文献是基础,是检索利用的对象;二次文献是检索一次文献的工具,故又称之为检索工具;三次文献是一次文献内容的高度浓缩,也是我们利用的一种重要情报源。
3.文献的出版类型及著录特征识别 文献的出版类型一般分为十大类。它们的定义、作用及在参考文献和检索刊物中的著录特征分别为:
1)图书:论述或介绍某一领域知识的出版物。图书又可分为三类:一类是教科书、科普读物和一般生产技术图书,属阅读性的图书;一类是辞典、手册和百科全书等,属工具性的图书;另一类是含有独创性内容的专著,它属原始文献。图书往往是著者在收集大量第一手资料基础上,经分析归纳后编写而成的。其特点是内容比较系统、全面、成熟、可靠,但出版周期较长,报道速度相对较慢。图书主要用于需对大范围的问题获得一般性的知识或对陌生的问题需要初步了解的场合。1)图书:论述或介绍某一领域知识的出版物。图书又可分为三类:一类是教科书、科普读物和一般生产技术图书,属阅读性的图书;一类是辞典、手册和百科全书等,属工具性的图书;另一类是含有独创性内容的专著,它属原始文献。图书往往是著者在收集大量第一手资料基础上,经分析归纳后编写而成的。其特点是内容比较系统、全面、成熟、可靠,但出版周期较长,报道速度相对较慢。图书主要用于需对大范围的问题获得一般性的知识或对陌生的问题需要初步了解的场合。
图书在各种论文末的参考文献或题录性检索工具中通常著录成如下例所示的格式:图书在各种论文末的参考文献或题录性检索工具中通常著录成如下例所示的格式: W.V.Etten,Foundamentals of optical fiber communication,London:Prentice--Hall(1991),xii+407pp 图书的著录特点是:有书名,有著者,有的还有编者;必有出版地、出版社名和出版年份;非第一版的图书有版次;有的图书还给出国际标准书号(ISBN)。这四点中第2点较重要。 图书主要在各类图书馆中查阅。
2)期刊:期刊一般是指名称固定、开本一致的定期或不定期连续出版物。期刊论文内容新颖,报道速度快,信息含量大,是传递科技情报、交流学术思想最基本的文献形式。据估计,期刊情报约占整个情报源的60-70%,因此,受到科技工作者的高度重视。大多数检索工具也以期刊论文作为报道的主要对象。对某一问题需要深入了解时,较普遍的办法是查阅期刊论文。
期刊论文的著录格式如下例所示: H.Tohyama,A plasma Image bar for an electrophoto--graphic printer,Journal of the Imaging Science,Vol.35 NO.5,330-3(Sept-Oct 1991) 期刊论文著录的特点是:有作者,有时有篇名;期刊名称常常缩写,有的还以斜体给出;必定有卷号,有的有期号。这三点中第3点较为重要。 各种期刊既可在图书馆,也可在情报所查阅。
3)会议文献:这是指在国际或国内重要的学术或专业性会议上发表的论文。会议文献学术性强,往往代表着某一领域内的最新成就,反映了国内外科技发展水平和趋势,是获得最新情报的一个重要来源。会议文献可分为会前文献,如会议日程预报和会议论文预印本,以及会后文献,如各种会议录。会后文献是主要的会议文献。 • Conference paper: • Proceedings, compilation, collected paper, records Meeting: workshop, seminar, colloquium, symposium, conference,
会议文献常见的著录形式如下例所示: T.Sellis:“Performance of DBMS implementation of production systems”,Proceedings of the 2nd International IEEE Conference onTools for Artificial Intellegence Herndon,VA USA,6-9 Nov.1990,(Alamitors,CA,USA:IEEE Computer Society Press 1990),393-9 会议文献著录的特点是:有表示会议的专门用词,如Conference,Symposium,Convention,Workshop,Meeting,Congress,Assembly等;有表示会议录的一些词,如Proceedings of...,Collection of...;有的有会议召开的地点、届次、时间,以及会议录的出版社、出版地、出版时间等。这三点中第1点最为重要。 会议文献可在图书馆和情报所等处查阅。
4)科技报告:科技报告是指国家政府部门或科研生产单位关于某项研究成果的总结报告,或是研究过程中的阶段进展报告。报告的出版特点是各篇单独成册,统一编号,由主管机构连续出版。在内容方面,报告比期刊论文等专深、详尽、可靠,是一种不可多得的情报源。科技报告可分成技术报告(Technical reports)、技术备忘录(Technical memorandums)、札记(Notes)、通报(Bulletins)和其他(如译文、专利等)几种类型。有些报告因涉及尖端技术或国防问题等,所以又分绝密、秘密、内部限制发行和公开发行几个等级。目前国际上较著名的科技报告是美国政府的四大报告,即PB(Publishing Board)报告、AD(ASTIA Documents)报告、 NASA(National Aeronatics and Space Administration)报告和DOE(Department of Energy)报告。
科技报告常见的著录格式如下例所示: J.S.Bymes,“Application of approximation theory in antenna design,signal processing and filtering”,Final report.AD-A244,725 Promethesus,Inc.,Sharon,MA.1991 科技报告著录的特点是:有表示报告的词,如Report,Memorandum等;有报告号,如本例中的AD-A233725。这两点中第2点较重要。 科技报告主要在情报所或收藏科技报告的院校、研究所图书馆查阅。
5)专利文献:专利文献主要由专利说明书构成。所谓专利说明书是指专利申请人向专利局递交的有关发明目的、构成和效果的技术文件。它经专利局审核后,向全世界出版发行。专利说明书的内容比较具体,有的还有附图,通过它可以了解该项专利的主要技术内容。由于只有符合新颖性、创造性和实用性的发明创造才能获得专利权,所以专利说明书对于工程技术人员,特别是产品工艺设计人员来说,是一种切合实际、启迪思维的重要情报源。
专利说明书常见的著录形式如下例所示: B.D.Dayton,“Differential amplifier apparatus”,US Patent No.5095282,1992 专利说明书著录的特点是:通常有表示专利的词(Patent);有专利号。专利号按国际规定由两个字母表示的国家名称和其后的顺序号构成。这两点中后一点较重要。 专利说明书应在国家专利局或收藏专利文献的情报所查阅。
6)标准文献:指标准化工作的文件。其中主要为工业产品和工程建设的质量、规格和检验方法等的技术规定文件。作为一种规章性文献,它具有一定的法律约束力。一个国家的标准文献反映着该国的生产工艺水平和技术经济政策,而国际现行标准则代表了当前世界水平。国际标准和工业先进国家的标准常是科研生产活动的重要依据和情报来源。国际上最重要的两个标准化组织是国际标准化组织(ISO)和国际电工委员会(IEC)。
标准文献的常见著录形式如下例所示: BSI,“Specification for communication and interference limits and measurements”,BS 6839-1987 标准文献著录的特点是:通常有表示标准的词如standard,recommendation等;有标准号。标准号每个标准一个号,并按惯例由标准颁布机构代码,顺序号和颁布年份三部分构成,如本例的“BS6839--1987”。 标准文献可在国家标准文献馆、各地的标准研究所、技术监督所或情报研究所查阅
7)学位论文:学位论文是指为申请硕士、博士等学位而提交的学术论文。学位论文的质量参差不齐,但都是就某一专题进行研究而作的总结,多数有一定的独创性。学位论文是非卖品,除极少数以科技报告、期刊论文的形式发表外,一般不出版,属难得文献。7)学位论文:学位论文是指为申请硕士、博士等学位而提交的学术论文。学位论文的质量参差不齐,但都是就某一专题进行研究而作的总结,多数有一定的独创性。学位论文是非卖品,除极少数以科技报告、期刊论文的形式发表外,一般不出版,属难得文献。 学位论文常见的著录形式如下例所示: T.W.Lin,“Design of time-signal spectrum analyzers”,Ph.D dissertation,The Pennsylvania State Univ.,1987 学位论文著录的特点是:通常有表示学位论文的词,如Thesis,Dissertation等;有的有论文作者所在学校的校名。
8)产品技术资料:指产品目录、产品样本和产品说明书一类的厂商产品宣传和使用资料。产品样本通常对定型产品的性能、构造、用途、用法和操作规程等作具体说明,内容成熟,数据可靠,有的有外观照片和结构图,可直接用于产品的设计制造中参考。
产品技术资料的常见著录形式如下例所示: Integrated circuits Book IC11-Linear Products,1988,Philips Data handbook of Philips Electronic Components and Materials Division,p.3-131. 产品技术资料著录的特点是:通常有表示产品样本一类资料的词,如Catalog,Guide book,Master of,Databook of等;有公司名称。 产品技术资料一般向厂商直接索取,在情报所可以查到一部分,有些以汇编形式正式出版的可以在图书馆查到。
9)技术档案:指科研生产活动中形成的,有具体事物的技术文件、图纸、图表、照片和原始记录等。详细内容包括任务书、协议书、技术指标、审批文件、研究计划、方案大纲、技术措施、调查材料、设计资料、试验和工艺记录等。这些材料是科研工作中用以积累经验、吸取教训的重要文献。技术档案一般为内部使用,不公开出版发行,有些有密级限制,因此在参考文献和检索工具中极少引用。
10)政府出版物:指各国政府部门及其设立的专门机构发表的文献。政府出版物的内容十分广泛,既有科学技术方面的,也有社会经济方面的。就文献的性质而言,政府出版物可分为行政性文件(如国会记录、政府法令、方针政策、规章制度以及调查统计资料等)和科学技术文献两部分。我国政府发表的“科学技术白皮书”就是一种科技类政府出版物。
上述各种文献类型在出版时间上是有先后的。 如果某作者完成了一篇手稿,他希望以最快的形式发表,那么除了学位论文以外,会议、报告和专利是最理想的选择。但这三种形式都要求论文满足一定的特殊要求,而期刊则没有这些要求,且品种多,容量大,速度也很快,从而成为多数论文的发表渠道。目录、题录和文摘,略后于专利、报告、会议和期刊,取原始文献的主要内容作客观报道。而综述、图书和百科全书则需取大量原始文献的精华,或作评论,或汇编成册,所需时间更长。至此,从出版形式上说的文献周期就大致完成了。这种文献周期又称之为文献链。
三、情报检索 “情报检索”(Information Retrieval)是指将情报(信息)按一定方式组织和存贮起来,并针对用户的需求找出所需要的情报(信息)的过程。它又称为“情报存贮与检索”(Information Storage and Rrtrieval)。对于情报用户来说,情报检索仅指过程的后一部分,即情报(信息)的查找过程(Information Retrieval)。情报检索的目的是为了解决特定的情报需求和满足情报用户的需要。它根据检索(查找)对象的不同,又可以分为文献检索、事实检索和数据检索。
情报检索模型即是“匹配”模型。由文献特征构成的文献检索标志被认为完全反映了文献内容,而由提问特征构成的检索提问则反映了情报用户需求,因此二者的匹配程度就是文献的相关程度,相关文献就是在某种程度上匹配的文献。情报检索模型即是“匹配”模型。由文献特征构成的文献检索标志被认为完全反映了文献内容,而由提问特征构成的检索提问则反映了情报用户需求,因此二者的匹配程度就是文献的相关程度,相关文献就是在某种程度上匹配的文献。
四、文献检索、数据检索和事实检索 文献检索(Document Retrieval)是以文献为检索对象,从已存贮的文献库中查找出特定文献的过程。例如“关于自动控制系统有些什么参考文献?”这就需要我们根据课题要求,按照一定的检索标识(如主题词、分类号等),从所收藏的文献中查出所需要的文献。
数据检索(Data Retrieval)是以数据为检索对象,从已收藏数据资料中查找出特定数据的过程。例如,查喜马拉雅山有多高,杭州六和塔建于何年等。
事实检索(Fact Retrieval)即通过对存贮的文献中已有的基本事实,或对数据进行处理(逻辑推理)后得出新的(即未直接存入或所藏文献中没有的)事实过程。例如:本学年成绩优秀的学生有多少,某同类产品中,那种牌号的销量最大。
数据和事实检索是要检索出包含在文献中的具体情报;文献检索则是要检索出包含所需要情报的文献。文献检索的结果是与某一课题有关的若干篇论文,书刊的来源出处以及收藏地点等。文献检索是最典型和最重要也是最常利用的情报检索。掌握了文献检索的方法就能以最快的速度、在最短的时间内,以最少的精力了解前人和别人取得的经验和成果。数据和事实检索是要检索出包含在文献中的具体情报;文献检索则是要检索出包含所需要情报的文献。文献检索的结果是与某一课题有关的若干篇论文,书刊的来源出处以及收藏地点等。文献检索是最典型和最重要也是最常利用的情报检索。掌握了文献检索的方法就能以最快的速度、在最短的时间内,以最少的精力了解前人和别人取得的经验和成果。
第二节 事实和数据检索的信息源 一、参考工具书 1.参考工具书的主要类型 参考工具书的主要类型有:字(词)典、辞典、手册、年鉴、百科全书、机构名录、人名录、公式与数表、图册(集)、产品目录、产品样本和产品说明书等。 2.参考工具书内容的排检方法 参考工具书内容的排检方法主要有:字(音)顺法、分类法、主题法、地序法和时序法等等。
字(音)顺法。字顺法是以字或词的笔划多少,或读音的字母顺序编排的方法。此法主要用于字(词)典、辞典的排检,还用于各类工具书所附索引或目录的排检,如手册、百科全书等类工具书所附词条术语或所附中英文索引的排检。字(音)顺法。字顺法是以字或词的笔划多少,或读音的字母顺序编排的方法。此法主要用于字(词)典、辞典的排检,还用于各类工具书所附索引或目录的排检,如手册、百科全书等类工具书所附词条术语或所附中英文索引的排检。
分类法。分类法分成体系分类法和功能分类法。体系分类法实际上是按学科分类的方法,大多数参考工具书都按这一方法排检。如手册、百科全书、年鉴、产品资料、名录等。功能分类就是按收录的内容功能不同分类。大多数的电子元器件及其产品特性手册、电气电子类产品目录或电气电子类的其他各种手册,都是按功能分类的。分类法。分类法分成体系分类法和功能分类法。体系分类法实际上是按学科分类的方法,大多数参考工具书都按这一方法排检。如手册、百科全书、年鉴、产品资料、名录等。功能分类就是按收录的内容功能不同分类。大多数的电子元器件及其产品特性手册、电气电子类产品目录或电气电子类的其他各种手册,都是按功能分类的。
主题法。所谓主题法,就是按主题词的字顺编排的方法。如一些学科性术语词条解释等,是按学科的主题词字顺排检的。但主题法一般较少用作正文内容的排检,而主要用于各种工具书索引的排检,作为一个附助性的工具。主题法。所谓主题法,就是按主题词的字顺编排的方法。如一些学科性术语词条解释等,是按学科的主题词字顺排检的。但主题法一般较少用作正文内容的排检,而主要用于各种工具书索引的排检,作为一个附助性的工具。 地序法。地序法是地理、地域编排的方法,如洲、国家、地区、省、市、县等。象地名录、机构名录类工具书,许多是按地序排检的,也有一些年鉴、人名录或产品目录按地序排检。
时序法。时序法即是按时间顺序编排的方法。统计资料、年鉴等类工具书都有这种排检方法。时序法。时序法即是按时间顺序编排的方法。统计资料、年鉴等类工具书都有这种排检方法。 一般而言,许多工具书都有两种或两种以上的排检方法。如先按学科或专业分类,然后在各自类目下再按字顺或其他排检法排检。手册、百科全书、年鉴、名录、产品目录等一般都有两种或两种以上的排检方法。
3.参考工具书的内容特征 手册。手册也有叫“指南”、“便览”、“须知”、“大全”;英文手册则有“Handbook”和“Manuals”两类。按收录内容分,手册有综合性和专科性之分。 手册属于简便的参考资料,它是围绕某一课题或学科的各种事实和数据、统计数字、规则、技术参数、图表、符号公式、原理方法等各类资料汇集成册的出版物。综合性手册概括了各学科的内容,知识面广泛、全面、系统,但浅显简要。专科(业)性手册内容只涉及某学科的专业知识,概括了某学科的基本知识,如专业的发展史、基本概念、基础理论、原理叙述、结构特点、物理化学性能、物质特征、方法、材料、元器件、辅助设备、公式数据、图表、规格、规则、检验测试、使用方法,以及设计、维修、安装、符号与代码说明等。