840 likes | 1.2k Views
信息检索与利用. 图书馆信息部. 贾芳华. TEL : 85071729 QQ : 149552480 EMAIL : fhwaj@163.com. Papers , printing born digital , e-publish , e-only e-reading , e-learning , net surf. 不知道有哪些可以利用的信息资源; 不知道从哪里可以获取和利用信息资源; 不知道如何去获取和利用信息资源; 获取的信息资源总是不符合自己的需求; 信息爆炸,不知道怎么筛选有价值的信息资源; ……. 图书馆借阅. 传统模式.
E N D
信息检索与利用 图书馆信息部 贾芳华 TEL:85071729 QQ:149552480 EMAIL:fhwaj@163.com
Papers,printing born digital,e-publish,e-only e-reading,e-learning,net surf
不知道有哪些可以利用的信息资源; • 不知道从哪里可以获取和利用信息资源; • 不知道如何去获取和利用信息资源; • 获取的信息资源总是不符合自己的需求; • 信息爆炸,不知道怎么筛选有价值的信息资源; • ……
图书馆借阅 传统模式 网上直接下载 网络模式 网上全文传递 资源获取途径
图书、工具书 各种综合、专业数据库 论文(期刊论文、会议论文、学位论文) 专业信息服务机构 大众传媒(广播、电视、报纸) 互联网(门户网站、专业网站、搜索引擎) 信 息 检 索 信息资源获取渠道多种多样 有效的信息检索是提高学习与研究效率的捷径
检索课是知识时代培养学生终身所需的信息意识与获取文献信息能力的重要课程,是一门科学方法课。对学生不断吸取新知识,改善知识结构,有着重要的意义。检索课是知识时代培养学生终身所需的信息意识与获取文献信息能力的重要课程,是一门科学方法课。对学生不断吸取新知识,改善知识结构,有着重要的意义。
检索课的意义 • 继承和借鉴前人成果,避免重复研究 • 掌握信息检索技术,节省信息搜索的时间 • 信息检索是科研活动的重要组成部分 • 科研选题、立项、结题 检索在科研中所占比例
本课程教学内容与要求 • 课程重点要求: • 了解图书馆现有电子资源(各类数据库收录范围和类型) • 信息检索基础:信息源、检索工具类型、机检基础 • 典型数据库系统的使用方法 • 网上免费资源的获取等 • 文献信息与学术论文写作
通过本课程的学习,希望学生能够掌握信息检索的基础知识、基本原理和基本技能,较为熟练地利用图书馆各种网络学术数据库来检索、获取学习中所需的文献信息;掌握一定的文献阅读、整理和分析研究的基本方法和技能,具备初步的科学研究方法与研究论文的写作能力。通过本课程的学习,希望学生能够掌握信息检索的基础知识、基本原理和基本技能,较为熟练地利用图书馆各种网络学术数据库来检索、获取学习中所需的文献信息;掌握一定的文献阅读、整理和分析研究的基本方法和技能,具备初步的科学研究方法与研究论文的写作能力。
第一章 信息检索基础 • 第一节 信息概述 • 第二节 信息源简介 • 第三节 信息检索的基本原理 • 第四节 检索系统概述
第一节 信息概述 • 美国哈佛大学的研究小组提出了著名的资源三角形:没有物质,什么也不存在;没有能量,什么也不会发生;没有信息,任何事物都没有意义。 • 物质、能量、信息共同构成现实世界的三大要素。
一、信息的概念 1、控制论创始人N·维纳(N·Veinner)在《控制论和社会》一书中定义为:“信息就是信息,既不是物质,也不是能量,信息是我们在适应外部世界并使这种适应为外部世界所感到的过程中,同外部世界进行交换的内容的全称。” 2、信息论创始人C·E·申农(又译为香农) ( C·E·shanon) 在《通讯的数学理论》认为:“信息是能够用来消除不确定性的东西。” 3、原国际文献联合会副主席,前苏联信息学家A.И.米哈依洛夫认为:“信息——作为存贮、传递和转换的对象的知识。” 4、英国信息学家B.C.Brookes的定义则认为:“信息是使人原有的知识结构发生变化的那一小部分知识。”并采用公式描述: K(S)+△I=K(S+△S) 其中 K(S)——原有知识结构(knowledge structure) K(S+△S)——改变后的知识结构(changed knowledge structure) △I——信息增量(information addition)
这些定义从不同的角度阐明了信息的概念,不管是从通讯的角度、从知识的角度、还是从数据的角度进行描述,都是建立在以人及人的认识的基础上的,属于狭义的信息定义。这些定义从不同的角度阐明了信息的概念,不管是从通讯的角度、从知识的角度、还是从数据的角度进行描述,都是建立在以人及人的认识的基础上的,属于狭义的信息定义。 在此基础上,一些学者拓展了信息的主体。如我国信息论专家钟义信教授进一步从信息本题出发,对信息的概念作出了广义的定义: • 信息——是事物运动的状态和(状态改变的)方式。(如万有引力现象、地震预兆、电磁波、声波、日蚀、月蚀等)
文献与信息的关系 信息 文献
二、信息的特征 第一,普遍性与绝对性。存在 第二,特殊性与相对性。价值 第三,可共享性。 第四,可识别性。 第五,可转换性。 第六,可存贮性。 第七,可传递性。 第八,表征性。 第九,动态性。
三、信息的类型 1、广义的信息的分类 (1)人类社会信息 (2)非人类社会信息(自然信息) 2、狭义的信息的分类 (1)按信息的功能分 • 军事信息 • 政治信息 • 经济信息 • 科技信息 • 社会文化生活信息等等。
(2)按信息的载体分: • 文字信息 • 声像信息 • 实物信息 • 多媒体信息 (3)按应用范围(流通范围)分: • 公开信息 • 内部信息 • 秘密信息
(4)按加工层次分: • 零次信息 • 一次信息 • 二次信息 • 三次信息
四、信息的价值评价 1、有价值的信息应具备的条件 有价值的信息是在特定的问题和状态中被利用并有效发挥其功能的信息,是实现某种目标所需要的知识,是进行决策判断所必须的资料。有价值的信息必须具备及时性、准确性、综合性、获取简易性和经济性等特性。 具体的说,有价值的信息应具备如下条件 (1)能够及时地以适当的方式提供解决问题所需要的依据; (2)符合需求; (3)可信赖度高 (4)具有综合性 (5)容易获取; (6)费用与目标吻合
2、有价值的信息的评价指标 (1)信息源的选择评价 对于通过一般的信息搜集活动得到的信息,首先必须确定它是通过哪种信息载体、从什么样的信息源获得的,其次还要评价信息发生的意图和可靠性。
(2)信息准确度的比较评价 A、第一种角度包括下面三种方法 从不同的信息源获得同一性质的信息,对这些信息进行比较; 定期地、系统地搜集信息,调查过去同种信息是否出现并和新获取的信息进行比较评价; 从多种信息源搜集、分析同种信息和相关信息,与切题的信息进行比较评价。
B、第二种角度是从信息六要素出发评价信息的准确度B、第二种角度是从信息六要素出发评价信息的准确度 任何信息都包含六个要素:即常说的“5W1H” 内容(what) 原因(why) 时间(when) 地点(where) 人(who) 方法、途径、状况(how) 对信息进行比较评价时,要把信息分解成上述六个方面。
(3)信息的经济性评价 信息的搜集、分析、加工、利用需要人力、财力、时间。由于信息分布的广泛性和信息利用的时效性之间的矛盾,信息搜集受到约束和限制。一般都要求迅速准确廉价的获得所需信息。但是对于迫切需要的信息,有时也不惜高价。企业利用信息时,信息的经济性是一个重要的影响因素。为了经济有效的搜集信息,可以从下面几个方面出发来评价信息: A、所需信息的存在率评价。调查有关的信息源、载体是否存在,如果存在,要用什么方法从什么途径获得,评价获取的难易程度。 B、所需信息适合率的评价。评价获取的信息与所需信息的内容吻合程度。 C、所需信息的可靠性评价。对于二次信息和三次信息,应评价其性质、加工深度。是否能获得证明性信息以确认其可靠性。
第二节 信息源简介 一、信息源的概念和类型 (一)概念:UNESCO认为,个人为满足其信息需要而获得信息的来源,称为信息源。指产生(或汇集)信息并提供传递信息可能性的系统(既包含信息的有形载体,也包含无形的载体或人们的某种交往活动,汇集了交往信息、文献信息、实物信息等多种形式的可资利用的信息)。是人们借以获取信息的来源。任何运动着的事物都可以产生信息,都可以成为信息源。信息从信息源发出,以物质和能量为媒介,超越空间和时间传送到接收者那里,这就是信息传递
(二)类型:按信息存在的形式,信息源可分为:(二)类型:按信息存在的形式,信息源可分为: 1、文献信息源:储存在纸张、胶片、磁介质和光盘等载体上的信息源。包括图书、报刊、会议文献、专利、标准、产品样本及说明书、政府文献、统计资料(包括相应的各种电子出版物)、各种数据库等。 2、非文献信息源:包括交往信息源、实物信息源(自然物,人工制品,事物发生的现场, )、广播电视信息源、网络信息源等。
信息源不等于信息资源。在时间序列上,信息源是信息资源的源,是先于信息资源的。从信息的开发利用上,信息源可以不断的转化为信息资源。 信息资源:是经过加工处理有序化并大量积累起来的有用信息的集合 • 狭义信息资源是指信息本身。是可利用的信息的集合(有用的数据和资料)。 • 广义信息资源是信息活动中各种要素(信息本身、技术、设备、资金和人)的总称。指人类社会信息活动中积累起来的以信息为核心的各类信息活动要素(信息技术、设备、设施、信息生产者等)的集合。
一般根据现代与传统的区别,信息资源可以分成两大类,即文献型信息资源和数字化(电子化)信息资源。一般根据现代与传统的区别,信息资源可以分成两大类,即文献型信息资源和数字化(电子化)信息资源。 • 文献型信息资源就是传统的文献资源, 包括刻写型、印刷型、缩微型和视听型信息资源。 • 数字化信息资源可以分为网络信息资源与单机型信息资源2 种。 • 网络信息资源根据使用形式可以分为联机检索信息资源和因特网信息资源; • 单机型信息资源一般仅存储在个人计算机上, 但不在网络上传输,因此又叫机读资料。
数字化信息资源的内容根据其表现形式, 可以分为文本型信息资源、数值型信息资源、事实型信息资源和多媒体信息资源等。 • 文本型信息资源以文本方式存在的信息资源; • 数值型信息资源最具代表性的便是统计数据, 经济类学科和专业的用户对此需求很大; • 事实型信息资源一般是三次文献,如百科全书型、字词典等; • 多媒体信息资源是由文本、图片、图像、声音、视频等多种媒体的集成,如视频数据库、图片数据库等。
数字信息资源的特点: 1、组织形式发生变化:由传统的文本、线性,发展成超文本、超媒体等多种形式,并组成相互联系、非线性的网状结构。 2、数字化:存储密度高,容量大。 3、内容丰富多样:从文字、图表到多媒体信息,文献类型多样,涉及领域宽广。 4、数据具有通用性、开放性、动态性 5、信息资源体积小、数量大 6、传播方式的无限性,不受时间、空间限制 7、检索功能强大,使用方便、快捷。
二、文献信息源及其信息特征 文献是在空间和时间上积累和传播信息的最有效的手段,是获取信息的最基本、最主要的来源。文献信息源是正式是人们获取全面系统的信息的主要保障。 文献的功能:1)存贮知识的功能;2)传递和交流信息的功能;3)保存知识的功能。 从检索结果要获取原始文献,就必须知道文献来源,我们可以用代表文献特点的检索标识(一般是缩写)确定该文献来源于图书、期刊、会议文献或科技报告等。 著录(Description)就是编制文献目录时,对文献内容和形式特征进行分析、选择和记录的过程。它将有关某一文献的基本信息摘录下来,供人们间接地了解、识别该文献。
我们分别对不同类型文献的定义、著录特征及其识别方法进行讲述。我们分别对不同类型文献的定义、著录特征及其识别方法进行讲述。 (一)文献的概念 文献——国家标准局颁布的《文献著录总则》将文献定义为“记录有知识的一切载体”。就是指用文字、图形、符号、声频、视频等手段记录下来的人类知识。也可称为固化在一定载体上的知识。 科技文献是科技成果的最终表达形式。它凝聚着无数有用的事实、数据、理论方法、构想和设想等,反映着一定时代、一定社会条件下科技的进展和水平,预示着未来的发展趋势和方向。
文献要素:人们认识文献的关键 • 信息内容:文献中所表达的思想意识和知识观念。它是文献的内涵、灵魂之所在,直接体现了文献精神产品的性能,具有知识和情报价值。 • 信息符号:符号系统是揭示文献信息内容的标识,表达知识情报的手段,记录和传播文献信息内容的媒介。文献信息符号主要是从语言不断衍化而来的,并逐步发展为文字、图画、表格、公式、编码、声频和视频等类型。 • 记录方式:是指将文献符号系统所代表的信息内容通过特定的人工记录手段和方法使其附着于一定的文献载体材料上。文献记录方式具体包括刻划、书写、印刷、拍摄、录制、复印和计算机录入等。 • 载体材料:是可供记录信息符号的物质材料,是全部信息载体中一个重要的子系统。文献载体反映了文献物质产品的性能,具有商品、保存和流通价值。文献载体大体经历了泥板、纸草、羊皮、蜡板、甲骨、金文、石头、简牍、缣帛等早期载体,到纸的出现,再到现代各种新兴文献的发展过程。
(二)文献的类型 1、内容加工深度(文献级别) 零次文献、一次文献、二次文献、三次文献 (1)零次文献:是指未经过任何加工的原始文献。如:私人笔记、底稿、手稿、个人通信、新闻稿、工程图纸、考察记录、实验记录、调查稿、原始统计数字、原始录音、原始录像、谈话记录等。零次文献在原始文献的保存、原始数据的核对、原始构思的核定(权利人)等方面有着重要的作用,其特点是信息来源直接真实, 内容新颖。但不成熟,不公开交流,难以获得。
(2)一次文献:以作者本人取得的成果为依据而创作的论文、报告等经公开发表或出版的各种文献,习惯上称做原始文献。如:期刊论文、学术论文、学位论文、科技报告、会议论文、专利说明书、阅读性图书、技术档案、技术标准等。一次文献是人们学习参考的最基本的文献类型,也是最主要的文献情报源。是产生二、三次文献的基础,是文献检索和利用的主要对象。其主要特点是 特点:在形态上具有多样性,在内容上具有原创性,在出处上具有分散性。内容新颖丰富,叙述具体详尽,参考价值大,但数量庞大、分散。 确定一篇文献是否一次文献,主要是根据其内容性质,而不是根据其物质形式(如载体、语种、出版形式等),只要是作者根据自己的科研成果而发表的原始创作,都属于一次文献。
(3)二次文献:按一定的方法对一次文献进行搜集、提炼、浓缩、加工、整理,以使之有序化而形成的文献。是为了更有效地管理和利用一次文献而编辑的工具性文献。主要包括目录、索引、文摘及机读型书目数据库、网上检索引擎等都属于二次文献。二次文献以不同的深度揭示一次文献,其主要功能是检索、通报、控制一次文献,帮助人们在较少时间内获得较多的文献信息。(3)二次文献:按一定的方法对一次文献进行搜集、提炼、浓缩、加工、整理,以使之有序化而形成的文献。是为了更有效地管理和利用一次文献而编辑的工具性文献。主要包括目录、索引、文摘及机读型书目数据库、网上检索引擎等都属于二次文献。二次文献以不同的深度揭示一次文献,其主要功能是检索、通报、控制一次文献,帮助人们在较少时间内获得较多的文献信息。 特点:二次文献中的信息是对一次文献信息进行加工和重组而成,并不是新的信息,具有汇集性、工具性、综合性、系统性、交流性和检索性的特点。提供的文献线索集中、系统、有序。
(3)三次文献——根据二次文献提供的线索,选用大量一次文献的内容,经过筛选、分析、综合和浓缩而撰写的文献。主要包括三种类型:(3)三次文献——根据二次文献提供的线索,选用大量一次文献的内容,经过筛选、分析、综合和浓缩而撰写的文献。主要包括三种类型: • 综述研究类:综述、述评、年度进展报告、信息预测、未来展望等; • 参考工具类:年鉴、手册、百科全书、词典、大全等; • 文献指南类:专科文献指南、索引与文献服务目录、书目之书目、工具书目录等。 特点:文字精炼、叙述简明扼要,在内容上具有综合性和知识性,在功效上具有参考性和工具性。
2、内容公开程度(流通范围): 白色文献(公开文献)、灰色文献(内部文献)、黑色文献(秘密文献)。 (1)白色文献:一切正式出版并在社会上公开流通的文献。包括图书、报纸、期刊等。这类文献通过出版社、书店、邮局等正规的渠道公开发行,向社会所有成员公开,其蕴涵的信息大白于天下,人人均可利用。 (2)灰色文献:非公开发行的内部文献和限制流通的文献。包括社会公开传播的内部刊物、内部技术报告、内部教材和会议资料等。这类文献出版量小、发行渠道复杂、流通范围有一定限制,不易收集。 (3)黑色文献:包括两个方面,一是人们为破译和未辨识其中信息的文献,如考古发现的古老文字未经分析厘定的文献;二是处于保密状态和不愿公布其内容的文献,如未解密的政府文件、内部档案、个人日记、私人信件等。这类文献除作者及特定人员外,一般社会成员极难获得和利用。
3、内容与专业相关程度 根据相对利用率的多少,我们把与一个学科有关的文献分成核心文献、相关文献、边缘文献。 (1)核心文献是指与本学科发展水平、发展动向密切相关的一些文献。 (2)相关文献和边缘文献是指所含内容与学科的关系相对疏远一些的文献。
4、载体类型 书写型文献、印刷型文献、缩微型文献、声像型文献、电子型文献 (1)书写型文献:载体是竹简、纸张、帛等,人工抄写而成。 例如,写在竹简、帛等上的古代文献、书法作品、原始记录等 (2)印刷型文献:以纸张为载体的文献。这是一种历史悠久的传统文献形式,是文献信息传递的主要载体。其优点是传递知识方便灵活、广泛,保存时间相对较长;缺点是存储密度小,体积庞大。 (3)缩微型文献:以感光材料为载体的文献。如缩微胶卷、缩微平片等。这类文献的特点是体积小、信息密度高、轻便、易于传递、容易保存。缺点是使用时必须借助专门的放大设备。
(4)声像型文献:通过特定设备,使用声、光、磁、电等技术将信息转换为声音、图像、影视和动画等形式,给人以直观。形象感受的知识载体。如唱片、录音带、录像带、CD、VCD、DVD、等。声像型文献提供的形象、声音逼真,宜于记载难以用文字表达和描绘的形象资料和音频资料。 (5)电子型文献:采用高科技手段,将信息存储在磁盘、磁带或光盘等一些媒体中,形成的多种类型的电子出版物。特点时信息存储密度高,存取速度快、具有电子加工、出版和传递功能。电子出版物包括电子图书、电子期刊、网络文献信息、光盘数据库等。
5、按出版形式: 连续出版物(期刊、报纸)、图书、科技报告、会议文献、标准文献、专利文献、学位论文、政府出版物、产品资料、档案文献等。这十种文献被人们称为十大文献信息源。其中除图书、期刊外的其它类型文献又统称为特种文献。
三、十大科技文献信息源简介: 是指人们在进行科研及技术工作时使用频率比较高的十种情报来源的总称 (一)期刊(Journal杂志;Transaction汇刊;Acta学报; Periodical期刊) 1、概念。 我国著作权法中规定,期刊是指经国家行政出版机关、国家科委、中国人民解放军总政治部或省、自治区、直辖市等主管部门批准,在主办单位所在地的省级出版管理机构登记,领取了登记号的定期出版的发行物。期刊有固定的名称,有统一的出版形式,有一定的出版规律,每期刊载不同著者、译者、编者所撰写的论文,是按一定编号顺序连续出版下去的出版物。 期刊也称杂志,期刊一词,着眼于它的周期性特征;杂志一词,侧重于它的内容性质的博杂。
2、类型 (1)按出版周期:周刊、双周刊、半月刊、月刊、双月刊、季刊、半年刊、年刊等。 (2)按报道范围:综合性期刊、专业性期刊 (3)按内容、性质和用途:学术性、技术性期刊;检索性期刊;通讯性期刊;评述性期刊;数据资料性期刊。
3、期刊的特点和作用 与图书相比,期刊出版周期短,发表文章快;内容新颖,能迅速反映国内外的各种学科专业的水平和动向;品种多,数量大;内容涉及领域广泛;作者队伍及读者队伍均非常庞大。占阅读量的70%。 期刊是传递科技信息,交流学术思想的最简便、最基本的手段,是获取信息的最主要的信息源。期刊中记载和传递的多属理论性、探讨性的信息。 期刊的著录:刊名(一般用缩写)、出版年月、卷、期、起止页码等。 期刊论文的著录:篇名、作者、出处(刊名、卷号、期号、起止页码、出版年)、国际标准刊号 期刊的识别:卷号或期号(vol. no or v. n);刊名缩写(如PE&RS);(3)ISSN号(8位)
4、核心期刊——对某学科或专业领域而言,登载该学科或专业大量相关论文的少数权威性期刊,称为该学科或专业的核心期刊。4、核心期刊——对某学科或专业领域而言,登载该学科或专业大量相关论文的少数权威性期刊,称为该学科或专业的核心期刊。 根据B.C.Brookes等人的研究,一个学科或专业领域的核心期刊一般占该领域相关期刊总量的10%左右,但这些核心期刊所提供的相关文章数却占相关文章总数的50—60%。因此,科学地确定和利用核心期刊是非常重要的,可以节省时间和精力。
(二)图书 1、概念 我国著作权法中所指图书,是由国家正式批准的出版单位出版,标有中国标准书号的出版物。 ISO将书定义为:“49页及49页以上构成一个书单元的文献(不包括封面和扉页)。”是对某专门知识或某学科进行系统的论述或概括的一种情报来源。阅读量占到文献总量的15%左右。
2、种类 图书按其内容和用途可划分为如下几类: (1)专著:是针对某一主题分章列节地作深入系统的全面论述的科学著作。 (2)教科书:是适应教学需要,针对某种教学大纲编写的主要用于教学的图书。高校用的某些专业教科书就内容而言接近于专著。 (3)丛书:是在一个总书名下,汇集多种单行本图书成为一套,并以编号或不编号方式出版的图书。其中每一单本都是一部独立完整的书。在内容上,每套丛书围绕一个中心题目或具有某些共同特征,但彼此并无内在联系。 (4)参考工具书:是在大量一次文献或原始信息基础上,经过进一步比较分析,精心提炼,综合而成的高度浓缩的、精确的特定信息的集合事实和数据性信息的集合。主要包括百科全书、年鉴、手册、字典、词(辞典)、地图集等。 图书从使用的角度可分为两类:一是为了求知或者欣赏,而从头到尾嘻嘻哈哈阅读;二是为了查阅特定的资料或遇到疑难需要解决时,才去翻阅或引用的书,是作为工具书转供查检用的书。
3、特点和作用 与期刊相比,图书所论述的内容一般比较系统、全面、成熟、可靠,也有涉及面广,品种多,出版量大、作者群与读者群大等特点。但编撰和出版的周期较长,内容相对滞后,传递情报的速度较慢。图书同样也是日常使用广泛的基本的传播信息的手段。参考图书资料有助于人么对范围较广的问题获得一般的知识,或对陌生的问题获得初步的了解,内容一般只反映一至二年以前的研究成果。 图书的著录项目包括书名、著者,出版项(出版地、出版社、出版年)、总页码等。 图书的识别主要依据出版项(出版地、出版社、出版年)、ISBN(10位)、总页码(PP or P)等著录项。