290 likes | 414 Views
研究生 《 文献情报源研究 》 课题开题文献检索与分析策略. 彭奇志 副研究馆员 2008.6 于江南大学. 科学研究与文献检索的关系. 1. 文献查阅 2. 实验方案制定 3. 做实验 4. 写论文 文献阅读、分析与评价是科研中最重要的一环. 1. 课题选题与文献信息检索利用. 爱因斯坦 (A.Einstein) 曾说过,“提出一个问题往往比解决一个问题更重要,因为解决问题也许仅仅是一个数学上或实验上的技能而已,而提出新的问题、新的可能性,从新的角度去看待旧的问题,都需要有创造性和想像力,而且标志着科学的真正进步。”可见选题的重要性。. 1.1 选题策略.
E N D
研究生《文献情报源研究》课题开题文献检索与分析策略研究生《文献情报源研究》课题开题文献检索与分析策略 彭奇志 副研究馆员 2008.6于江南大学
科学研究与文献检索的关系 • 1.文献查阅 • 2.实验方案制定 • 3.做实验 • 4.写论文 • 文献阅读、分析与评价是科研中最重要的一环
1.课题选题与文献信息检索利用 • 爱因斯坦(A.Einstein)曾说过,“提出一个问题往往比解决一个问题更重要,因为解决问题也许仅仅是一个数学上或实验上的技能而已,而提出新的问题、新的可能性,从新的角度去看待旧的问题,都需要有创造性和想像力,而且标志着科学的真正进步。”可见选题的重要性。
1.1 选题策略 • 1.选题要突出创造性,选择反映学科前沿最新进展的课题 • 关于做出“创造性的成果”,可以理解为前人没有做过的研究工作,并得到较高水平的结果,或者是做了前人曾经做过的工作,但得到了前人没有得到的结果。
1.1 选题策略 • 2.选题要敢于开拓新领域 • 边缘学科 • 如美国加州理工大学Kopfldd教授,他是一位生物化学专家,但他在生物医学、神经科学电学等学科的交叉处提出了人工神经网络电路模型,开辟了电模拟人工神经网络硬件的新的研究领域。 • 1999年底,西安交通大学 “风险选题制”
1.1 选题策略 • 3.选题必须从经济建设出发,为经济建设服务 • 解决现代化建设中一些急需解决的难点 • 4. 选择专业对口的课题 • 隔行如隔山 • 扬长避短 • 5.选题要考虑研究条件是否具备 • 资料(文献资料、实物资料)、实验设备、经费、时间以及相关学科发展的程度
1.2 选题程序 • 1.课题提出 • 对提出的课题进行形式上的整理、归纳和粗略的分析研究,以使课题明确化。如初步明确其目的、意义、要求、内容、难度、费用、完成期限等 • 2.课题分析与论证 • 这一阶段的主要任务是进一步明确课题目的、范围、对象、意义、要求、难度、费用、完成期限,并对课题实施的政策性、必要性、可行性、效益性等进行初步论证。
1.2 选题程序 • 3.课题选定并写出开题报告 • 开题报告主要包括以下几项内容: • ①研究意义 ②研究目标 • ③研究内容:是研究目标的具体化和细化。 • ④拟解决的关键问题 • ⑤技术路线,即为了达到研究目标、完成研究内容,研究者所采用的研究方法和研究工具及其研究步骤。 • ⑥国内外研究现状 ⑦研究基础
1.3 提高文献阅读质量是正确选题的基本保证 • 扩大阅读范围,提高文献阅读的深度、广度。 • 有人撰文认为,学位论文选题应尽量阅读近年的科技文献,其中中文文献年限应在5-10年,外文文献应在10-15年,而且应有60%的文献是近5年来发表在核心期刊上的文献。一般文献阅读量应在80篇以上,与专业密切相关的文献阅读量硕士不少于40篇,博士不少于60篇,其中外文原始文献不少于1/4,本科生文献阅读量可酌减。
当前概念 下位概念1 下位概念2 下位概念3 Web*结构挖掘(11条) SALSA*算法(1条) HITS*算法(4条) PageRank*算法(8条) 垃圾*处理(1958条) 垃圾*焚烧(904条) 垃圾*再生(39条) 垃圾*回收(143条) 2.1 误检和漏检的原因及分析 • (1)课题分析不透 • 对课题的真正含义和学科归属不了解,会导致最大的检索失误。
案例:查找“玻璃钢制造工艺”的资料 • 字面看:玻璃工业或金属材料 • 实质:合成树脂与塑料工业里的增强、填充塑料制品。 • 玻璃钢 即玻璃纤维增强材料,是国外20世纪初开发的一种新型复合材料,它具有质轻、高强、防腐、保温、绝缘、隔音等诸多优点。最早出现的复合材料是玻璃钢,其实它和钢这种材料毫无关系。玻璃钢中根本不含铁也不是玻璃和钢的复合体。实际上,玻璃钢是玻璃纤维与一种或数种热固性或热塑性树脂复合而成的材料,这些树脂如酚醛树脂、环氧树脂、聚酯树脂、聚酰亚胺树脂等。
案例:查找“乙醇的分离”方面的文献 • 字面上看,检索式: • “乙醇 and 分离” --漏检率很高 “alcohol and separation” --漏检率很高 • 正确的中文检索式: “乙醇 and (分离 or 提纯 or 纯化)” 分离: separation seperate 提纯:purification purify 纯化:refine • 正确的英文检索式: (alcohol or ethanol) and (separ* or purif* or refin*)
(2)人机语言不一致 • 计算机信息检索原理: • 计算机一方面接受检索提问表达式,另一方面从数据库中读取信息记录,然后在两者之间进行匹配运算,即将检索提问表达式与数据库中的信息标引标识进行比较,如果比较的结果一致,那么这条信息就算命中,如果比较的结果不一致,则这条信息就不被输出。 • 计算机检索对检索提问与文献记录之间的相关性判断实际上是检索词与标引词之间的相似性计算。
规范词与自由词 • 1.规范词表: 六行程发动机 “六冲程” 维生素C(Vitamin C) 抗坏血酸(Ascorbic Acid) • 在EI数据库: (飞机、飞行器)aeroplane airplane • flying machine plane aircraft • 2.自由词检索不要求用规范化的检索词,例如在Google、百度中支持自然语言检索
(3)主题概念太大或太小 • 主题概念太大 →误检→大量没用的信息 “数据挖掘算法” →概念太大 ,需用下位概念: • Web结构挖掘算法,关联规则挖掘算法, 遗传算法,频繁项集挖掘算法,PageRank 算法,ID3算法, FPT(模式增长树)算法。 • 主题概念太小 →漏检→重要信息没有检到
(4)检索词问题 • A.不会使用“截词” • 例如:“分离” →separation,separate,separating,separated →使用截词separat* • B.不会拆分主题概念 • 例如:关联规则挖掘算法(CNKI,2007,篇名,精确,48篇)→关联规则,算法→检索式:关联规则 and 算法(CNKI,2007,篇名,精确,123篇)
学名 俗名 白头海雕(1条) 秃鹰(19条) 乙醇(4971条) 酒精(6537条) 聚丙烯腈(474条) 腈纶(1018条) 荷花(610条) 莲花(812条) 马铃薯(6577条) 土豆(526条) 洋芋(107条) C.同义词(学名和俗名) • 例如:
中文 外文全称 外文简称 世界贸易组织(775条) World Trade Organization(1条) WTO(25122条) 万维网(144条) World Wide Web(31条) WWW(1075条) 脱氧核糖核酸(202条) Deoxyribonucleic acid(1条) DNA(21288条) D.同义词(外文的全称和简称) • 例如:
上位词 下位词1 下位词2 下位词3 Web*结构挖掘(11条) SALSA*算法(1条) HITS*算法(4条) PageRank*算法(8条) 垃圾*处理(1958条) 垃圾*焚烧(904条) 垃圾*再生(39条) 垃圾*回收(143条) E.上下位词 • 例如:
(5)核心词太多 • 核心词:A、B、 C、 D、 E • 检索式: A and B and C and D and E →检索结果太少→调整检索式→拆分再组合 #1 A and B and C #2 D and E #3 #1 and #2
(6)布尔逻辑检索的先后顺序 • 布尔逻辑检索的先后顺序为: • not and or • 在有括号( )的检索式中,先运算( )内的逻辑运算。 • (so* and yangt* or jiangnan*) and univ*
(7)对各种数据库不熟悉 • 漏检 • 误检 • 各种算符 • 逻辑组配关系 • 限定关系 • 扩展检索
3.1 检索策略的制定要素 • 1.全面分析课题 • 2.正确选择检索工具 • 3.正确选择检索途径 • 4.正确选择检索词,确定检索策略
3.2 检索策略的制定要素 • 5.查找和筛选文献线索 • 6.调整检索策略再检索 • 7.获取原始文献