科学的计量研究

科学的计量研究 北京大学科学与社会研究中心周程 Tel&Fax: 010-6275-0536(o) E-mail: zhoucheng@pku.edu.cn

科学的计量研究 • 一、科学计量学的产生与发展 • 1.萌发时期 • 2.奠基时期 • 3.发展时期 • 二、科技文献计量研究成果简介 • 1.引文分析 • 2.学术评价 • 3.SCI论文的统计分析

引言 • 马克思认为“一种科学只有在成功地运用数学时，才算达到了真正完善的地步。” • 自然辩证法、科学论(Science Studies)、科学学(Science of Science) 作为把科学当作一种社会现象来研究探讨的学问同样不应例外。

一、科学计量学的产生与发展 • 把科学作为一种社会现象对其进行定量研究的学科是科学计量学。它被公认为是科学论、科学学的一个重要分支。 • 与计量经济学(Econometrics)、计量社会学(Sociometrics)的译法不同。Scientometrics不翻译为计量科学学，而是译为科学计量学。

纵观科学计量学的发展历程, 可以大致分辨出三个阶段。即： • 1.萌发时期（19世纪下半叶到20世纪初） • 2.奠基时期（20世纪初到60年代末） • 3.发展时期（20世纪70年代后）

1.萌发时期 • 对科学进行计量研究, 至少可以追溯到一百多年前。那时，已有少数自然科学家对科学的发展进行统计分析。 • 早期运用统计分析的方法对科学进行研究的代表人物有： • 阿尔丰沙·德堪多(Alphonse de Candolle, 1806- 1893) • 弗朗西斯·高尔顿(Francis Galton, 1822- 1911)

1-1.德堪多(Alphose de Candolle） • 德堪多是瑞士植物学家, 他深受达尔文进化论的影响, 把自然选择理论应用到了研究人类和人类社会的精神和智力特征, 并于1873 年发表《二百年来科学和科学家的历史》。 • 德堪多采用统计方法对英国皇家学会、法国科学院、柏林科学院等历史上的成员名单进行了研究, 考察了这些科学家的学科门类、家庭出身、民族背景、宗教信仰的分布情况，分析了遗传、教育、语言、宗教、地理环境等因素对科学发展和科学家成长的影响。

德堪多还运用数学方法建立了多个指标来比较各国的科学发展状况。如他对各国的科学家人数及其占国家总人口的百分比、各国百万人口中的院士人数、科学院中的外籍院士人数等进行了统计，并据此对各国进行了排序，由此德堪多被誉为对科学进行计量研究的先驱。德堪多还运用数学方法建立了多个指标来比较各国的科学发展状况。如他对各国的科学家人数及其占国家总人口的百分比、各国百万人口中的院士人数、科学院中的外籍院士人数等进行了统计，并据此对各国进行了排序，由此德堪多被誉为对科学进行计量研究的先驱。

1-2.高尔顿（Francis Galton） • 高尔顿，厄思马斯·达尔文的外孙，19世纪最多才多艺、最富有探索精神的人物之一。他被誉为是遗传学的探索者和优生学的奠基人、卓越的地理学家以及英国生物统计学派的先驱。 • 高尔顿嗜好计数，请画师为己作画时，发现画师完成一副肖像画大约需要运笔2万次，恰好同织一双袜子所需的手臂运动次数相同。 • 高尔顿在科学计量学方面的贡献也是对科学家的统计分析。他的代表作是《遗传天赋》(1869) 和《英国科学家》(1874)。

高尔顿对英国伟人进行统计分析后指出：伟人们，包括有所创造的科学家在内，似乎都有血缘关系，且大都出生名门。他的观点后来被人批评为低估了人与社会的复杂性, 过份夸大了生物学原理的适用范围。 • 高尔顿研究发现，载入《当代2500人》人物传记，或出现于泰晤士报的讣告中的杰出人士占英国人口的两万分之一。其中从事科学和医学的占十分之一。他统计指出，英国优秀科学家占总人口的百万分之一。 • 高尔顿开创了关于杰出科学家质量分布的研究, 这一研究是后来科学计量学的各种质量分布研究的先导。

1-3.科尔(F. J. Cole) • 20世纪初，一些学者开始对科技文献的数量进行统计研究。如1917 年动物学教授科尔(F.J.Cole) 和博物馆馆长伊尔斯(N.B. Eales) 发表了题为《比较解剖学的历史——.对文献的统计分析》的论文。 • 该文统计了1543- 1860 年欧洲各国发表的有关动物解剖学方面的出版物6436件, 并绘制了出版物数量的时间分布曲线, 从此曲线可以较为清楚地看出比较解剖学的发展进程。该曲线与后来的所谓科学发展指数增长规律曲线十分吻合。

科尔和伊尔斯在统计数据的基础上，还比较了不同国家比较解剖学的发展状况，确定了不同时期比较解剖学的研究重点等。科尔和伊尔斯在统计数据的基础上，还比较了不同国家比较解剖学的发展状况，确定了不同时期比较解剖学的研究重点等。 • 科学发展的表现形式之一就是科技文献的迅速增长，科尔等人以文献为切入点对科学进行定量研究开创了科学计量学一个新领域。

2.奠基时期 • 具有现代科学计量学意义的研究起始于美国学者洛特卡(A.J.Lotka,1880-1949)。但是真正使科学计量研究变成一门科学的，应归功于普赖斯(Derek J.de Solla Price,1922-1983)和加菲尔德(Eugene Garfield,1926- ) 。 • 著名的科学社会学家默顿曾于1879年指出：普赖斯《巴比伦以来的科学》、《小科学, 大科学》两部著作的出版和加菲尔德的《科学引文索引》的刊行乃科学计量学发展史上的两件奠基性大事。

2-1.洛特卡(A.J.Lotka) • 洛特卡生平 • 1880年3月生于奥地利的伦伯格，父母都是美国人。早期教育是在法国和德国接受的。毕业后，先后在美国化学总公司、国家专利局、国家标准局等机构工作。1938~39年任美国人口协会主席、1942年任美国统计协会主席。

洛特卡定律 • 1926年洛特卡发表了论文《科学生产率的频率分布》。文中他统计了《化学文摘》1907~16年索引中的以A和B开头的6,891名作者及其论著数，并统计了奥尔巴赫（Auerbach）的《物理学史一览表》（1919）中的1,325位科学家及其论著数。 • 在上述统计分析的基础上，他发现：“写了2 篇论文的科学家人数大约是写了1 篇论文科学家人数的1/4; 写了3 篇论文的科学家人数大约是写了1 篇论文科学家人数的1/9; ⋯⋯写了n 篇论文的科学家人数大约是写了1 篇论文科学家人数的1/ n2 ”。这就是著名的洛特卡定律。

洛特卡定律的数学表现形式为： • fn=c/n2 • 其中，n为一位作者发表的论文数，fn 为发表n篇文章的科学家占科学家总人数的百分比，c为常数。 • 因为lim∑fn=1,即c(1+1/22+1/32+···)=1,c(π2/6)=1 • 所以c=6/π2=0.6079 • 结论：写1篇论文的作者数大约占作者总人数的60%。

洛特卡定律的命运 • 由于多种原因，洛特卡定律沉睡了30多年，后来由于普赖斯等人的发掘，自60年代起引起人们的重视。 • 今天，洛特卡定律仍然经常被科学学家、情报学家等引证和研究。

继洛特卡之后，英国化学家布拉福德（Samuel C.Bradford,1878~48）和美国语言学家齐夫（George K.Zipf,1902~50）也先后对科技文献进行了定量研究，并提出了著名的布拉福德文献分散定律和齐夫定律。 • 这些工作无疑对科学计量学的奠基产生了积极的影响。但是人们普遍认为堪称科学计量学之父的只有普赖斯。

2-2.普赖斯(Derek J.de Solla Price) • 普赖斯生平 • 普赖斯1922年1月22日生于英国伦敦，46年获伦敦大学物理学博士学位，54年又获剑桥大学科学史博士学位。 • 1946~47年获英联邦基金资助，赴美国普林斯顿大学从事数理物理研究；1947~50年任新加坡阿拉亚大学应用数学讲师；1950~57年回英国从事科学史研究。其间，结识了英国当时最著名的科学史家李约瑟，并和李约瑟合写了一本题为《天钟装置—— 中世纪中国的伟大天文钟》的著作。与李约瑟的合作奠定了普赖斯的学术声誉。

1957年赴美，1958年起任普林斯顿高等研究所Donaldson Fellow,1960年任耶鲁大学科学史Avalon Professor,后升任耶鲁大学科学和医学史系主任。1980年加入美国籍，1983年9月3日在伦敦逝世。 • 他是一位博学多产的杰出学者，一生发表论文240篇，专著14种。1976 年获美国技术史学会的达·芬奇奖章，81年又获美国科学社会学研究会的贝尔纳奖章。60年代，普赖斯经常去华盛顿为美国总统提供咨询，并以联合国教科文组织等名义走遍世界，产生了广泛的国际影响。

科学知识指数增长律的发现 • 1949年普赖斯在新加坡执教时，负责保管一整套《伦敦皇家学会哲学论坛》。由于十年一叠地放在床头书架上，使得杂志靠墙排成指数曲线状，这个现象被他意外地抓住了。 • 1950年，普赖斯回欧洲后向荷兰阿姆斯特丹的国际科学史大会提交了他的第一篇有关科技期刊按指数增长的科学计量学论文。该论文不仅标志他从数学和物理学转向了科学史研究，而且也成了他成长为科学计量学之父的起点。

Science Since Babylon • 《巴比伦以来的科学》 • 普赖斯取得耶鲁大学科学史教授职位后，曾于就职伊始举行过一次系列讲座。这次讲座共分五讲，他在最后一篇演讲中深入讨论了“科学指数增长”问题。 • 这次系列演讲的文稿于1961 年结集出版，书名为《巴比伦以来的科学》。出乎普赖斯本人意料，这本书非常畅销，而且在科学学界引起强烈反响。

普赖斯在书中以科学文献量为纵轴，以历史年代为横轴，把不同年代的科学文献量在坐标图上逐步描绘出来，然后以光滑曲线连接各点,得出了科学文献随时间增长的指数曲线。普赖斯在书中以科学文献量为纵轴，以历史年代为横轴，把不同年代的科学文献量在坐标图上逐步描绘出来，然后以光滑曲线连接各点,得出了科学文献随时间增长的指数曲线。 • 见下图

普赖斯研究指出： • 期刊数量是按指数而不是线性增长的。…实际上这个常数是，大约每15年左右翻一番，相当于每50年为10倍，每150年为1000倍，从17世纪中叶到现在的300年中增长了100万倍。 • 从科学期刊中所得到的指数增长规律也适用于这些期刊中的论文实际数量。

Little Science, Big Science • 《小科学，大科学》 • 1962年，普赖斯应邀在布鲁克海文国家实验室作了一年一度的“佩格勒姆(Pegram)科学讲演”，他以定量描述科学发展为主线作了四次报告：第1讲“ 科学学序幕”。第2讲“再访哥尔顿”。第3讲“无形学院和无数科学往返者”。第4讲“大科学家们的政略”。 • 佩格勒姆演讲集于1963年出版问世，这就是著名的《小科学，大科学》。

为验证指数曲线的普遍适用性，普赖斯以《化学文摘》等4种文摘和其他30种杂志为例进行了统计分析为验证指数曲线的普遍适用性，普赖斯以《化学文摘》等4种文摘和其他30种杂志为例进行了统计分析 • 他指出：似乎没有理由怀疑任何正常的、日益增加的科学领域内的文献是按指数增加的，每隔大约“10~15"年时间便增加1倍。”“每年增长约5%~10%”。

如以15年为倍增周期，发展3个世纪，则相当于2的20次幂的倍增，即达100万这一因数。如以15年为倍增周期，发展3个世纪，则相当于2的20次幂的倍增，即达100万这一因数。 • 科学的大部分是现代的，而大部分科学工作者也都是在世的。 • 若科学家的倍增周期为15年，则8个科学家中将有7个是在世的，即直接性系数为87.5%。 • 在下一个10~20年出现的科学工作和科学家将和迄今为止的科学工作和科学家的总和一样多 • 书中普赖斯还深入探讨了科学增长的极限问题

两本著作的影响 • 《巴比伦以来的科学》和《小科学、大科学》两书在全面继承和发展近一个世纪以来先驱者们对科学进行定量研究成果的前提下，最终为科学计量学研究奠定了理论基础。 • 正如普赖斯本人1975年在《巴比伦以来的科学》一书扩大再版时说的那样：这两本著作，“引来了一系列旨在对诸如科学期刊数目、论文数目、作者数目以及引证数目等等进行种种计量探索的定量研究。”

2-3.加菲尔德（Eugene Garfied） • 加菲尔德生平 • 1925年9月16日生于美国纽约。二战期间参军服役，战后进哥伦比亚大学学习，1949年获化学学士学位，54年获图书馆学硕士学位。1961年又在宾夕法尼亚大学获结构语言学博士学位。

早年曾为《化学文摘》做过义务文摘员，在工作中他认识到传统的主题词索引存在着诸多不便，于是萌发了用引文作为检索工具的想法。早年曾为《化学文摘》做过义务文摘员，在工作中他认识到传统的主题词索引存在着诸多不便，于是萌发了用引文作为检索工具的想法。 • 1955年他发表论文《引文索引用于科学》，系统地提出了用引文检索科技文献的方法。60年他创办了科学情报研究所(ISI)，并于63年编制成《科学引文索引》(SCI)。73年推出《社会科学引文索引》(SSCI)。78年又推出了《艺术与人文科学引文索引》(A＆HCI)。

《科学引文索引》 • 《科学引文索引》 1963年试刊 • 试刊本分5卷，覆盖了613份科学杂志在1961年发表论文的引文的索引，共有近1.4亿条引证。 • 《科学引文索引》 1964年正式刊行 • 最初的正式刊行本覆盖了2200份杂志上发表的论文所作的引证，这些杂志都是由各个领域的专家委员会选定的。

1963年为年刊, 1964 年改为季刊, • 1979 年改为双月刊, 并有年度和5 年度累积本 • 1985年，SCI摘录来源出版物3367种，报道引用文献620448篇，引文9719986条。

全世界每年出版10 多万种科技期刊。SCI 的编者主要根据“加菲尔德文献集中定律” 及“费用——效果”原则, 在ISI 巨大的自然科学资料库(SCI data base) 中选择入选期刊 • 主要根据基本期刊出版标准、期刊内容、国际性和引文分析四个方面选择了5877 种期刊组成了外圈———SCI 扩展版, 即SCI Expanded。 • 再在SCI Expanded中选取3500 余种组成内圈, 即SCI CED。 • 我国科技界所说的SCI 刊物一般是指进入SCI CED 的刊物。

目前，SCI涵盖了3500 余种国际性权威科技学术期刊上发表的论文和引文的数据信息, 是一种国际性、多学科的综合性文献检索工具, 也是进行引文分析的重要工具之一。 • 它除了收录文献的作者、题目、源期刊、摘要、关键词外, 还收录了论文的参考文献, 是一种以文献之间的引证关系为基础编制的索引。 • 其报道范围涉及数理化、医药、农业、生物学、工程技术、应用科学和行为科学等 • SCI 的主要文献源是期刊, 也收录少量的会议录、专利、图书和科技报告, 收录的引用文献主要是本年度的。其特点是时差短、信息广等。

组成分两部分： • 1 引文索引〉按被引证作者姓名顺序编排 • 2 资料索引〉按序列出引证了上述作者论文的论文 • 特点 • 可以根据作者名从引文索引部分开始查，然后再从资料索引部分查出所有引用这篇论文的论文。

价值 • 它改变了传统的主题索引的分类方法，是情报检索方法的一次重大变革。 • 可以查明论文间的相互引证关系，追踪给定论文的来龙去脉。 • 具有主题索引所没有的评价、分析和预见的功能。

普赖斯和加菲尔德的研究深深吸引了前苏联莫斯科大学纳利莫夫和乌克兰科学院的多勃罗夫。普赖斯和加菲尔德的研究深深吸引了前苏联莫斯科大学纳利莫夫和乌克兰科学院的多勃罗夫。 • 后来,也正是因为他们两人的努力和推动，科学计量学不仅在前苏联，而且在世界许多国家（如匈牙利）变成了一个迅速成长的新领域。

3.发展时期 • 1969年世界上第1本科学计量学专著问世，是由前苏联学者纳利莫夫(V.V.Nalimov,1910-1997)和穆利钦科(Z.M.Mulchenko)合著的《科学计量学：把科学作为情报过程来研究科学的发展》。俄语术语“科学计量学”正式被创造出来。同年也有了英语“Scientometrics”。这标志着奠基期基本完成，从此跨入发展时期。

3-1.建制化的发展 • 1978年国际《科学计量学》杂志的创刊号在匈牙利出版。 • 1982年，《科学计量学》杂志合并了《学术交流研究杂志》。 • 1984年，“普赖斯纪念奖章”设立。 • 1987年首届国际文献计量学、科学计量学会成立 • 3-2.验证与完善科学计量学定律 • 3-3.科学计量学在中国

二、科技文献计量研究成果简介 • 加菲尔德编SCI的用意在于方便情报检索，他“从未想到大规模引文索引的问世，会刺激科学计量学这一全新科学领域的发展”。

1.引文分析 • 《科学论文的网络》 • 1965年，借助于刊行不久的《科学引文索引》，普赖斯在《Science》上发表了一篇著名的论文：《 Networks of Scientific Papers》。在这篇论文中，他创造性地研究了科学论文之间的引证和被引证关系，以及由此形成的所谓“引证网络”。 • 普赖斯研究指出：

施引方面 • 每篇论文平均引证参考文献数目是15篇，其中13篇是期刊论文，而另2篇是图书等其他类型参考文献。 • 普赖斯估算，如果世界文献量每年以7%的速度增加，那么，100篇论文会有105篇引文。即每篇论文每年差不多被引用1次多一点。

被引方面 • 在任何一年里，大约有35%的论文不曾被任何文献引用，有49%的论文只被引用1次，所余的16%的论文平均被引用3.2次。 • 其中，大约9%的论文被引用2次，3%的论文被引用3次，2%的被引用4次，1%的被引5次，余下的1%被引5次以上。 • 结论：被引的减少比引用的减少要快。

“经典文献” • 普赖斯认为，除评论性文章之外，凡每年被引证4次以上的论文，即可列为“经典文献”。 • 按上述标准，则在数学、地质学和植物学中，大多数是经典之作；在化学工程、机械工程、冶金工程和物理学中，大多数是昙花一现之作；在化学和生理学中，则两者各半。

“引文网络图” • 普赖斯还指出：某一年里，受引与施引之间存在一种平衡，这种平衡就是引文网络图。根据网络图，他认为，某一年引用的所有受引论文发表日期存在一个研究峰值，并推断：发表于1961年前15年的所有论文与一篇1961年所发表的论文可引用的概率几乎相同。

“科学地形图” • 普赖斯认为，在网络图上，必有密集分布的小条或小块，如果把这些小条和小块研究清楚，就可以绘出当代科学的“地形图”。随着这幅“科学地形图”的建立，人们就可以指明，各类期刊、各个国家、各国科学家、各种科学论文在科学地图应当占有的位置、他们之间的相对联系和相对重要性。

科学的计量研究

科学的计量研究

Presentation Transcript