450 likes | 559 Views
数理统计学: 学科性质 发展历史 若干动向. July 10, 2001. “统计的思维方法,就像读和写的能力一样,有一天会成为效率公民的比备能力” ——英国学者威尔斯. 源出于16世纪意大利 意文 Stato= 英文 Statistics= 统计学,当时理解为 国情学 意文 Statista= 英文 Statistician= 统计学家,当时理解为 处理国务的人。
E N D
数理统计学:学科性质 发展历史 若干动向 July 10, 2001
源出于16世纪意大利 意文Stato=英文Statistics=统计学,当时理解为国情学 • 意文Statista=英文Statistician=统计学家,当时理解为处理国务的人。 • 这里涉及面广,经过演变,19世纪初,英国学者Sinclair首先在现今意义下使用这个词,即只涉及处理数据有关的那些内容。 一、什么是(数理)统计学
《不列颠百科全书》的定义:统计学是:“关于收集和分析数据的科学与艺术(art)”《不列颠百科全书》的定义:统计学是:“关于收集和分析数据的科学与艺术(art)” 1、数据有随机性(带偶然误差)。 2、应用时有人的判断和主动性(“艺术”),不是死套公式。 3、社会经济统计学(国民经济核算、指标体系、投资决策等等)在国内认为是一门社会科学。 4、与数学的关系,在性质上被认为是数学的一个分支,但有很强的应用性。
5、描述统计与推断统计 描述统计涉及数据整理和简约:用表和图表示,计算特征量(如平均值)等,所论不超出已有数据之外。 推断统计(统计推断)据数据所提供信息对数据所来自的总体(母体)的性质作推断,推断会有错误、误差,用概率论的术语和方法来描述和论证。误差的产生源于数据有误差。怎样尽可能减少推断的错误和误差,是统计推断也就是数理统计学的中心问题。
收集数据有三种方式: • 抽样调查:从一大群体中抽取一部分,如全国人口1/10抽样调查,如何抽。 • 安排试验:设定有关变量值的条件下作试验,记录其反应。统计学研究的是其一般安排方案,如一特定变量设定多少个值,如何搭配,试验如何分组(每组条件较均匀,组间差异较大)以及总的试验规模等。还要使所得数据有一种便于作统计分析的结构。
(被动)观察。观察记录所见而不(能)作人为干预,如某种生活习惯与健康的关系。(被动)观察。观察记录所见而不(能)作人为干预,如某种生活习惯与健康的关系。 分析数据内容包括: • 确定模型 • 选定所用的方法 • 统计推断的形式 • 作出结论,决定采取何种行动(或决定继续观察或试验,留待以后作决定等)
确定模型是根据 • 与问题有关的理论 • 经验 • 现有数据 • 数学上便于处理的考虑 一切都还要以在实用中能取得良好的效果为准。所以,虽则从性质上看数理统计学可视为数学的一分支,但不少学者认为它本质上是一门实验科学。即一个理论和方法是否能成立,主要不看其数学证明,而取决于其应用效果如何。
确定模型的具体内容通常包括: • 问题中所涉及的变量关系的形式:线性或非线性(多项式、指数、对数…) • 从众多可能有关的因素(变量中选择最有关系的一(少)部分:多少个?那些个? • 随时间变化的数据(时间序列)中是否有某种趋势或周期变化的部分 • 众多因素中,那些因素的交互效应(由于相互影响而产生的效应)需要考虑?
是否在某些点有突变(转变点Change Point Problem) • 数据的截尾形式(定时、定数、固定、随机等) • 模型误差的概率结构:正态或其他参数形式;非参数形式等 • 考虑所选模型的适用性及其改进: • 残差(根据所选模型,某目标变量的理论值,与实际观察所得结果之差)分析 • 模型诊断:根据残差分析结果,判定所选模型哪些地方存在问题,如何修改? • 内符:将模型预测结果与近期观察结果比较,看符合如何,必要时调整模型
部分推断整体。如在全国在学大学生中抽出1000人,以其情况来推断全国大学生的整体情况:样本、总体、抽样。部分推断整体。如在全国在学大学生中抽出1000人,以其情况来推断全国大学生的整体情况:样本、总体、抽样。 • 归纳性推理:据个案(样本)引出结论。 • 试图通过表面上的数量关系了解事物的本质(吸烟对健康的影响,某种政策的效用如何等)统计相关关系(表面数量上的关系)与因果关系不一定是一回事。这要求对统计分析结果在解释上要慎重。 • 中立性:数理统计分析方法只凭数据分析的结果立论(当然要考察数据来源是否符合统计学的规范),没有预设的立场,它只是一种工具而非一个学派。 二. 统计推断的特点
人口统计——政治算术 ——社会统计 • 1662年英国学者Graunt发表《Natural and Political Observations Made upon the Bills of Mortality》一书,把大量关于人口出生和死亡的资料整理成8个表,是描述统计的开端。 • Petty于1690年发表《Political Arithmetic》一书,倡导用统计即实证的方法研究社会经济问题。 • 法国大数学家Laplace在19世纪初首次尝试将抽样调查方法用于人口统计问题,为20世纪抽样调查的全面发展作了先导。 三.统计学的三个源头
比利时天文兼统计学家Quetelet大大拓展了正态分布在数据分析中的应用,其工作对19世纪后半期英国遗传学家Galton提出重要的统计相关与回归分析的概念和方法有重要的意义。比利时天文兼统计学家Quetelet大大拓展了正态分布在数据分析中的应用,其工作对19世纪后半期英国遗传学家Galton提出重要的统计相关与回归分析的概念和方法有重要的意义。 • 天文和测地学中量测误差分析 ——正态误差分析理论和最小二乘法 • 最简单形态:对一未知值a重复测量n次得x1,…,xn,用以估计a,这导致算术平均 • 一般形态:k个未知量a1,…,ak与k个可观测量y1,…,yk理论上有关系 a1y1+…+akyk=0
对(y1,…,yk)作n次测量得 (y1i,…,yki),i=1,…,n 有n个方程 a1y1i+…+akyki=0 , i=1,…,n 要利用它估计a1,…,ak,n>k,为矛盾方程组,但实际上由于量测有误差,方程的实际为 a1y1i+…+akyki= ei , i=1,…,n ei为方程的误差。为解决这一问题,18世纪中叶以来经过如Euler、Laplace等几代大数学家努力,都没有成功。
直到1805年,法国学者Legendre提出最小二乘法,圆满解决了这一问题,该法在于使误差平方和直到1805年,法国学者Legendre提出最小二乘法,圆满解决了这一问题,该法在于使误差平方和 达到最小。算术平均数使其特例。Legendre在估计过巴黎子午线长(已定出1米之长)的问题中用了这一方法。
最小二乘估计的误差 取决于量测误差,关于后者的概率分布,伽利略已曾考虑过,他提出下图形式的分布,即绝对值愈大的误差概率愈小且关于0点对称,f的具体形状曾经包括Laplace在内的一批学者研究过,但都未得出有用的结果,最后是GAUSS在1908在《绕日行星运动》中解决,提出正态分布 为误差分布(h>0为参数),后来Laplace从他的“中心极限定理”也悟出了这个解。 f(x) x
“ 最小二乘法与正态分布结合”被认为是统计学发展史上的一个重要的事件。这个体系现在仍包含了许多很常用的统计方法。这也经历了一个过程。因为19世纪相当长一段时间,“误差分析”与“统计分析”被认为是两个根本不同的东西:前者涉及对一个对象重复量测的数据;而后者则涉及大批对象一次量测的数据。经过Quetelet在实用上及Edgeworth等在理论上的论证,这两个方面到19世纪末才逐渐走向统一。
概率论研究的促进 • 从关于比率的推断问题引出Bernoulli大数定律(1713年《推测术》),无论在哲学或方法的意义上都是整个统计推断的基础。 • 比率推断问题引出二项概率的计算问题,当n大时计算很难。 • 1730—1733年法国概率学者De Moivre解决了通过正态分布作近似计算,首次提出正态密度的形式(但只作为一个数学函数而非概率分布,故一般不以他作为正态分布的发现人)。
De Moivre的工作及其他问题的考虑,使Laplace在1780年左右发现了中心极限定理的简单形态。这个定理对正态分布在统计推断中的核心作用有极大的影响,并成为现代数理统计学的一根支柱。
20世纪上半叶(狭义的可说20世纪二、三十年代)奠定现代数理统计学的基础和框架。20世纪上半叶(狭义的可说20世纪二、三十年代)奠定现代数理统计学的基础和框架。 • 到20世纪初,统计学在方法上已积累了不少成果,但是 • 没有“专职”的统计学家,都是其他实用学科的学者为处理自己工作中的数据分析问题而去研究统计方法,因此 • 内容缺乏系统性、普遍性,不少就事论事的性质。 • 缺乏一个基本的数学框架,许多基本概念没有确立,或有不少含糊的地方。 四.现代数理统计学的基础和框架
因此不能认为到那时为止这门学科在现代意义上已经确立,但所积累的材料,以及20世纪初以来的一大批学者,包括因此不能认为到那时为止这门学科在现代意义上已经确立,但所积累的材料,以及20世纪初以来的一大批学者,包括 K.Pearson (1857-1936) R.A.Fisher (1890-1962) J.Neyman (1895-1981) E.S.Pearson (1894-1980) 的出现,为解决这一问题创造了条件,其中尤以Fisher起的作用最大,他 • 发现了一大批直到现在仍常用的统计方法
在《Mathematical Foundations of Theoretical Statistics》(1921)《Theory of Point Estimation》(1925)等著作中,树立了目前基本上仍在沿用的统计理论框架和基本概念。 Neyman和E.S.Pearson则引进了“假设检验”有关的基本统计概念和严格理论。特别是,第一次将一个统计问题化为“数学优化问题”。其思想在A.Wald(1900-1950)的著作《Statistical Decision Functions)(1950)中得到发展,成为数理统计学中一大重要学派,并在有关经济决策的问题中得到应用。
1950年以来,数理统计学研究中的“纯数学”气味愈来愈重。早期发展中那种密切结合实际的特点有了削弱,产生了一大批对数据分析无用、缺乏统计意义而在数学上也缺乏深度的研究论文,原因:1950年以来,数理统计学研究中的“纯数学”气味愈来愈重。早期发展中那种密切结合实际的特点有了削弱,产生了一大批对数据分析无用、缺乏统计意义而在数学上也缺乏深度的研究论文,原因: • 数学学科有产生“内生性问题”的倾向和特点。 • Neyman在1938年由英国转往美国工作,成为美国统计学的带头人(战后美国成为世界统计学的中心,而Neyman特重视数学的严谨性) 五.数理统计学“数学化”趋势的发展及其反响
战后早期,数理统计学的数学框架建立不久,由不少粗糙与不完善之处,需要发展。这走过头就产生不切实用的内生性问题。战后早期,数理统计学的数学框架建立不久,由不少粗糙与不完善之处,需要发展。这走过头就产生不切实用的内生性问题。 • 建立在严格的抽样分布基础上的“小样本方法”初期在正态假定下取得成功后,陷于停滞。统计学家不得已转向“大样本方法”——基于观测数据个数趋于无穷大时统计方法的极限性质。这里面数学施展的余地大,于是统计研究者竞相趋往。但在现实应用中,观测数据量总是有限的,而“大样本理论”中得出的结果多不能明示由这种取极限带来的错误,使其实际意义减小。
这种情况导致了统计研究中的一些不良倾向: • 提问题惯于从预设的模型出发而忽视对数据的分析; • 把对纯数学工作的评价标准用于统计学,其应用性受到忽视。 自1960年代以来,有一些重要学者开始站出来批评这种倾向。有的甚至发出统计学发展出现危机的呼声。以后不断有人提出“统计发展新道路”的设想。最有影响的是“数据分析”的提法。
Tukey(曾任美总统科学顾问)1962年的文章《The Future of Data Analysis》是首篇有份量的文献,哲学性大于方法性。主要论点是要明确数理统计学是一门与数据打交道的科学,而不是以证明抽象的数学定理为主要目的。数学模型应产生于对数据和对问题的实际背景的分析,而非出于闭门造车。对现行数理统计学的结果,只有当其对数据分析有用时,才能被列入“数据分析”这门学科的内容。在具体研究工作上,他提出 • 寻求值得研究的全新的问题;
在更现实的框架下研究老问题 他当时提到的几个例子: • 用模拟方法研究非正态小样本性质 • 稳健方法(Robustness) • 多响应数据(Multi-response Data) • 多阶段选择问题 • 非齐性数据 针对统计学这门学科的性质,他提出: • 判断(judgment)重于证明,有用性重于严谨性; • 统计学是一门科学而非一门数学。
P.J.Huber在其97年文章中指出,Tukey此文(长达67页)至今仍很有兴趣。此文是了解当代统计思潮和数据分析的一个很好的出发点。P.J.Huber在其97年文章中指出,Tukey此文(长达67页)至今仍很有兴趣。此文是了解当代统计思潮和数据分析的一个很好的出发点。 (Tukey此文刊于Ann.Math.Statist.1962,P.1—67) “统计学的未来”开始成为讨论的主题。 Madison Conference (1967):The Future of Statistics
Tukey:不赞成统计必须“Trying to be certain about uncertainty” • G.E.P.Box:由于争取做第一流统计学家,结果成了第二流数学家。 • LeCam:觉得近年来统计学发展不如以前。 • Edmonton Conference(1974):The directions of statistics.
Pyke提出一些建议: • 拆墙(系、刊物、学会等); • 检验模型的适用性(不为图简便而从既定模型出发); • 研究有现实意义的更难问题,不满足于简单模型下的明显解法(模型复杂了,数学研究难以入手,也不易取得深入的成果); • 只发表有用的文章; • 开放学会,鼓励不同领域学者的讨论; • 改革统计教学。
H.Robbins:统计学往何处去? “过去重视细节,对社会要求漠不关心,造成统计学今日的面貌且在很大程度上决定了其未来。” “以往统计学家从各种应用学科角度创立其统计方法,对未来我主张(继续这一优良传统)多研究有用的实际问题,少些教条主义。”
P·J·Huber:许多数理统计问题达到成熟且挤干了,而最有希望的方向是数据分析。到如今,数据分析未达到预期的进展程度,它的主要进步在计算方法上,从数学角度看进展很少。P·J·Huber:许多数理统计问题达到成熟且挤干了,而最有希望的方向是数据分析。到如今,数据分析未达到预期的进展程度,它的主要进步在计算方法上,从数学角度看进展很少。 • David Report:Renewing U.S. Math. Mentions the increased role of probability analysis as one of the four prominent intellectual trends in math research.(另外三个是离散数学、非线性数学和科学计算),并指出数据分析是数学应用推广的两个 主要因素之一(另一个是数学教育)。
推断统计回归描述统计?比较一致认同的意见是对过去几十年来数理统计学的发展状况不满意,表现有:推断统计回归描述统计?比较一致认同的意见是对过去几十年来数理统计学的发展状况不满意,表现有: • 过于数学化,理论研究与实践脱节; • 从既定模型出发者多,对数据的作用重视不够; • 简单模型研究的多,而对有实用意义的复杂模型研究的少; • 统计学家与实用部门的联系减少; 小 结
但对于“to be certain about uncertainty”的看法,则存在分歧,有的学者认为否定统计这一特性等于回复到描述统计;而另一些学者,例如Huber,则径直承认这一点,鼓吹统计回归以前描述统计的传统,这可看作统计发展史中的第二个否定。具体主张就是数据分析。
Huber在83年于Berkeley举行的纪念Neyman和Kiefer的会议上作了题为“Data analysis in search of identity”的报告,显示“数据分析”尚无明确的定位。 • Tukey在其62年文章中提出Data Analysis: • 包含一切现行统计方法,但没有任何潜在应用价值的纯数学研究除外,对这类工作应当以纯数学的标准去评价之。 • 不一定坚持“to be certain about uncertainty” 六.动向之一: 数据分析
在78年的文章中,Tukey又说Data analysis: ⒈ is a name that allows us to use probability where it is needed,and avoid it when we should. ⒉ has to analyze real data —— data investigation and not only data processing . Data Processing: 既定方法 数据 结果
Data investigation: 数据 ○ ○ ○ ○结果 ○:人的判断和选择 他认为: • 统计理论有重大作用,但只在于指导data investigation的一部分工作。 • 问题的现实解与理论解不是一回事。例: • 薄壳理论的研究结果不一定都适用于建筑设计。 ○
虽然球形容器最省料,实际容器不一定做成球形。虽然球形容器最省料,实际容器不一定做成球形。 • 推销员路线问题的实际解决要考虑到航班的安排等等。 数据分析与传统的统计理论的关系,正与此同。 除上述以外,数据分析 • 重视稳健性大于重视效率(效率多与一定模型联系,不一定现实,而实际数据中总包含一些异常值)。 • 提倡使用“loose”和“adhoc”方法,不拘泥于程式化。 • 更多的是一种art,对待问题的态度,而不单纯是一种method。
可以看出,哲学或原则性的议论多于方法的指引(早期的数据分析著作都有这一特征。如Tukey的《Exploratory data analysis》(探索性数据分析,Addison-Wesley,1970)。但是,近年来统计应用中一些现象表明,在大量数据的处理中,一种不拘泥于传统模式,而是利用计算机处理速度、模拟和图式的功能,结合一些简单易行(易为应用者理解与接受)的富有稳健性(抗错误性)的统计方法,可能在日后大行其道。若如此,则在一定程度上实现了“数据分析者的理想”。
然而,总有不少问题(如可靠性试验),其数据量很小,若不采用有力的模型(正态、指数、Weibull之类),统计分析将无从下手。数据分析中提倡的那种“loose”的处理方法,意味着信息量的大量损失,而使分析的结果失掉意义。然而,总有不少问题(如可靠性试验),其数据量很小,若不采用有力的模型(正态、指数、Weibull之类),统计分析将无从下手。数据分析中提倡的那种“loose”的处理方法,意味着信息量的大量损失,而使分析的结果失掉意义。 • 因此,传统的统计方法,在可预见的将来,仍会有一席位置。
这是Huber提出的一种看法(Speculation on the path of statistics,1997),意思是统计这个“大国”将会分裂为一些“小国”,即与专门学科相结合而形成自己独特的理论和方法(金融统计、生存统计、生物统计、工业统计、教育统计、社会统计之类)。 七.动向之二: 统计学的巴尔干化
他说: • 其次,绝大多数数据分析是由非统计学家做的,他们使用种种语言,结果是许多实用领域发展了自己的version of statistics 及自己专门的统计刊物,这造成统计学的巴尔干化。 • 对这种趋势一般统计学家是持正面态度的,目前也不认为这必然导致“一般统计学”的消亡;或者主张“寓发展一般统计学于特殊应用领域中”;以及“总还存在一些公共性质的问题”(如Bayes),这种观点的警世意义是,那种抽象地,不与任何实际领域联系去研究统计的做法的出路恐怕愈来愈窄了。
当然,也有很多学者不认同“巴尔干化”的提法。他们认为,交叉学科的兴起,不过是反映了统计应用深入到各个领域,而这种深度的应用,要求统计学者能深入到一个领域,具备与该领域的专家合作与对话的能力。这一点,不论统计学未来的发展方向持何种看法,都是正确的。事实上在西方,那种只懂得数学,纯粹从数学的角度去研究统计学的人,在整个统计学家队伍中所占的比重已经很低。当然,也有很多学者不认同“巴尔干化”的提法。他们认为,交叉学科的兴起,不过是反映了统计应用深入到各个领域,而这种深度的应用,要求统计学者能深入到一个领域,具备与该领域的专家合作与对话的能力。这一点,不论统计学未来的发展方向持何种看法,都是正确的。事实上在西方,那种只懂得数学,纯粹从数学的角度去研究统计学的人,在整个统计学家队伍中所占的比重已经很低。
另外,也有一些学者提出在现行统计学的框架内发掘一些新的生长点(有意义的研究方向)。如关于Fisher统计学遗产的再认识,条件统计推断,非参数Bayes统计,对一些老问题给以更有意义的提法及从新的角度去进行研究等。另外,也有一些学者提出在现行统计学的框架内发掘一些新的生长点(有意义的研究方向)。如关于Fisher统计学遗产的再认识,条件统计推断,非参数Bayes统计,对一些老问题给以更有意义的提法及从新的角度去进行研究等。