600 likes | 793 Views
统计学导论. 湖南大学 金融与统计学院. 主要教学用书. 曾五一,肖红叶 主编 《 统计学导论 》 ,科学出版社, 2008.1 ( 普通高等教育 “ 十一五 ” 国家级规划教材 ); 袁卫,庞皓,曾五一,贾俊平主编 《 统计学 》 (第三版),高等教育出版社, 2009.7 ( 面向 21 世纪课程教材 ). 拟讲授的内容. 第一章 绪论 第二章 数据的收集、整理与显示 第三章 数据分布特征的描述 第四章 概率基础 第五章 抽样分布与参数估计 第六章 假设检验 与方差分析 (不讲) 第七章 相关与回归分析 第八章 非参数检验 (不讲)
E N D
统计学导论 湖南大学 金融与统计学院
主要教学用书 • 曾五一,肖红叶 主编《统计学导论》,科学出版社,2008.1(普通高等教育“十一五”国家级规划教材); • 袁卫,庞皓,曾五一,贾俊平主编《统计学》(第三版),高等教育出版社,2009.7(面向21世纪课程教材)
拟讲授的内容 第一章 绪论 第二章 数据的收集、整理与显示 第三章 数据分布特征的描述 第四章 概率基础 第五章 抽样分布与参数估计 第六章假设检验与方差分析(不讲) 第七章 相关与回归分析 第八章 非参数检验(不讲) 第九章 时间序列分析 第十章 对比分析与指数分析 第十一章 统计决策(不讲) 第十二章 统计综合评价 注:这些“不讲”的章节并非不重要,而是因为时间不够,而且在高年级有些课程还会专门学习。
拟讲授的内容 • 对应袁卫等主编《统计学》的章节: 第1章 数据与统计学 第2章 统计数据的描述 第3章 概率、概率分布与抽样分布 第4章 参数估计 第5章 假设检验 第6章 方差分析与试验设计(不讲) 第7章 相关与回归分析 第8章时间序列分析与预测 第9章 统计指数 第10章 国民经济统计基础知识(不讲)
第一章 绪论 • 第一节 什么是统计 • 第二节 统计学的种类及其性质 • 第三节 统计学的基本概念(重点) 学习要求:系统地看书,刚开始学习时,能达到似懂非懂就行。
第一节 什么是统计 一、统计(Statistics)的涵义 • 统计是人们认识客观现象总体数量变动关系和变动规律的实践活动的总称,是人们认识客观世界的一种有力工具。 • 注意:教材(袁卫等主编《统计学》)的定义是“统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据内在的数量规律性”;并且对于“什么是数据内在的数量规律性”给出了很多很好的例子(见P2-3例1.1-例1.6)。
可见,统计的研究对象具有以下特点: (1)数量性。统计是用数据来说话的(“数据的科学”),统计数据是客观事物量的反映。 (2)总体性。统计研究同类现象总体的数量特征。换句话说,它通过对总体中各单位普遍存在的事实进行大量观察和综合分析,得出反映总体的数量特征。 (3)变异性。总体中各单位的特征表现往往存在着差异,而且这些差异并不是事先可以预知的。
日常生活中,“统计”的3种含义 • 统计工作:又称统计实践活动,是搜集、整理、分析和提供关于社会经济现象的数字资料工作的总称。 • 英文中的统计statistics与“国家”同一词根,可以说,自从有了国家,就有统计实践活动。 • 统计数据:是统计实践活动的成果。 • 如:经济增长速度、价格指数等。 • 对统计数据的要求:客观性、准确性和及时性。 • 统计学:是在统计实践的基础上发展起来的一门科学。它是研究如何收集、整理、归纳和分析反映客观现象总体数量的数据,以便给出正确认识的方法论科学。
日常生活中,“统计”的3种含义 • 统计实践活动、统计数据和统计学三者之间的关系: • 统计实践活动与统计数据的关系是工作过程与工作成果的关系; • 统计学与统计实践活动的关系是理论与实践的关系,理论源于实践,理论又高于实践,反过来又指导实践。
二、统计研究的基本环节(袁卫等《统计学》没有!)二、统计研究的基本环节(袁卫等《统计学》没有!) 统计设计 统计调查科学实验 统计学理论与相关实质性学科理论 描述统计 推断统计 收集数据 整理与分析 统计方法与统计资料 相关实质性学科理论 资料积累 开发应用
统计研究的全过程包括以下基本环节: (一)统计设计 • 根据所要研究问题的性质,在有关学科理论的指导下,设定统计指标、指标体系和统计分类,给出统一的定义、标准;同时提出收集、整理和分析数据的方案和工作进度等。 • 搞好统计设计,不仅要有统计学的一般理论和方法为指导,而且还要求设计者对所要研究的问题本身具有深刻的认识和相关的学科知识。
(二)收集数据 • 统计数据的收集有两种基本方法: • 对于大多数自然科学和工程技术研究来说,有可能通过有控制的科学实验去取得数据。 • 对于社会经济现象来说,一般无法进行重复实验,要取得有关数据就必须进行统计调查。
(三)整理与分析 • 原始的统计数据收集上来后,还必须进行整理和分析。所运用的方法包括:描述统计和推断统计。(参见袁卫等《统计学》P5-6) • 描述统计(descriptive statistics)是指对采集的数据进行登记、审核、整理、归类,在此基础上进一步计算出各种能反映总体数量特征的综合指标,并用图表的形式表示经过归纳分析而得到的各种有用的统计信息。 • 推断统计(inferential statistics)是在对样本数据进行描述的基础上,利用一定的方法根据样本数据去估计或检验总体的数量特征。推断统计是现代统计学的主要内容。
(四)统计资料的积累、开发与应用 • 统计资料的提供并不意味着统计研究的终结。对于已经公布的统计资料需要加以积累,同时还可以进行进一步的加工,结合相关的实质性学科的理论知识去进行分析和利用。 • 如何更好地将统计数据和统计方法应用于各自的研究领域,是应用统计学研究的一个重要方面。
第二节 统计学的种类及其性质 一、统计学的产生与发展(教材P4-5的说法不同) • 统计学作为一门学科,从产生至今已有300多年的历史。从统计学的发展历史来看,曾经产生过较大影响的主要有以下几个流派: (一)政治算术学派 • 最早的统计学源于17世纪英国的政治算术。其代表人物是威廉·配第(William Patty,1623-1687年)和约翰·格朗特(John Grant,1620-1674年)。 • 佩第的代表作《政治算术》(1676年);格朗特的代表作《对死亡表的自然观察和政治观察》(1662年) • 政治算术学派主张用大量观察和数量分析等方法对社会经济现象进行研究的主张,为统计学的发展开辟了广阔的前景。
(二)国势学派 • 最早使用“统计学”这一术语的是德国国势学派的阿亨瓦尔(G.Achenwall,1719-1772)。 • 国势学派虽然创造了统计学这一名词,但他们主要使用文字记述的方法对国情国力进行研究,其学科内容与现代统计学有较大的差别。
(三)社会统计学派 • 代表人物是德国的统计学家克尼斯(K.G.A. Knies)。他在1850年发表了题为《独立科学的统计学》的论文,提出统计学是一门独立的社会科学,是一门对社会经济现象进行数量对比分析的科学;他主张以“国家论”作为国势学的科学命名,而以“统计学”作为“政治算术”的科学命名。 • 在德国、日本和前苏联,社会统计学派曾经有相当大的影响。
(三)社会统计学派 • 社会统计学派注重对社会经济领域的统计方法及其应用进行研究。他们在社会经济统计指标的设定与计算、指数的编制、资料的收集与整理、统计调查的组织和实施、经济社会的数量分析和预测等方面做出的贡献,已成为现代统计学的重要组成部分。 • 如,“恩格尔系数”至今仍为人们广泛使用; • GDP的核算被称为“20世纪最伟大的发明之一”
(四)数理统计学派 • 创始人是比利时统计学家阿道夫·凯特勒(Adolphe Quetelet,1796—1874)。 • 他的代表作《概率论书简》、《社会物理学》,将概率论引入社会经济方面的研究。 • 在学科性质上,凯特勒认为统计学是一门既研究社会现象又研究自然现象的方法论科学。 • 从19世纪中叶到20世纪中叶,数理统计学得到迅速发展。(参见袁卫等《统计学》P5) • 数理统计学派是英美等国统计学界的主流。
二、理论统计学和应用统计学(参阅教材P7) • 目前,统计学已经发展成为横跨社会科学和自然科学领域的多科性的科学。 • 从横向看,各种统计学作为一个学科家族,都具有下列共同点——“统计学是有关如何收集、整理、归纳和分析反映客观现象总体数量的数据,以便给出正确认识的方法论科学”。 • 从纵向看,统计学方法应用于各种实质性科学,同它们相结合,产生了一系列专门领域的统计学。
二、理论统计学和应用统计学 • 可见,现代统计学可以分为两大类: • 一类是以抽象的数量为研究对象,研究一般的收集数据、整理数据和分析数据方法的理论统计学。 • 另一类是以各个不同领域的具体数量为研究对象的应用统计学。 跳过
理论统计学 • 理论统计学把研究对象一般化、抽象化,以数学中的概率论为基础,从纯理论的角度对统计方法加以推导论证,其中心内容是以归纳方法研究随机变量的一般规律。 • 理论统计学的特点是计量不计质,它具有通用方法论的理学性质。
应用统计学 • 应用统计学从所研究的领域或专门问题出发,视研究对象的性质采用适当的指标体系和统计方法,解决所需研究的问题。 • 应用统计学不仅要进行定量分析,还需要进行定性分析。所以,应用统计学通常具有边缘交叉和复合型学科的性质。
在统计学科的发展道路上,理论统计学和应用统计学总是互相促进、共同提高的。在统计学科的发展道路上,理论统计学和应用统计学总是互相促进、共同提高的。 • 理论统计学的研究为应用统计学的数量分析提供方法论基础,大大提高了统计分析的认识能力; • 而应用统计学在对统计方法的实际应用中又常常会对理论统计学提出新的问题,开拓了理论统计学的研究领域。
社会经济统计学(☆) • 社会经济统计学是一门以社会经济现象的数量方面为特定研究对象的应用统计学。 • 要在社会经济领域应用统计方法,必须解决如何科学地测定社会经济现象即如何科学地设置指标的问题,这就离不开对有关社会经济现象的质的研究。 • 要对社会经济问题进行统计分析,也必须以有关的经济与社会理论为指导。 • 因此,社会经济统计学的特点是在质与量的紧密联系中,研究事物的数量特征和数量表现。 返回
社会经济统计学(☆) • 不仅如此,由于社会经济现象所具有的复杂性和特殊性,社会经济统计学不仅要应用一般的统计方法,而且还需要研究自己独特的方法,如核算的方法、综合评价的方法等等。
社会经济统计学(☆) • 社会经济统计的重要性体现在,通过社会经济统计: • 国家可以准确、及时、全面、系统地掌握国民经济和社会发展情况,对国民经济和社会运行进行监督和预警,为宏观调控和决策提供依据。 • 企业可以及时了解商品市场和要素市场运行的状况和企业自身的经营动态,为企业营销决策、投资理财提供参考。 • 居民可以及时了解商品市场、汽车和商品房市场、金融市场、以及宏观经济方面的信息,作为购物、买车、买房和投资理财的依据。
三、统计学与有关学科的联系与区别(略) (一)数学与统计学的关系 • 数学与统计学的联系: • 二者都是研究数量规律的,都要利用各种公式进行运算。 • 数学中的概率论,为统计学提供了数量分析的理论基础。 • 统计学中的理论统计学以抽象的数量为研究对象,其大部分内容也可以看作是数学的分支。 跳过
三、统计学与有关学科的联系与区别 • 统计学与数学的区别: • 从研究对象看,数学以最一般的形式研究数量的联系和空间形式。统计学特别是应用统计学则总是与客观的对象联系在一起的。 • 从研究方法看,数学主要是逻辑推理和演绎论证的方法。而统计本质上是归纳的方法。统计学家特别是应用统计学家需要深入实际,进行调查或实验去取得数据,研究时不仅要运用统计的方法,而且还要掌握某一专门领域的知识。
三、统计学与有关学科的联系与区别 (二)统计学与相关实质性学科(如经济学)的关系 • 统计学与经济学的联系: • 统计学是开展经济研究不可或缺的重要工具。通过统计的实证研究,可以帮助人们认识有关的数量规律,同时检验经济学理论的真实性和完善程度。
三、统计学与有关学科的联系与区别 • 经济学等实质性学科对经济统计学起着重要的指导作用。不仅统计指标的设定离不开实质性学科的指导,而且应用统计方法也在很大的程度上受所研究对象性质的影响。 • 统计学与相关实质性学科(如经济学)的区别: • 实质性学科研究该领域现象的本质关系并对有关规律作出合理的解释和论证。 • 而统计学只是为实质性学科研究和认识数量规律提供专门的方法和工具,并不直接对规律产生的原因和机理作进一步的分析。
第三节 统计学的基本概念(重点) 一、总体与总体单位 • 统计总体(population):是根据一定目的确定的所要研究的事物的全体。它是由客观存在的、具有某种共同性质的许多个别事物构成的整体。(袁卫等《统计学》 P10的表述稍有不同) • 例如,要研究全国城镇居民家庭的收支情况,就以全国城镇居民家庭作为一个总体。
一是同质性:指构成统计总体的各单位之间应具有某种共同性质。一是同质性:指构成统计总体的各单位之间应具有某种共同性质。 • 同质性是确定统计总体的基本标准,并且根据统计的研究目的而定。 • 例如,研究城镇居民贫困户的生活状况,那么贫困线下的城镇居民户就构成了统计总体。而贫困线上的城镇居民户则不属于这个总体。 • 二是大量性:指统计总体应该由足够数量的同质性单位构成。 • 因为现象的规律只有通过大量观察才能显示出来。 • 作为统计总体,有两个基本特征:(教材没有)
总体单位 • 总体单位:是指组成统计总体的各个个体。(袁卫等《统计学》没有专门定义这个概念) • 根据研究目的的不同,总体单位可以是人、物、机构等实物单位,也可以是一种现象或活动过程等非实物单位。 • 总体和总体单位的概念是相对而言的。 • 如果研究目的改变,那么同一个研究对象,在一种情况下为统计总体,但在另一种情况下可能变成总体单位。
有限总体和无限总体 • 根据总体所包含的单位数量,总体可以分为有限总体和无限总体两类。(袁卫等《统计学》没有明确做这种区分,但P7的文字表述中有所涉及) • 由有限量的单位构成的总体,叫做有限总体。 • 当总体单位数难以确定,其数量可能是无限时,便构成无限总体。
二、样本 • 当总体单位数量很多甚至无限时,不必要或不可能对构成总体的所有单位都进行调查。 • 这时,需要采用一定的方式,从作为研究对象的总体中抽取一部分单位,作为总体的代表加以研究。这种由总体的部分单位组成的集合称为样本。(参见袁卫等《统计学》P11) • 样本是由一定数量的单位构成的,样本所包含的总体单位数称为样本容量。
三、标志(参见袁卫等《统计学》P10-11”变量”)三、标志(参见袁卫等《统计学》P10-11”变量”) • 总体各单位普遍具有的属性或特征称为标志。 • 例如,每个工人都具有性别、工种、文化程度、技术等级、年龄、工龄、工资等属性和特征,这些都是工人作为总体单位的标志。 • 标志在特定时间、地点条件下的具体表现,叫做标志表现。 • 标志分为品质标志和数量标志两种。(袁卫等《统计学》没有做这种区分,但在P16文字表述中用到了) • 品质标志表明总体单位属性方面的特征,其标志表现只能用文字、语言来描述 。如工人的性别。 • 数量标志表明总体单位数量方面的特征,可以用数值来表现。如工人的年龄。
不变标志和变异标志(袁卫等《统计学》没有做这种区分)不变标志和变异标志(袁卫等《统计学》没有做这种区分) • 在一个总体中,当一个标志在各单位的具体表现都相同时,这个标志就称为不变标志。 • 例如在工人这一总体中,“职业”是不变标志。 • 在一个总体中,当一个标志在各单位的具体表现有可能不同时,这个标志便称为变异标志。 • 例如各人的“工龄”可能表现不同,因而是变异标志。 • 不变标志是总体同质性的基础。 • 因为一个总体至少要有一个不变标志,才能够使各单位结合成一个总体。 • 作为总体,同时必须存在变异标志。 • 因为只有所研究的现象总体在各单位之间存在差异时,才需要进行统计研究。
四、统计指标与指标体系(袁卫等《统计学》没有这部分内容,但在文字表述中又反复提到“指标”二字)四、统计指标与指标体系(袁卫等《统计学》没有这部分内容,但在文字表述中又反复提到“指标”二字) • 统计研究是从登记总体单位的标志表现开始的,但最终目的是希望通过对各单位标志的具体表现进行综合来反映总体的数量特征。 • 统计指标是反映统计总体数量特征的概念和数值。 • 如:2007年中国的国内生产总值为24.66万亿元,比2002年增长65.5%,年均增长10.6%,从世界第6位上升到第4位。 • 统计指标由两项基本要素构成,即指标的概念(名称)和指标的取值。
指标的概念(名称)是对所研究现象本质的抽象概括,也是对总体数量特征的质的规定性。指标的概念(名称)是对所研究现象本质的抽象概括,也是对总体数量特征的质的规定性。 • 确定统计指标必须有一定的理论依据,使之与社会经济或科学技术的范畴相吻合。同时,又必须对理论范畴和计算口径加以具体化。 • 指标的数值反映所研究现象在具体时间、地点、条件下的规模和水平。 • 在观察指标数值时,必须了解其具体的时间状态、空间范围、计量单位、计量方法等限定,同时注意由于上述条件的变化而引起数值的可比性问题。
指标与标志的关系(袁卫等《统计学》没有这部分内容)指标与标志的关系(袁卫等《统计学》没有这部分内容) • 标志反映总体单位的属性和特征,而指标则反映总体的数量特征。 • 标志和指标的关系是个别和整体的关系。需要通过对各单位标志的具体表现进行汇总和计算才能得到相应的指标。
指标与标志的关系(袁卫等《统计学》没有这部分内容)指标与标志的关系(袁卫等《统计学》没有这部分内容) • 由于总体和单位的概念会随着研究目的的不同而变化,因此指标与标志的概念也是相对而言的。 • 例如,如果所要研究的是全国工业企业的情况,则各工业企业的职工人数、固定资产、工业增加值等都是总体单位(即各个企业)的标志; • 而如果研究目的变成研究某一工业企业的职工状况,则该企业全部职工变成一个总体,企业职工人数变成了统计指标,每个职工的文化程度、技术等级、性别、年龄等就成为标志。
数量指标和质量指标(袁卫等《统计学》没有这部分内容)数量指标和质量指标(袁卫等《统计学》没有这部分内容) • 统计指标可以分为数量指标和质量指标。 • 凡是反映现象总规模、总水平的统计指标,称为数量指标。 • 例如人口总数、企业总数、商品进出口总额等 • 数量指标也称为总量指标,用绝对数来表示。 • 凡是反映现象相对水平或一般水平的统计指标,称为质量指标。 • 例如人口密度、工人出勤率、职工平均工资等。 • 质量指标是总量指标的派生指标,用相对数或平均数来表示,以反映现象之间的内在联系、对比关系或分布的集中趋势。
统计指标体系 • 单个统计指标只反映总体某一方面的数量特征;要反映其全貌,需要设立统计指标体系。 • 统计指标体系是由一系列相互联系的统计指标所组成的有机整体,用以反映所研究现象各方面相互依存、相互制约的关系。 • 例如,价格指数体系;金融效率评价指标体系;区域经济运行质量评价指标体系 参考文献: (1)周国富:“如何构建区域经济运行质量评价指标体系”,《经济体制改革》2007.11 (2)周国富、胡慧敏:“金融效率评价指标体系研究”,《金融理论与实践》2007.8
五、统计数据 (一)变量与变量值 • 说明现象的某一数量特征的概念被称为变量(Variable),变量的具体取值是变量值。 • 显然,各种标志和统计指标都是变量。 • 例如,固定资产是一个变量,各企业固定资产的具体数值是变量值。 • 统计数据就是统计变量(包括各种标志和统计指标)的具体表现。
连续型变量和离散型变量 • 连续型变量是指变量的取值在数轴上连续不断,无法一一列举,即在一个区间内可以取任意实数值。 • 例如,气象上的温度、湿度,零件的尺寸等。 • 离散型变量是指变量的取值是整数值,可以一一列举。 • 例如,企业数、职工人数等。
(二)数据的计量尺度(袁卫等《统计学》没有这部分内容,略)(二)数据的计量尺度(袁卫等《统计学》没有这部分内容,略) • 统计数据是各种标志或统计指标的具体数量表现。 • 根据对研究对象计量的不同精确程度,人们将数据的计量尺度由低到高、由粗略到精确分为四个层次:定类尺度、定序尺度、定距尺度和定比尺度。 跳过
1.定类尺度是按照客观现象的某种属性对其进行分类。1.定类尺度是按照客观现象的某种属性对其进行分类。 • 例如,人口按性别分为男女,用“1”表示男性,用“0”表示女性。 • 注意:这一场合的所使用的数值只是作为各种分类的代码,并不反映各类的优劣、量的大小或顺序。 • 定类尺度的主要数学特征是“=”或“≠”。
2.定序尺度是对客观现象各类之间的等级差或顺序差的一种测度。2.定序尺度是对客观现象各类之间的等级差或顺序差的一种测度。 • 利用定序尺度不仅可以将研究对象分成不同的类别,而且可以反映各类的优劣、量的大小或顺序。 • 例如,学生成绩可以分为优、良、中、及格和不及格等五类。 • 在这里,定序尺度虽然无法表明一个优等于几个良,但却能确切地表明优高于良,良又高于中。 • 定序尺度的主要数学特征是“<”或“>”。
3.定距尺度是对现象类别或次序之间间距的测度。3.定距尺度是对现象类别或次序之间间距的测度。 • 定距尺度不但可以用数表示现象各类别的不同和顺序上的差异,而且可以用确切的数值反映现象之间在量方面的差异。 • 定距尺度使用的计量单位一般为实物单位(自然或物理)或者价值单位。 • 定距尺度的主要数学特征是“+”或“–”。 • 统计中的总量指标就是运用定距尺度计量的。