310 likes | 450 Views
第二节 统计整理. 一、统计数据整理的意义和内容 (一)统计数据整理的意义 根据统计研究目的和任务,对统计调查或科学试验所获得的原始数据进行科学分类、汇总计算,或对次级资料进行再加工,使之生成系统化、条理化、标准化来反映总体数量特征与数量关系的操作过程。 通过统计调查或科学试验所获得的原始数据只能说明总体各单位的具体情况,不能反映总体综合特征。因此,必须通过科学整理才能成为统计信息。. (二)统计数据整理的内容与步骤 1. 设计整理方案 主要明确规定出统计分组的方法和要汇总的统计指标与指标体系。
E N D
第二节 统计整理 一、统计数据整理的意义和内容 (一)统计数据整理的意义 根据统计研究目的和任务,对统计调查或科学试验所获得的原始数据进行科学分类、汇总计算,或对次级资料进行再加工,使之生成系统化、条理化、标准化来反映总体数量特征与数量关系的操作过程。 通过统计调查或科学试验所获得的原始数据只能说明总体各单位的具体情况,不能反映总体综合特征。因此,必须通过科学整理才能成为统计信息。
(二)统计数据整理的内容与步骤 1.设计整理方案 主要明确规定出统计分组的方法和要汇总的统计指标与指标体系。 2.资料审查 主要审核原始资料的准确性和完整性。 3.资料分组 根据统计研究的要求,按照选定的分组标志,将审核后的原始数据进行分类或分组。 4.汇总与计算 对分组后的数据进行汇总与计算。 5.编制统计表,绘制统计图
二、统计分组 (一)统计分组的概念 根据统计研究的要求,按照选定的分组标志,将审核后的原始数据进行分组或分类。 统计分组应遵循“相同者合并,不同者分开”的原则,将相同性质的个体划在同一组内,不同性质的个体划入不同组内,组与组之间的性质是不同的。 理解统计分组的概念要明确以下三点: 1.统计分组的对象是总体; 2.应有分组标志; 3.对总体是“分”,对总体单位是“合”。
(二)统计分组的作用 1.划分现象的类型;2.显示内部结构;3.分析依存关系。 某企业职工情况
(三)统计分组方法 统计分组的关键是选择分组标志与划分各组界限。选择分组标志是确定不同组的标准和依据;划分各组界限是确定相邻组的性质界限或数量界限。 1.按品质标志或数量标志分组 按品质标志分组就是用反映事物属性、性质的标志分组。例如,职工按职称分组、企业按部门分组、学生按性别分组,等等。 按数量标志分组是用事物的量作为分组标志,它可以是绝对数、相对数或平均数。
2.按离散变量或连续变量分组 它是根据变量取值类型来分组。离散变量分组,如企业按机器台数分组、旅馆按客房间数分组、医院按病床数分组,等等。 连续变量分组,如商店按销售额分组、工厂按产值分组,等等。 3.简单分组和复合分组 简单分组是按一个标志分组;复合分组是按两个或两个以上标志分组。
三、变量分布数列 (一)变量分布数列的概念 统计分组的过程就是变量分布数列生成的过程。如图2-3。 ▲ ● ● ▲ ● 分组 ● ● ● ● ● ● ● ● ● ▆ ● ● ▆ ● ▆ ▆ ▆ ▆ ▆ ▆ ▆ ▆ ● ▆ ▆ ▆ ● ▲ ▲ ▲ ▲ ● ▆ ▆ ▆ 变量分布数列 总体 图 2-3 分布数列生成过程 将组别依次排列,同时列出各组单位数(频数)便生成变量分布数列。它有表格与图示两种显示方式。
(二)变量分布数列的编制方法 1.单项式变量分布数列的编制方法 单项数列是把每个变量值作为一组所生成的数列。例如,某生产组20名工人同种产品日产量如下(单位:件): 16 13 18 15 19 14 17 13 15 17 19 15 17 18 14 16 15 16 17 16 这是一个离散型变量,变量值不多、变动范围不大,宜编制单项式变量分布数列。 (1)按变量值大小顺序排列: 13 13 14 14 15 15 15 15 16 16 16 16 17 17 17 17 18 18 19 19 (2)每种变量值为一组(重复者只取一个)顺序排列: 13 14 15 16 17 18 19 七组 (3)列入表中并汇总计算各组频数,如表2-4所示。
2.组距变量数列的编制方法 例如,某班40名学生某科某次考试成绩如下: 54 60 62 97 85 52 83 79 95 80 89 85 77 68 86 93 70 81 78 89 71 89 80 85 75 78 90 66 78 73 82 82 99 77 88 84 75 88 76 80 试编制等距数列。 (1)将数据顺序排列,并判断变量性质。 52 54 60 62 66 68 70 71 73 75 76 77 77 78 78 78 79 80 80 80 81 82 82 83 84 85 85 85 86 88 88 89 89 89 89 90 93 95 97 99 变量性质为连续变量,宜编制组距式变量数列。
(2)计算全距 全距 = 最大变量值-最小变量值 该班成绩全距 = 99–52 = 47(分) (3)确定组限、组距和组数 组限是指每组的两端变量值,每个组的起点值称为下限,每个组的终点值称为上限。 组距是指上限值与下限值之差,即组距 = 上限值-下限值。 组数是指变量数列应划分为多少个组。 确定组距与组数的具体方法如下: 所使用的全距最小值应略低于实际资料的最小值,自50分开始,最大值应略高于实际资料最大值,最大值取100分。则本例全距为100-50 = 50。 若组距为5,则 组数 = 全距 ÷ 组距 = 50 ÷ 5 = 10 (组) 若组距为10,则 组数 = 50 ÷ 10 = 5 (组) 本例采用组距为10,组数为5。
(4)列表汇总计算 汇总计算要遵循“不重不漏”的原则。 连续型变量数列相邻两组的组限采用“重限分组”的方法, 即相邻两组之间的组限用同一个数值标记。为了处理好恰巧是组限的变量值的总体单位的归属问题,应按“不含上限,含下限”的原则处理。例如,60分者应归入60~70组中,70者应归入70~80组中, 80分者应归入80~90组中, 90分者应归入90~100组中。如表2-5所示。 表2-5 40名学生成绩整理表
将整理表编制成正式表,如表2-6所示。 表2-6 40名学生成绩统计表 组中值是每组的中点数值,计算方法(上限+下限)÷ 2 。如,(50+60)/2 = 55 、(60+70)/2 = 65 、(70+80)/2 = 75 、 (80+90)/2 = 85 、(90+100)/2 = 95 等。
3.开口组变量分布数列的编制 当变量值中有特大或特小的极端值出现时,为避免出现空白组或个别极端值被遗漏,最小组和最大组可采用开口组办法解决,即“╳╳以下”、“╳╳以上”。并以相邻组组距作为其组距。 例如,某班40名学生某科某次考试成绩如下: 36 56 60 60 64 64 64 68 68 68 70 70 75 75 75 75 78 78 78 78 78 78 79 79 79 79 84 84 85 85 88 88 89 89 89 89 95 95 98 100 编制等距变量数列如表2-7所示。
表2-7 40名学生成绩统计表(开口式) 两个开口组均用邻组组距,即均为10。 60以下组组中值为:上限–邻组组距÷2 = 60–10÷2 = 55 90以上组组中值为:下限+邻组组距÷2 = 90 + 10÷2 = 95
四、统计数据的显示 统计数据的显示方法有表格法与图示法两种形式。 (一) 统计表 1.统计表的意义 将汇总得到的统计数据按一定顺序排列在表格中,这种表格称为统计表。 2.统计表的结构 (1)形式上:总标题、横行标题、纵栏标题、数字资料。 (2)内容上:主词栏、宾词栏。 (3)举例:见表2-8、表2-9。
总标题 表 2-8 2003年社会消费品零售总额 纵栏 标题 横行 数字 标题 资料 主词 宾词
总标题 表2-9 全国税收收入及其构成表 (2003年) 纵栏 标题 横 指 行 标 标 数 题 值 主词栏 宾词栏
3.统计表的种类 (1)按作用 调查表 分 类 汇总表(整理表) 分析表 (2)按主词 简单表 分 类 分组表 复合表
(3)举例: ①简单表,主词未经分组,只排列空间顺序如表2-10所示。 表2-10 某年某进出口公司商品收购计划完成情况(单位:万元)
统计表的主词按时间顺序排列的简单表,如表2-11所示。统计表的主词按时间顺序排列的简单表,如表2-11所示。 表2-11 某年某企业增加值统计表(单位:百万元)
③复合表:主词按两个或两个以上标志分组的统计表,③复合表:主词按两个或两个以上标志分组的统计表, 如表2-13所示。 表2-13 某年某校在校生人数统计表
在复合分组表中设计横行标题时,应在第一次分组的各组组别下退一、二字填写第二次分组的组别,此时第一次分组的组别就成为第二次分组的个组小计。若需再进行第三、四次分组,均可按此类推。如表2-14所示。在复合分组表中设计横行标题时,应在第一次分组的各组组别下退一、二字填写第二次分组的组别,此时第一次分组的组别就成为第二次分组的个组小计。若需再进行第三、四次分组,均可按此类推。如表2-14所示。 表2-14 国内生产总值统计表
(3)宾词设计分类 按排列形式分类:简单排列、分组排列、层叠排列。 ①简单排列:宾词不加任何分组,按项目或时间排列。 如表2-15所示。 表2-15 某地区工业企业主要经济指标统计表
②平行排列:宾词各栏平行设计,如表2-16、2-17所示。②平行排列:宾词各栏平行设计,如表2-16、2-17所示。 表2-16 各地社会商品零售总额统计表(单位:亿元)
表2-17 某商厦三个商场职工性别和年龄构成统计表
③层叠排列:两个或两个以上标志分组后上下层叠起来列示。如表2-18、2-19所示。③层叠排列:两个或两个以上标志分组后上下层叠起来列示。如表2-18、2-19所示。 表2-18 1998-2002年农村劳动力分布情况
表2-19 某商厦三个商场职工性别和年龄构成统计表 (二)统计图 利用几何图形或具体形象来显示统计数据,按表现形式分为几何图、象形图、统计地图等形式。这里不作深入介绍。
本节小结: 数据审核 按标志 品质标志分组 种类分 数量标志分组 统计分组 数据 按标志 简单分组 整理 数据 数量分 复合分组 处理 品质数列 分布数列 单项数列 变量数列 等距数列 组距数列 统计表 异距数列 数据显示 统计图