480 likes | 641 Views
第二章 统计数据的搜集与整理. 统计数据的搜集 统计数据的整理 统计表与统计图. 第一节 统计数据的搜集. 一、统计数据搜集的意义 统计数据搜集,即统计调查,就是把客观现象作为一个整体,按照预定的要求,采用科学的方法,对反映这个整体的各个有关标志的数值,有计划、系统、科学地进行登记,取得真实可靠的原始资料。 统计调查,在统计工作的整个过程中,担负着提供基础资料的任务,所有的统计计算和统计研究,都是在原始资料搜集的基础上建立起来的。只有搞好统计调查,才能保证统计工作达到对于客观事物规律性的认识,并从而预测未来。. 返回. 范围. 时间. 组织方式. 搜集方法.
E N D
第二章 统计数据的搜集与整理 • 统计数据的搜集 • 统计数据的整理 • 统计表与统计图
第一节 统计数据的搜集 一、统计数据搜集的意义 统计数据搜集,即统计调查,就是把客观现象作为一个整体,按照预定的要求,采用科学的方法,对反映这个整体的各个有关标志的数值,有计划、系统、科学地进行登记,取得真实可靠的原始资料。 统计调查,在统计工作的整个过程中,担负着提供基础资料的任务,所有的统计计算和统计研究,都是在原始资料搜集的基础上建立起来的。只有搞好统计调查,才能保证统计工作达到对于客观事物规律性的认识,并从而预测未来。 返回
范围 时间 组织方式 搜集方法 报告法 非全面调查 经常性调查 一次性调查 直接观察法 全面调查 统计报表 专门调查 采访法 • 二、统计数据搜集的方法 统计调查 统计调查的种类
(二)统计报表 • 1.统计报表的特点和优点 • 可以在调查进行前把报表布置到基层填报单位,以便它们根据报表的要求,及时建立健全各种原始记录,使统计报表的资料来源建立在可靠的基础上,做到资料准确、报送及时。 • 各级领导部门可以通过统计报表,经常了解经济和社会发展变化的情况。 • 便于完整地积累资料,用来进行历史对比,较有系统地分析研究经济和社会发展变化的规律性。
调查范围 报送周期 填报单位 内容和实施范围 • 统计报表的种类 日报 旬报 月报 季报 半年报 年报等 全面统计报表 非全面统计报表 统计报表 基层报表 综合报表 国家统计报表 部门统计报表 地方统计报表
1 2 统计报表制度 3 6 5 4 • 2、统计报表制度 所有报表的指标体系应注意与会计核算、业务核算的指标体系衔接,相互为用,避免重复 每张报表都要把指标内容按统一规定格式安排。同时要明确规定表名、表号、报告期别、报送单位、报送日期、报送方式、单位负责人和填表人签署等 报表表式的设计 具体说明填表的方法、指标解释、指标计算方法及有关注意事项。指标解释是一项重要内容,它具体解释指标的概念、计算范围、计算方法以及其他有关问题 明确规定每种报表的填报单位及汇总时的综合范围 大体可分为两类:一类是分组用的目录,另一类是具体项目的目录 报表指标体系的确定 报送程序包括填报单位填报报表的份数、方式和受表单位,还要规定报表报送的日期。 报表实施范围 统计目录 报表的报送程序和报送日期 填表说明
(三)专门调查 普查 普查是为了某一目的而专门组织的一次性的全面调查,一般用来搜集总体在某个时点上的精确资料。例如,人口普查、工业普查、农业普查等。普查也可以用来搜集总体在一段时期内发展过程的总量。如基本建设项目普查、出生人口总数、死亡人口总数等普查。 普查基本上有两种形式:一种是组织专门的普查机构,配备一定数量的普查人员,对被调查者直接进行调查登记。另一种是利用企业单位的原始记录和核算资料,颁发一定的调查表格,由这些企业单位根据调查要求自行填报。 必须规定普查的标准时点 统一规定调查期限 统一规定调查项目 同一种普查,尽可能按一定周期进行 什么是普查 组织形式 组织原则
重点调查 重点调查是一种非全面调查。它是在调查对象中,不是就全部单位,而只是选择其中的一部分重点单位所进行的调查。所谓重点单位;是指在总体中举足轻重的那些单位。这些单位虽可能数目不多,但就调查的标志值来说,它们在总体中却占有很大的比重,能够反映出总体的基本情况。 组织重点调查的重要问题是确定重点单位: • 重点单位选多选少,要根据调查任务确定; • 选中的单位,管理应比较健全,统计力量应比较充实,统计基础应比较巩固,这样才能准确、及时地取得资料。
典型调查 • 典型调查是一种非全面调查,它是根据调查的目的与要求,在对被调查对象进行全面分析的基础上,有意识地选择若干有典型意义的或有代表性的单位进行的调查。 • 典型调查的作用: • 可以用于研究新生事物; • 可以补充全面调查资料的不足; • 在一定条件下,可以利用典型调查资料,结合基本统计数字,估计总体指标数值。
抽样调查 抽样调查是一种非全面调查,它是从研究现象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种调查方法。 抽样调查是现代推断统计的核心,与其他非全面调查比较有三个显著特征: • 按随机原则从总体中抽取样本单位,排除个人主观意图的影响; • 以样本指标为依据推断总体或检验总体的某种假设; • 抽样调查的误差可以事先计算并加以控制。
调查的任务和目的 调查对象和调查单位 调查表 返回 调查时间 调查工作的组织实施 三、统计调查方案 根据党的方针政策和当前的政治经济任务,抓住实际上最为重要的迫切问题,从统计工作的整体出发,立足于整个国民经济综合平衡的需要、制定和检查计划的需要、,从调查对象的实际出发,把需要与可能结合起来。 调查表,就是根据调查目的所确定的具体调查项目。调查表的内容一般由表头、表体和表脚三部分组成。表头:用来表明调查的名称以及填写调查单位(填报单位)的名称、性质、隶属关系等;表体:统计调查所要说明的客观现象的项目以及这些项目的具体表现;表脚:包括调查者(填报人)的签名和调查日期等。 调查对象,就是需要调查的那些客观现象的总体,它是由性质上相同的许多调查单位所组成的。调查单位,就是所要调查的客观现象的个体所组成的整体,也就是在调查对象中所要调查的具体单位。 统计调查方案的主要内容 调查时间指调查资料所属的时间。如果所要调查的是时期现象,就要明确规定资料所反映的是调查对象从何年何月何日起到何年何月何日止的资料。如果所要调查的是时点现象,就要明确规定统一的标准调查时点。 调查工作的组织领导机构和调查人员的组织;调查的方式和方法;调查前的准备工作,包括宣传教育、干部培训、文件印刷等;调查资料的报送办法;调查经费的预算和开支办法;提供或者公布调查成果的时间。
第二节 统计数据的整理 • 一、统计数据整理意义与基本步骤 • 统计整理是统计调查的继续,统计分析的前提。统计整理,是指根据统计研究的目的,将统计调查所得的原始资料(也称初级资料)进行科学的分类和汇总,或对已经加工的综合资料(也称次级资料)进行再加工,为统计分析准备系统化的、条理化的综合资料的工作过程。作为一个相对独立的统计工作阶段来说,统计整理主要指对原始资料的整理。
统计整理的基本步骤: • 设计和编制统计资料的汇总方案 • 对原始资料进行审核 • 用一定的组织形式和方法,对原始资料进行分组、汇总和计算 • 对整理好的资料再一次进行审核,改正在汇总过程中所发生的各种差错 • 编制统计表,以简明扼要地表达社会经济现象在数量方面的有关联系
二、统计数据的分组 • (一)统计分组的概念 • 统计分组就是根据统计研究的需要,将统计总体按照一定的标志区分为若干个组成部分的一种统计方法。 • (二)统计分组的作用 • 可以将复杂的社会经济现象按照统计认识的要求区分为各个性质不同的组成部分 • 能在特殊意义上观察总体中所有个体单位在各组中的分布状态的分布特征,认识总体各组成部分的量 • 将各种性质上有关的分组资料联系起来进地统计分析,还可观察不同社会经济现象总体之间数量上的依存关系
(三)统计分组的方法 • 统计分组的关键在于分组标志的选择和各组界限的划分。 • 分组标志的选择 正确选择分组标志,一般应遵循以下原则: • 根据统计研究的目的选择分组标志 • 选择能反映所研究现象本质的分组标志
(四)统计分组的种类 • 分组标志多少 简单分组 复合分组 • 标志属性不同 品质标志分组 数量标志分组
简单分组,是指用一个分组标志对总体进行的分组。例如,为了了解企业职工总体的基本情况,可选择年龄、性别、文化程度、工龄、工种等标志分别进行分组,即属于简单分组。简单分组,是指用一个分组标志对总体进行的分组。例如,为了了解企业职工总体的基本情况,可选择年龄、性别、文化程度、工龄、工种等标志分别进行分组,即属于简单分组。 返回
复合分组,是指用两个或两个以上的标志对总体进行层叠式分组。所谓层叠式分组是指在按前一个分组标志分组的基础上,再按后一个分组标志分组。例如,为了研究我国高等院校在校学生基本情况,可以同时选择学科、层次、性别等三个标志进行复合分组。 返回 男生 女生 男生 女生 研究生 研究生 男生 女生 男生 女生 本科生 理工科 本科生 文科 男生 女生 专科生 男生 女生 专科生
按数量标志分组时,根据每组数量标志值的具体表现,又分为单项式分组和组距式分组两种。按数量标志分组时,根据每组数量标志值的具体表现,又分为单项式分组和组距式分组两种。 • 单项式分组,就是总体按数量标志分组后,每一个具体数值表示一个组。例如,对某地区居民进行调查时,将居民户按家庭人口数分组,每组标志值为1,2,3,4,5,6,7人。 • 组距式分组,是将总体按数量标志分组后,每组用两个标志值组成的区间来表示。例如,将某企业职工按工资水平分组,可分为150元以下,150~160元,160~170元,170~180元,180~190元,190~200元,200元以上几组。
三、次数分配 • (一)次数分布的概念和分类 • 在统计分组的基础上,将总体中的所有单位按组归类整理,形成总体中各单位在各组间的分布,叫做次数分布,分布在各组的个体单位数叫次数,又称频数。各组次数与总次数之比称比率,又称频率。 • 根据分组标志特征的不同,分布数列可以分为属性分布数列与变量分布数列两种。 • 按品质标志分组形成的分布数列称为属性分布数列,简称品质数列。(见表2.1)
按数量标志分组形成的分布数列称为变量分布数列、简称变量数列。例如,某电业局发电厂按拥有发电机组的套数分组,可编成如下变量数列:按数量标志分组形成的分布数列称为变量分布数列、简称变量数列。例如,某电业局发电厂按拥有发电机组的套数分组,可编成如下变量数列: • 表2.4
(二)变量数列的编制 • 按数量标志分组的分布数列即为变量数列。变量数列又可分为单项变量数列和组距变量数列两种。 • 单项变量数列:单项式分组形成的分布数列。单项变量数列简称单项数列,又称分组数列。如表2-5所示 • 组距变量数列:组距式分组所形成的分布数列。组距变量数列简称组距数列。如表2-6所示
在组距数列中,需要明确以下几个概念: • 组限:组距数列中,各组的界限称为组限。组限又分为上限和下限。下限是每组最小的标志值,上限是每组最大的标志值。如上表中标志值150—160元一组,150元和160元是组限,150元为下限,160元为上限。 组距数列中,如果各组的组限都齐全,称为闭口组;若组限不齐全,即最小组缺下限或最大组缺上限,或最小组的下限、最大组的上限都缺,称为开口组。缺下限或缺上限称半开口组,下限、上限都缺称全开口组。
组距:每组下限与上限之间的距离叫组距。每组组距等于上限与下限之差,即组距=上限-下限。上表中标志值150~160元组的组距=160元-150元=10元。组距:每组下限与上限之间的距离叫组距。每组组距等于上限与下限之差,即组距=上限-下限。上表中标志值150~160元组的组距=160元-150元=10元。 组距又有两种表现形式:一种是各组组距都相等,称为等距。这样的组距数列称为等距数列。如表2-6即为等距数列。一种是各组组距不完全相等,称为异距。这样的组距数列称为异距数列,也称不等距数列。
开口组的组中值如何计算? • 组中值:每组下限与上限之间的中点数值叫组中值。组中值等于下限与上限和的一半。 如上表2-6,标志值150~160元组
若将表2-6第一组改为“160元以下”,则 若将表2-6最末组改为“200元以上”,则
下面举例说明变量数列的编制方法 • 现举例说明编制等距数列的步骤与原则。设有50名工人某月份完成生产定额的原始资料如下(单位:%): • 95 91 114 110 118 133 121 146 117 125 • 108 105 110 107 137 120 145 125 136 127 • 121 118 103 115 115 141 117 123 118 129 • 136 101 98 113 113 114 119 126 120 93 • 122 108 101 105 125 116 122 132 128 127
第一步,在全部标志值中,找出最小值与最大值,计算全距。以上资料中,最小值为91,最大值为145,则:第一步,在全部标志值中,找出最小值与最大值,计算全距。以上资料中,最小值为91,最大值为145,则: • 全距=最大值-最小值=145-91=54 • 第二步,确定组距和组数。对于同一资料,在全距一定的情况下,组数与组距成反比例关系,即
在实际统计工作中,组限的表示方法常用的有如下两种形式:在实际统计工作中,组限的表示方法常用的有如下两种形式:
第一种形式称为名义组限,适用于离散变量分组的数列。如企业按“职工人数”分组。人数只能取整数,相邻两组的上限与下限之间不会有别的数值存在,在汇总各组单位数量时,不至出现麻烦。如果用这种形式表示连续变量分组的数列时,则每组的上、下限所表示的是实际值精确至最近整数的数值。例如,有某总体单位的标志值为89.5,就把该数值四舍五入为90而属于90-99这一组。这就是说,90-99这一组实际上包括了89.5-99.499之间的所有标志值,依次类推。第一种形式称为名义组限,适用于离散变量分组的数列。如企业按“职工人数”分组。人数只能取整数,相邻两组的上限与下限之间不会有别的数值存在,在汇总各组单位数量时,不至出现麻烦。如果用这种形式表示连续变量分组的数列时,则每组的上、下限所表示的是实际值精确至最近整数的数值。例如,有某总体单位的标志值为89.5,就把该数值四舍五入为90而属于90-99这一组。这就是说,90-99这一组实际上包括了89.5-99.499之间的所有标志值,依次类推。
第二种形式称为实际组限,既适用于离散变量分组的数列也适用于连续变量分组的数列。每个组内所包括的标志值皆是以下限为起点、以上限为极限(但不包括上限,特殊情况例外),这就是所谓有“上限不在内”的原则。例如,有某总体单位的标志值为90,则该单位属于90~100这一组而不属于80~89.99之间的所有标志值。本例中若采用第二种组限的表示方法,可列表如表2—7所示。第二种形式称为实际组限,既适用于离散变量分组的数列也适用于连续变量分组的数列。每个组内所包括的标志值皆是以下限为起点、以上限为极限(但不包括上限,特殊情况例外),这就是所谓有“上限不在内”的原则。例如,有某总体单位的标志值为90,则该单位属于90~100这一组而不属于80~89.99之间的所有标志值。本例中若采用第二种组限的表示方法,可列表如表2—7所示。
表2-7 返回 第四步,汇总各组标志值出现的次数,绘制变量数列表。
第三节 统计表与统计图 • 一、统计表 • (一)统计表的作用 • 统计表能够系统组织和合理安排大量的统计资料,使资料表现得紧凑、清晰、醒目。统计表是表现统计资料的最重形式。 • 统计表能反映总体特征及各部分之间的关系,便于进行对比和计算各种分析指标。 • 统计表是积累和保存统计资料的主要手段。
总标题 横行标题 形式 纵栏标题 数字资料 主词 内容 宾词 • (二)统计表的结构 统计表的名称,用以概括统计表中全部统计资料的内容,一般放在表的上端中央 又称横标目,它表明统计表横行项目的名称,一般置于表的左边 一般在各横行标题与纵栏标题的交叉处,是说明总体(各组)数量特征的指标。 又称纵标目,它表明纵栏指标名称,一般置于表的右上方 统计表所要说明的对象,即统计总体各个组成部分的名称,一般是指表的标行标题部分 。 统计表 用来说明主词的各种统计指标,一般指表的纵栏标题和数字资料部分 。 下面看个例子吧
(三)统计表的种类 • 用途不同 调查表:调查项目以表格的形式表示出来。 整理表(又称汇总表):对调查资料直接整理的结果。 分析表:表述统计分析资料的统计表。 • 对总体是否进行分组及分组情况不同 简单表:对总体未经任何分组,在主词栏中只是总体单位或时间的排列,具有一览表的性质。 简单分组表:对总体只按一个标志进行分组的统计表。 复合分组表:对总体进行复合分组后形式的的统计表。
性质不同 时间数列表:主词栏中是按时间单位的顺序排列的统计表,如表2—9所示。 表2-9 我国历年国内生产总值资料
空间数列表:反映在同一时间不同空间范围内(如不同单位、不同地区、不同部门等)的资料的统计表,如表2—10所示。空间数列表:反映在同一时间不同空间范围内(如不同单位、不同地区、不同部门等)的资料的统计表,如表2—10所示。 表2-10 我国1998年国内生产总值资料
15 10 5 人数 0 90 100 110 120 130 140 150 (完成%) • 二、统计图 横轴表示各组组限 直方图 纵轴表示次数(一般标在左方)和比率(一般标在右方)
· 15 10 5 · 人数 · · · · 0 90 100 110 120 130 140 150 (完成%) 折线图
· 15 10 5 · 人数 · · · · 0 90 100 110 120 130 140 150 曲线图
正态分布 右偏分布 左偏分布 • (二)次数分布的主要类型 • 主要有下列三种类型:钟形分布、U形分布、J形分布 钟形分布
正J形分布 反J形分布 J形分布