830 likes | 927 Views
《 统计学 》 课件. 项目四 统计整理 —— 统计分组及统计图表的编制方法. 教学目的与要求 通过本项目学习,首先要明确统计整理的意义和步骤,重点掌握统计分组的理论和方法,学会编制变量数列和统计表。 教学重点与难点 重点 :分组标志的选择; 连续型变量的组距分组;次数分布数列的编制;权数意识的培养,正确理解权数。 难点 :组距分组中组数、组距和组限的确定。. 教学导例 某高校教师有关资料. 1. 女,本科,讲师,月收入 3500 ; 2. 男,本科,副教授,月收入 3800 ;
E N D
《统计学》课件 项目四统计整理——统计分组及统计图表的编制方法
教学目的与要求 通过本项目学习,首先要明确统计整理的意义和步骤,重点掌握统计分组的理论和方法,学会编制变量数列和统计表。 教学重点与难点 重点:分组标志的选择; 连续型变量的组距分组;次数分布数列的编制;权数意识的培养,正确理解权数。 难点:组距分组中组数、组距和组限的确定。
教学导例某高校教师有关资料 1.女,本科,讲师,月收入3500; 2.男,本科,副教授,月收入3800; 3.男,专科,讲师,月收入2600; 4.女,本科,讲师,月收入2800; 5.女,本科,副教授,月收入3900; 6.女,研究生,讲师,月收入3100; 7.男,本科,教授,月收入4200; 8.女,研究生,副教授,月收入3200; 9.女,研究生,教授,月收入4300; 10.女,专科,讲师,月收入2900; 11.女,本科,讲师,月收入3100; 12.女,研究生,讲师,月收入3100; 13.男,本科,教授,月收入4500; 14.男,研究生,教授,月收入3600; 15.女,本科,讲师,月收入3500; 16.男,研究生,副教授,月收入3800; 17.男,专科,讲师,月收入2600; 18.女,本科,讲师,月收入2800; 19.女,本科,副教授,月收入3900;20.女,本科,副教授,月收入3100; 21.男,本科,教授,月收入4200; 22.女,研究生,教授,月收入3500; 23.女,研究生,讲师,月收入3200 24.女,研究生,讲师,月收入3900; 25.女,研究生,教授,月收入4800;26.女,研究生,讲师,月收入3100;
某高校教师有关资料(续1) 27.男,本科,教授,月收入4500; 28.男,研究生,教授,月收入4700 29.男,研究生,教授,月收入4800;30.女,研究生,讲师,月收入3800 31.女,研究生,讲师,月收入3500;32.男,研究生,副教授,月收入3600 33.男,本科,副教授,月收入4200;34.女,本科,教授,月收入3900 35.男,研究生,讲师,月收入3200;36.女,本科,讲师,月收入3200 37.女,本科,助教,月收入2100; 38.男,本科,副教授,月收入3600; 39.男,专科,讲师,月收入2600; 40.女,本科,教授,月收入4800; 41.女,本科,副教授,月收入3900;42.女,研究生,讲师,月收入3100; 43.男,本科,教授,月收入4500; 44.女,研究生,副教授,月收入3900 45.女,研究生,教授,月收入4200;46.女,专科,助教,月收入2900; 47.女,研究生,讲师,月收入2800;48.女,本科,教授,月收入4900; 49.男,本科,助教,月收入1800; 50.男,研究生,教授,月收入4600; 51.女,本科,助教,月收入1900; 52.男,本科,副教授,月收入3800;
某高校教师有关资料(续2) 53.男,专科,讲师,月收入2600; 54.女,本科,助教,月收入1800; 55.女,本科,助教,月收入1900; 56.女,本科,副教授,月收入3100; 57.男,本科,教授,月收入4200; 58.女,研究生,副教授,月收入3500 59.女,本科,讲师,月收入2800; 60.女,研究生,副教授,月收入3900 61.女,研究生,教授,月收入4100;62.女,研究生,助教,月收入1800 63.男,本科,助教,月收入1800; 64.男,研究生,助教,月收入1600 65.女,本科,助教,月收入1900; 66.男,本科,副教授,月收入3700 67.男,专科,讲师,月收入2600; 68.女,本科,讲师,月收入2800; 69.女,本科,助教,月收入1600; 70.女,本科,副教授,月收入3100 71.男,本科,教授,月收入4200; 72.女,研究生,教授,月收入4500 73.女,本科,讲师,月收入2800; 74.女,研究生,副教授,月收入4200 75.女,研究生,助教,月收入2100; 76.女,研究生,助教,月收入1800 77.女,本科,助教,月收入1800; 78.女,本科,副教授,月收入3900 79.女,研究生,讲师,月收入3300 80.女,本科,助教,月收入1800
面对如此繁杂的 个体资料,大家 感觉怎么样? 乱乱乱…….. 那么整理为下面的图表又怎么样呢?
整理结果的表现形式-统计图该校教师职称及性别柱形图整理结果的表现形式-统计图该校教师职称及性别柱形图
整理结果的表现形式-统计表该校教师职称及性别分布数列单位:人整理结果的表现形式-统计表该校教师职称及性别分布数列单位:人
本项目的主要任务 ☆统计整理的意义和步骤 ★统计分组方法 ☆次数分布(分配)数列 ★统计表的绘制
任务一 理解统计整理的概念地位 了解统计整理的基本步骤
※ 统计整理的地位 统计调查统计整理统计分析 一、统计整理的意义 ※统计整理的概念 根据目的 对统计调查资料 实施分类、汇总 编制统计图表 为统计分析奠定基础 取得研究结论 对总体的理性认识 搜集原始资料 对个体的感性认识 分类、汇总 过渡阶段
二、统计整理的步骤 制订整理方案 1 2 审核调查资料 具体实施整理 3 4 复查整理结果 5 4 编制统计图表
统计整理的步骤(续) ★制订整理方案:主要内容有: 统计分组体系和统计指标体系; 编制整理表格和填表说明; 整理的组织形式和汇总的技术方法。 ★ 审核调查资料:审核内容包括: 调查资料的完整性和正确性。 审核方法:逻辑检查和计算检查。 ★绘制统计图表:统计资料表现形式(参见以下图表例)
任务二 理解统计分组的概念作用 熟知统计分组的基本方法
一、统计分组的意义 ☆ 统计分组: 根据统计研究的需要,将总体 按一定的标志划分为若干性质 不同的组成部分的统计方法。 ☆ 两个涵义: 对总体而言是“分”, 对个体而言是“合”。 质量标准: 组内同质性 组间差异性
统计分组的主要作用 对社会经济现象进行类型划分 统计分组过程就是类型划分的过程。划分类型,揭示差异是统计分组的根本作用 。 对社会经济现象进行结构分析 反映总体内部结构,判定现象性质及变化。 研究社会经济现象间的依存关系 分析影响因素和结果之间的变动关系及规律。
二、统计分组的两个关键问题 (一)选择分组标志(首要问题) ①根据研究目的 选择分组标志 的原则 ②选择主要标志 ③具体问题具体分析 (二)划分各组界限 在选定分组标志后,就需要明确组与组之间的界限。
如何正确选择分组标志?? 选择主要标志:有时存在若干个标志 都能不同程度满足研究目的的需要。 如研究某高校职工生活水平,可用的 标志有:职工工资、收入、职工家庭月 人均收入、职工家庭年人均收入。 该选择哪个更为合适呢?
三、统计分组体系 统计分组体系:运用多个分组标志对同 一总体进行分组形成的一系列相互联系、相互补充的统计分组的整体。 平行分组体系:两个及以上标志分别分组 复合分组体系:两个及以上标志层叠分组 简单分组:对总体只按一个标志分组。
平行分组体系(人口分组为例) 性别 男 女 年龄 0-14 15-64 65以上 户籍 城 乡 平行分组体系适宜对研究对象进行 多角度、多方面分析。
复合分组体系(人口分组为例) 0-14 15-64 65以上 复合分组体系宜对研究对象 进行 多层次逐层深入分析 男 城镇 0-14 15-64 65以上 女 0-14 15-64 65以上 男 农村 0-14 15-64 65以上 女
复合分组体系 注意:复合分组每增加一个层次就会使组数几何级增加。如上例: 2——6——18组。因此复合分组层次也不可过多。有时候,为了排版和观感的需要复合分组的表现形式还可以采用上表式样。
2010年第六次人口普查分性别和年龄的人口复合分组情况2010年第六次人口普查分性别和年龄的人口复合分组情况
对问题的研究往往需要多角度和多层次。平行分组体系可以满足多角度研究的需要,复合分组体系可以满足多层次研究的需要。对问题的研究往往需要多角度和多层次。平行分组体系可以满足多角度研究的需要,复合分组体系可以满足多层次研究的需要。
四、统计分组的种类及方法 品质分组 统计分组 单项分组 变量分组 等距分组 组距分组 异距分组
(二)变量分组 变量分组反映的是各组量的差别,通过量的差别来反映事物间的性质差别。 1.单项分组 每组只用一个具体的变量值来表示的分组。其组数由不重复的变量值个数决定;各组组值明确。适用于不重复的变量值个数不多的离散变量。
单项分组(实例) 现有50名育龄妇女(15-49)生育子女数情况: 0 2 1 1 3 1 3 0 0 1 1 3 2 0 0 0 3 1 0 0 2 0 2 0 1 1 0 1 1 0 1 1 2 1 3 1 5 3 2 1 2 0 2 3 2 1 0 1 2 0 按育龄妇女生育子女数进行单项分组可分为: 0、1、2、3、5五组。
2、组距分组 各组用变量值的变动区间来表示。适用于连续变量和不重复的变量值个数很多的离散变量。 (1)几个基本概念: 组限:(下限、上限) 闭口组:下限、上限都有。如200——300 开口组: 下开口组: ××以下 上开口组: ××以上
为什么要设开口组? 统计分组的原则:“不漏不重” 。即: (1)要使总体中的每个单位都有组可归,贯彻分 组的“穷举”原则;即:“不遗漏”原则。 (2)每个单位都只能归到某一组,不能重复归组; 即“互斥”原则。 在出现极端值情况下,为了遵循统计分组的原则,应设置开口组解决极端值归组问题。
全距=最大值—最小值 组距=上限—下限 (注意:开口组组距以邻组组距代替)实例: 组距分组(续2) 学生成绩分组 60以下 60-70 70-80 80-90 90以上 年龄 0-14 15-64 65以上 职工工资分组 1000以下 1000-2000 2000-3000 3000-4000 4000以上
下开口组 ××以下 上开口组 ××以上 组距 下限 上限 组中值
注 意 组中值代表组内各单位的一般水平。 其代表性受组内各单位分布是否均匀或是否在 组中值两侧成对称分布,否则计算出来的数值 与实际会有较大偏差。
(2)组距分组要解决的几个主要问题 组距:等距分组或异距分组? 组距多长? 实际工作中,一般采用等距分组。 组数 :就是决定将总体分成多少组? 组距和组数必须先确定一个。当研究对象有明显的几个组成部分,则可先确定组数,再根据情况确定各组的组距。 组限:确定组限就是要找出何处是决定事物性质差别的数量界限?组限的表示方法?
组距和组数的关系 组数与组距的确定,要力求能够将总体分布的特点反映出来。由于全距是既定的,在等距分组情况下,组距和组数存在相互制约的关系: 需要注意:根据上式计算的只能是一个参考数。
若先确定组距 组距要适中。若组距过小,易将同质单位划分在不同组;若组距过大,会使不同性质的单位同处一组,掩盖现象质的差异。 若先确定组距,应先观察原始资料,大致判断总体的水平高低和分布,然后确定组距。如对某公司职工按月收入分组。据资料若大致判断其收入普遍在3000元左右,此时以500元或1000元做为组距比较合适,若大致为1000元左右,则组距为100元或200元比较合适。
资料:现有某地区500个企业的计划完成 程度资 料,其中最低83%,最高125%,全距为42%。 ★若先确定组数-----实例讨论 据本资料可确定组数为6,则计算出的组距为7,分组结果为(1)。观察以下三种分组结果:
先确定组数-----实例讨论 分组结果(1) 83% ----90% 90%---97% 97%---104% 104%--111% 111%---118% 118%---125% 分组结果(2) 83%-----93% 93%-----103% 103%-----113% 113%-----123% 123%-----133% 分组结果(3) 80%----90% 90%----100% 100%----110% 110%----120% 120%----130%
以上哪种分组效果最好? 首先,分组(1)杂乱,难分析判断。一般等距分组时,组距尽可能取10或10的倍数,此例选10较合适。 其次,分组(1)第三组和分组(2)第二组均出现严重问题,既包括超额完成计划的,还包括没有完成计划的。 再次,组限问题,如确定组距为10,组数为5,而各组具体范围没搞清,分组(2)也不合适。 最后,在算全距时要注意别机械。若有极端值,则以次大或次小值计算全距,再用开口组解决最大或最小值归组问题。 若此例有20%和180%,可以在计算全距时不考虑
组限的表示方法 组限的表示方式取决于变量的类型。连续变量,须采用重叠组限;离散变量可采用间断组限或重叠组限。如:企业按职工人数分组 不重叠组限 99以下 100 —— 999 1000——4999 5000以上 重叠组限 100以下 100——1000 1000——5000 5000以上
连续变量组限的表现方法------重叠组限 职工月收入分组 (元) 1500以下 1500-----2000 2000-----2500 2500-----3000 3000-----3500 3500-----4000 4000以上
组距分组一般采用等距分组; 各组组距以10或10的倍数为宜; 组数不可过多(少),10组以内5-10组为宜; 组限以10或10 的倍数为宜; 采用重叠组限,并遵循“上组限不在内”原则。 根据“穷举”原则要求,最小组的下限要不高于最小变量值; 最大组的上限要不低于最大变量值。 组距分组的一般处理方法 总结
任务三 了解分配数列的构成 熟知分配数列的编制