1 / 59

统计学

高等学校应用型特色规划教材. 统计学. statistics. 清华大学出版社. 第六章 变异指标. 【 学习目标 】 通过本章的学习和习题演算,掌握变异指标的意义和作用;标准差和标准差系数的计算和应用。了解变异指标的分布特性;极差、平均差和四分位差的概念、计算公式和特点;分布的偏度与峰度。. 第一节 变异指标的基本理论. 第二节 全距、分位差和平均差. 第三节 标准差和标准差系数. 第四节 偏度和峰度. 第五节 变异指标的应用. 第六章 变异指标. 指总体中各单位标志值背离分布中心的规模或程度,用 标志变异指标 来反映。. 离中趋势.

Download Presentation

统计学

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 高等学校应用型特色规划教材 统计学 statistics 清华大学出版社

  2. 第六章 变异指标 【学习目标】通过本章的学习和习题演算,掌握变异指标的意义和作用;标准差和标准差系数的计算和应用。了解变异指标的分布特性;极差、平均差和四分位差的概念、计算公式和特点;分布的偏度与峰度。 第一节变异指标的基本理论 第二节全距、分位差和平均差 第三节标准差和标准差系数 第四节偏度和峰度 第五节变异指标的应用

  3. 第六章 变异指标 指总体中各单位标志值背离分布中心的规模或程度,用标志变异指标来反映。 离中趋势 反映统计数据差异程度的综合指标,也称为标志变动度 第一节 变异指标的基本理论 一、离种趋势的涵义 变异指标值越大,平均指标的代表性越小; 反之,平均指标的代表性越大

  4. 第六章 变异指标 第一节 变异指标的基本理论 二、变异指标的作用 • 衡量和比较平均数代表性的大小; • 是进行质量控制的基础; • 是衡量风险程度的尺度。

  5. 第六章 变异指标 第一节 变异指标的基本理论 例如:某车间有两个生产小组,各有7名工人,各人日产量如下: 甲组:20,40,60,70,80,100,120 乙组:67,68,69,70,71,72,73

  6. 第六章 变异指标 第一节 变异指标的基本理论

  7. 第六章 变异指标 【专栏6-1】 别把平均指标看得过重 国家统计局日前发布的报告称,与2005年的工资数据相比,2006年全国城镇单位在岗职工的年平均工资增加了2596元,日平均工资增加了10.36元。(中国证券报3月26日)温家宝总理在十届全国人大五次会议记者招待会上曾说:“一个舰队决定它速度快慢的不是那个航行最快的船只,而是那个最慢的船只。”同样,决定全国城镇单位在岗职工工资整体发展速度的是广大低收入者的增长情况。

  8. 第六章 变异指标 【专栏6-1】 别把平均指标看得过重 目前,虽然过去15年中,中国居民工资性收入稳步增长,但收入差距的扩大,已成为工资分配中的突出问题。1月31日,国家发改委官方网站公布系列收入分配报告显示,1990~2005年,城乡居民的工资性收入在居民总收入中所占的比重从45.3%逐步提高到63.2%.但也就在这一时期,平均货币工资收入最高最低行业之比由1.76∶1扩大为4.88∶1。如果我们不注重行业间的收入差距过大问题,不采取措施弥补这种差距,而是任其扩大,一味追求平均指标的增长,那就无助于“整个社会的生活状况”的改善,因为一个舰队的速度,取决于那个最慢的船只。

  9. 第六章 变异指标 第一节 变异指标的基本理论 二、变异指标的种类 全距 以标志值之间相互比较说明变异情况 分位差 以平均数为比较标准来说明标志的变异情况 平均差 方差 标准差 平均差系数 标准差系数 峰度 以正态分布为标准说明分配数列偏离情况的指标 偏度

  10. 第六章 变异指标 最大变量值或最高组上限或开口组假定上限 最小变量值或最低组下限或开口组假定下限 第二节 全距、分位差和平均差 一、全距 指所研究的数据中,最大值与最小值之差,又称极差。

  11. 第六章 变异指标 【例A】某售货小组5人某天的销售额分别为440元、480元、520元、600元、750元,则 第二节 全距、分位差和平均差 一、全距

  12. 第六章 变异指标 第二节 全距、分位差和平均差 一、全距 【例B】某季度某工业公司18个工业企业产值计划完成情况如下:

  13. 第六章 变异指标 第二节 全距、分位差和平均差 一、全距 全距的特点 • 优点:计算方法简单、易懂; • 缺点: ①仅取决于两个极端值的水平,不 能反映其间的变量分布情况; ②受个别极端值的影响过于显著, 不符合稳健性和耐抗性的要求。

  14. 第六章 变异指标 第二节 全距、分位差和平均差 从变量数列中,剔除了一部分极端值后计算的类似于极差的指标。 二、分位差 四分位差 八分位差 十分位差 十六分位差 三十二分位差 百分位差 上四分位数 下四分位数

  15. 第六章 变异指标 总体单位总数 第 个单位的变量值 总体算术平均数 第二节 全距、分位差和平均差 是各个数据与其算术平均数的离差绝对值的算术平均数,用 表示。 三、平均差 计算公式: ⑴ 简单平均差——适用于未分组资料

  16. 第六章 变异指标 第二节 全距、分位差和平均差 三、平均差 【例A】某售货小组5个人,某天的销售额分别为440元、480元、520元、600元、750元,求该售货小组销售额的平均差。 解: 即该售货小组5个人销售额的平均差为93.6元。

  17. 第六章 变异指标 第 组的变量值或组中值 第 组变量值出现的次数 总体算术平均数 第二节 全距、分位差和平均差 三、平均差 ⑵ 加权平均差——适用于分组资料

  18. 第六章 变异指标 第二节 全距、分位差和平均差 三、平均差 【例B】计算下表中某公司职工月工资的平均差。

  19. 第六章 变异指标 第二节 全距、分位差和平均差 三、平均差 解: 即该公司职工月工资的平均差为138.95元。

  20. 第六章 变异指标 第二节 全距、分位差和平均差 三、平均差 平均差的特点 • 优点:不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度; • 缺点:用绝对值的形式消除各标志值与算术平均数离差的正负值问题,不便于作数学处理和参与统计分析运算。

  21. 第六章 变异指标 第二节 全距、分位差和平均差 三、平均差 平均差系数

  22. 第六章 变异指标 总体算术平均数 第 个单位的变量值 总体单位总数 第三节 标准差和标准差系数 是各个数据与其算术平均数的离差平方的算术平均数的开平方根,用 来表示;标准差的平方又叫作方差,用 来表示。 标准差 计算公式: ⑴ 简单标准差——适用于未分组资料

  23. 第六章 变异指标 第三节 标准差和标准差系数 【例A】某售货小组5个人,某天的销售额分别为440元、480元、520元、600元、750元,求该售货小组销售额的标准差。 解:

  24. 第六章 变异指标 第 组的变量值或组中值 第 组变量值出现的次数 总体算术平均数 第三节 标准差和标准差系数 标准差 ⑵ 加权标准差——适用于分组资料

  25. 第六章 变异指标 第三节 标准差和标准差系数 【例B】计算下表中某公司职工月工资的标准差。

  26. 第六章 变异指标 第三节 标准差和标准差系数 解: 即该公司职工月工资的标准差为167.9元。 (比较:其工资的平均差为138.95元)

  27. 第六章 变异指标 由同一资料计算的标准差的结果一般要略大于平均差。 证明:当a,b,c≥0时,有 第三节 标准差和标准差系数 标准差的特点 • 不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度; • 用平方的方法消除各标志值与算术平均数离差的正负值问题,可方便地用于数学处理和统计分析运算.

  28. 第六章 变异指标 避免离差平方和计算过程的出现 目的: 变量值平方的平均数 变量值平均数的平方 简单标准差 加权标准差 第三节 标准差和标准差系数 标准差的简捷计算

  29. 第六章 变异指标 变异系数指标 第三节 标准差和标准差系数 可比

  30. 第六章 变异指标 用变异系数可以相互比较 第三节 标准差和标准差系数 身高的差异水平:cm 可比 体重的差异水平:kg

  31. 第六章 变异指标 应用: 用来对比不同水平的同类现象,特别是不同类现象总体平均数代表性的大小 ——标准差系数小的总体,其平均数的代表性大;反之,亦然。 第三节 标准差和标准差系数 标准差系数

  32. 第六章 变异指标 第三节 标准差和标准差系数 【例】某年级一、二两班某门课的平均成绩分别为82分和76分,其成绩的标准差分别为15.6分和14.8分,比较两班平均成绩代表性的大小。 解: 二班成绩的标准差系数为: 因为 ,所以一班平均成绩的代表性比二班大。

  33. 第六章 变异指标 指总体中全部单位只具有“是”或“否”、“有”或“无”两种表现形式的标志,又叫交替标志 是非标志 第三节 标准差和标准差系数 是非标志总体 为研究是非标志总体的数量特征,令

  34. 第六章 变异指标 指是非标志总体中具有某种表现或不具有某种表现的单位数占全部总体单位总数的比重。 成数 具有某种标志表现的 单位数所占的成数 第三节 标准差和标准差系数 是非标志总体的指标 不具有某种标志表现 的单位数所占的成数

  35. 第六章 变异指标 均 值 标 准 差 第三节 标准差和标准差系数 是非标志总体的指标

  36. 第六章 变异指标 方差 标准差系数 第三节 标准差和标准差系数 是非标志总体的指标

  37. 第六章 变异指标 第三节 标准差和标准差系数 是非标志总体的指标 【例】某厂某月份生产了400件产品,其中合格品380件,不合格品20件。求产品质量分布的集中趋势与离中趋势。 解:

  38. 第六章 变异指标 常用的几种标志变异指标 概 念 计 算 特 点 优点:容易理解, 计算方便 缺点:不能反映全部数据分布状况 数列中最大值 与最小值之差 R=最大值-最小值 1.极差 (R) 各标志值与 均值离差绝 对值的算术 平均 优点:反映全部数据分布状况 缺点:取绝对值 ,数字上 不尽合理 简单: 2.平均差 (A.D) 加权:

  39. 第六章 变异指标 概 念 计 算 特 点 优点:反映全部数据分布状况,数字上合理。 缺点:受计量单位和平均水平影响,不便于比较 各标志值与均值离差平方的平均。 方差的平方根(取正根) 3.方差(σ2) 和 标准差(σ) 简单: 加权: 优点:适宜不同数据集的比较 缺点:对数据结构变化反应不灵敏 4.标准差系 数 (Vσ) 标准差与均值 之商,是无量 纲的系数

  40. 第六章 变异指标 第六章 变异指标 第四节 偏度与峰度 分布的矩 1.矩的基本形式 第i个 变量 常数 权数

  41. 第六章 变异指标 未分组资料 原点矩 分组资料 未分组资料 中心矩 分组资料

  42. 第六章 变异指标 1.平均数与众数比较法 正偏态分布(右) 负偏态分布(左) (对称分布)

  43. 第六章 变异指标 2.矩法 (m3——三阶中心矩) 定义M=∑(X-A)k/n为变量X关于A的k阶矩。 • 当A=0,即以原点为中心,上式称为““K阶原点矩”。 K=1,2,3时,有: 一阶原点矩μ1=∑(X-0)1/n=∑X/n 二阶原点矩μ2=∑(X-0)2/n=∑X2/n 三阶原点矩μ3=∑(X-0)3/n=∑X3/n

  44. 第六章 变异指标 2.矩法 • 当A= ,即以 为中心,上式称为“K阶中心矩”。 K=1,2,3时,有: 一阶中心矩 二阶中心矩 三阶中心矩

  45. 第六章 变异指标 K=1,2,3时,有: 一阶中心矩 二阶中心矩 三阶中心矩 < 0 =0 > 0 所以,ν3可以测定偏度。为消除量纲,转变为系数,再除以σ3。 <0负偏态 =0对称分布 >0正偏态

  46. 第六章 变异指标 测定分布的偏度 3.分位数法 负偏态分布(左) 正偏态分布(右) (对称分布) 不同分布情形下诸四分位数之间的关系

  47. 第六章 变异指标 测定分布的偏度 3.分位数法 由上页图可知,当公布为对称时,中位数与上、下四分位数的距离相等地;当分布为正偏时,中位数与上四分位数的距离大于它与下四分位数的距离;当分布为负偏时,中位数与上四分位数的距离小于它与下四分位数的距离,因此,中位数与上、下四分位数的距离之差可以反映偏斜方向。

  48. 第六章 变异指标 优点:可以排除极端值的干扰 缺点:由于从分布中剔除了两端各四分之一的数据,故只能反映中间半数总体单位的分布形态特征。为减少数据损失,可采用更高程度的分位数,按类似方式定义偏度指标。 3.分位数法 >0 分布为正偏 <0 分布为负偏 =0 分布为对称

  49. 第六章 变异指标 测定分布的峰度 1.矩法 >0 分布为高峰度的 <0 分布为低峰度的 =0 分布为正态峰度的

  50. 第六章 变异指标 观察表明,此式计算的结果数值越小,分布图形越陡峭;反之,数值越大,分布图形越平坦。且在理论上可证明,对于正态分布,这样计算的结果总是0.526,故可定义相应的峰度指标为: 2.分位数法

More Related