1.46k likes | 1.89k Views
PowerPoint. 统计学. 第七章 假设检验. 第七章 假设检验. 第一节 假设检验的一般问题 第二节 一个正态总体的参数检验 第三节 两个正态总体的参数检验 第四节 假设检验中的其他问题. 统计方法. 描述统计. 推断统计. 假设检验. 参数估计. 假设检验在统计方法中的地位. 学习目标. 了解假设检验的基本思想 掌握假设检验的步骤 能对实际问题作假设检验 利用置信区间进行假设检验 利用 P - 值进行假设检验. 第一节 假设检验的一般问题. 假设检验的概念 假设检验的步骤 假设检验中的小概率原理
E N D
PowerPoint 统计学 第七章 假设检验
第七章 假设检验 第一节 假设检验的一般问题 第二节 一个正态总体的参数检验 第三节 两个正态总体的参数检验 第四节 假设检验中的其他问题
统计方法 描述统计 推断统计 假设检验 参数估计 假设检验在统计方法中的地位
学习目标 • 了解假设检验的基本思想 • 掌握假设检验的步骤 • 能对实际问题作假设检验 • 利用置信区间进行假设检验 • 利用P - 值进行假设检验
第一节 假设检验的一般问题 • 假设检验的概念 • 假设检验的步骤 • 假设检验中的小概率原理 • 假设检验中的两类错误 • 双侧检验和单侧检验
什么是假设? • 对总体参数的一种看法 • 总体参数包括总体均值、比例、方差等 • 分析之前必需陈述 我认为该企业生产的零件的平均长度为4厘米!
什么是假设检验? • 概念 • 事先对总体参数或分布形式作出某种假设 • 然后利用样本信息来判断原假设是否成立 • 类型 • 参数假设检验 • 非参数假设检验 • 特点 • 采用逻辑上的反证法 • 依据统计上的小概率原理
这个值不像我们应该得到的样本均值 ... ... 如果这是总体的真实均值 20 假设检验的基本思想 抽样分布 ... 因此我们拒绝假设 = 50 m = 50 样本均值 H0
我认为人口的平均年龄是50岁 拒绝假设! 别无选择. 提出假设 作出决策 总体 抽取随机样本 均值X = 20 假设检验的过程(提出假设→抽取样本→作出决策)
假设检验的步骤 • 提出原假设和备择假设 • 确定适当的检验统计量 • 规定显著性水平 • 计算检验统计量的值 • 作出统计决策
提出原假设和备择假设 为什么叫0假设 • 什么是原假设?(Null Hypothesis) • 1. 待检验的假设,又称“0假设” • 2. 如果错误地作出决策会导致一系列后果 • 3. 总是有等号 , 或 • 4. 表示为 H0 • H0: 某一数值 • 指定为 = 号,即 或 • 例如, H0:3190(克)
提出原假设和备择假设 • 什么是备择假设?(Alternative Hypothesis) • 1. 与原假设对立的假设 • 2. 总是有不等号:,或 • 3. 表示为 H1 • H1:<某一数值,或 某一数值 • 例如, H1:< 3910(克),或 3910(克)
确定适当的检验统计量 • 什么检验统计量? • 1. 用于假设检验问题的统计量 • 2. 选择统计量的方法与参数估计相同,需考虑 • 是大样本还是小样本 • 总体方差已知还是未知 • 检验统计量的基本形式为
规定显著性水平 • 什么显著性水平? • 1. 是一个概率值 • 2. 原假设为真时,拒绝原假设的概率 • 被称为抽样分布的拒绝域 • 3. 表示为 (alpha) • 常用的 值有0.01, 0.05, 0.10 • 4. 由研究者事先确定
作出统计决策 • 计算检验的统计量 • 根据给定的显著性水平,查表得出相应的临界值Z或Z/2 • 将检验统计量的值与 水平的临界值进行比较 • 得出接受或拒绝原假设的结论
假设检验中的小概率原理 • 什么小概率? • 1. 在一次试验中,一个几乎不可能发生的事件发生的概率 • 2. 在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设 • 3. 小概率由研究者事先确定 什么是小概率
汉乐府中的小概率事件 上邪! 我欲与君相知, 长命无绝衰。 山无陵,江水为之竭, 冬雷震震,夏雨雪, 天地合, 乃敢与君绝!
假设检验中的两类错误 (决策风险)
假设检验中的两类错误 • 1. 第一类错误(弃真错误) • 原假设为真时拒绝原假设 • 会产生一系列后果 • 第一类错误的概率为 • 被称为显著性水平 • 2. 第二类错误(取伪错误) • 原假设为假时接受原假设 • 第二类错误的概率为(Beta)
假设检验中的两类错误 (决策结果) H0: 无罪 统计检验过程 假设检验就好像一场审判过程
和的关系就像翘翘板,小就大, 大就小 你不能同时减少两类错误! 错误和 错误的关系
影响 错误的因素 • 1. 总体参数的真值 • 随着假设的总体参数的减少而增大 • 2. 显著性水平 • 当 减少时增大 • 3. 总体标准差 • 当 增大时增大 • 4. 样本容量 n • 当 n 减少时增大
双侧检验(原假设与备择假设的确定) • 双侧检验属于决策中的假设检验。也就是说,不论是拒绝H0还是接受H0,我们都必需采取相应的行动措施 • 例如,某种零件的尺寸,要求其平均长度为10厘米,大于或小于10厘米均属于不合格 • 建立的原假设与备择假设应为 • H0: = 10 H1: 10
双侧检验(确定假设的步骤) • 1. 例如问题为: 检验该企业生产的零件平均长度为4厘米 • 2. 步骤 • 从统计角度陈述问题 ( = 4) • 从统计角度提出相反的问题 ( 4) • 必需互斥和穷尽 • 提出原假设 ( = 4) • 提出备择假设 ( 4) • 有 符号
双侧检验(例子) • 提出原假设: H0: = 4 • 提出备择假设: H1: 4 该企业生产的零件平均长度是4厘米吗? (属于决策中的假设)
抽样分布 置信水平 拒绝域 拒绝域 1 - a/2 a/2 接受域 H0值 样本统计量 临界值 临界值 双侧检验(显著性水平与拒绝域 )
抽样分布 置信水平 拒绝域 拒绝域 1 - a/2 a/2 接受域 H0值 样本统计量 临界值 临界值 双侧检验(显著性水平与拒绝域 )
抽样分布 置信水平 拒绝域 拒绝域 1 - a/2 a/2 接受域 H0值 样本统计量 临界值 临界值 双侧检验(显著性水平与拒绝域 )
抽样分布 置信水平 拒绝域 拒绝域 1 - a/2 a/2 接受域 H0值 样本统计量 临界值 临界值 双侧检验(显著性水平与拒绝域 )
单侧检验(原假设与备择假设的确定) • 检验研究中的假设 • 将所研究的假设作为备择假设H1 • 将认为研究结果是无效的说法或理论作为原假设H0。或者说,把希望(想要)证明的假设作为备择假设 • 先确立备择假设H1
单侧检验(原假设与备择假设的确定) • 例如,采用新技术生产后,将会使产品的使用寿命明显延长到1500小时以上 • 属于研究中的假设 • 建立的原假设与备择假设应为 • H0: 1500 H1: 1500 • 例如,改进生产工艺后,会使产品的废品率降低到2%以下 • 属于研究中的假设 • 建立的原假设与备择假设应为 • H0: 2% H1: < 2%
单侧检验(原假设与备择假设的确定) • 检验某项声明的有效性 • 将所作出的说明(声明)作为原假设 • 对该说明的质疑作为备择假设 • 先确立原假设H0 • 除非我们有证据表明“声明”无效,否则就应认为该“声明”是有效的
单侧检验(原假设与备择假设的确定) • 例如,某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在1000小时以上 • 除非样本能提供证据表明使用寿命在1000小时以下,否则就应认为厂商的声称是正确的 • 建立的原假设与备择假设应为 • H0: 1000 H1: < 1000
单侧检验(例子) • 提出原假设: H0: 1000 • 选择备择假设: H1: < 1000 • 该批产品的平均使用寿命超过1000小时吗? • (属于检验声明的有效性,先提出原假设)
单侧检验(例子) • 提出原假设: H0: 25 • 选择备择假设: H1: : 25 • 学生中经常上网的人数超过25%吗? • (属于研究中的假设,先提出备择假设)
抽样分布 置信水平 拒绝域 1 - a 接受域 H0值 样本统计量 临界值 单侧检验(显著性水平与拒绝域 )
抽样分布 置信水平 拒绝域 1 - a 接受域 H0值 样本统计量 临界值 观察到的样本统计量 左侧检验(显著性水平与拒绝域 )
抽样分布 置信水平 拒绝域 1 - a 接受域 H0值 样本统计量 临界值 左侧检验(显著性水平与拒绝域 )
抽样分布 置信水平 拒绝域 1 - a 接受域 H0值 样本统计量 临界值 观察到的样本统计量 右侧检验(显著性水平与拒绝域 )
抽样分布 置信水平 拒绝域 1 - a 接受域 H0值 样本统计量 临界值 右侧检验(显著性水平与拒绝域 )
第二节 一个正态总体的参数检验 一. 总体方差已知时的均值检验 二. 总体方差未知时的均值检验 三. 总体比例的假设检验
一个总体 均值 比例 方差 Z 检验 (单尾和双尾) t 检验 (单尾和双尾) Z 检验 (单尾和双尾) 2检验 (单尾和双尾) 一个总体的检验
检验的步骤 • 陈述原假设 H0 • 陈述备择假设 H1 • 选择显著性水平 • 选择检验统计量 • 选择n • 给出临界值 • 搜集数据 • 计算检验统计量 • 进行统计决策 • 表述决策结果
一个总体 均值 比例 方差 Z 检验 (单尾和双尾) t 检验 (单尾和双尾) Z 检验 (单尾和双尾) c2检验 (单尾和双尾) 一个总体的检验
均值的双尾 Z检验(2已知) • 1. 假定条件 • 总体服从正态分布 • 若不服从正态分布, 可用正态分布来近似(n30) • 2. 原假设为:H0: =0;备择假设为:H1: 0 • 使用z-统计量