750 likes | 896 Views
贵州财经学院数学与统计学院. 统计方法. 描述统计. 推断统计. 假设检验. 参数估计. 第五章 假设检验. 假设检验在统计方法中的地位. 第一节 假设检验概述. 第二节 总体参数检验. 学习目标. 1 、 假设检验与参数估计的区别 2 、了解假设检验的基本思想 3 、掌握假设检验的步骤(程序) 4 、能对实际问题作假设检验. 第一节 假设检验概述. 一、假设检验与参数估计的区别 二 、假设检验的概念 三、假设检验的步骤 四、假设检验中的小概率原理 五、假设检验中的两类错误 六、双侧检验和单侧检验. 假设检验与参数估计区别.
E N D
统计方法 描述统计 推断统计 假设检验 参数估计 第五章 假设检验 假设检验在统计方法中的地位
第一节 假设检验概述 第二节 总体参数检验
学习目标 1、假设检验与参数估计的区别 2、了解假设检验的基本思想 3、掌握假设检验的步骤(程序) 4、能对实际问题作假设检验
第一节 假设检验概述 一、假设检验与参数估计的区别 二、假设检验的概念 三、假设检验的步骤 四、假设检验中的小概率原理 五、假设检验中的两类错误 六、双侧检验和单侧检验
假设检验与参数估计区别 参数估计和假设检验是统计推断的两个组成部分,都是利用样本对总体进行某种推断,但推断的角度不同。参数估计是在总体参数未知的情况下用样本统计量估计总体参数。假设检验是先对总体参数提出一个假设,然后利用样本信息去检验这个假设是否成立,如果成立,就接受这个假设,否则就放弃。
[例] 某企业生产了一批灯管,按规定每只灯管的使用寿命不得低于1000小时。现从中任意抽取100只,发现有6只的使用寿命低于1000小时,若规定不合格率达到5%时,灯管就不能出厂,问该批灯管能否出厂。 从2002年的新生儿中随机抽取30个,测得其平均体重为3210克,而2001年为3190克,问新生儿体重2002年比2001年有无显著差异。
什么是假设? 对总体参数的一种看法 总体参数包括总体均值、比例、方差等 分析之前必须陈述 假设检验的概念 我认为该企业生产的零件的平均长度为4厘米!
事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立。事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立。 假设检验的概念
参数假设检验 非参数假设检验 假设检验的类型 假设检验的特点 采用逻辑上的反证法 依据统计上的小概率原理
假设检验的基本思想 ... 如果这是总体的真实均值 抽样分布 这个值不像我们应该得到的样本均值 ... ... 因此我们拒绝假设 = 50 m = 50 样本均值 H0
假设检验的过程 拒绝假设! 别无选择. 我认为人口的平均年龄是50岁 提出假设 作出决策 总体 抽取随机样本 均值X = 20 2
(一)提出原假设和备择假设 (二)确定适当的检验统计量 (三)规定显著性水平 (四)计算检验统计量的值 (五)作出统计决策 假设检验的步骤
(一)提出原假设和备择假设 什么是原假设? 待检验的假设,又称“0假设” 如果错误地作出决策会导致一系列后果 总是有等号, 或 表示为 H0 H0: 某一数值 例如:H0:3190(克) 假设检验的步骤
什么是备择假设? 与原假设对立的假设 总是有不等号: 、 或 表示为 H1 H1: <某一数值,或 某一数值 例如 H1: < 3910(克) 或 3910(克)
(二)确定适当的检验统计量 什么检验统计量? 用于假设检验问题的统计量 选择统计量的方法与参数估计相同,需考虑 (1)是大样本还是小样本 (2)总体方差已知还是未知 假设检验的步骤
(三)规定显著性水平α ,并根据给定的显著性水平來确定否定域 什么显著性水平? 是一个概率值。即当原假设为真时,人们却把它拒绝了的概率或风险,也称为抽样分布的拒绝域,表示为 α,常用的 α=0.01, 0.05, 0.10 由研究者事先确定。当 α 取0.05时,表明作出接受原假设的决定时,其正确的可能性(概率)为95%。 假设检验的步骤
(四)计算检验统计量的值 (五)判断分析,作出统计决策 即作出接受或拒绝原假设的结论 假设检验的步骤
作出统计决策时,应根据以下情况进行分析判断:作出统计决策时,应根据以下情况进行分析判断: 1、计算检验的统计量 2、根据给定的显著性水平α,查表得出相应的临界值Z α或Z α /2 3、将检验统计量的值与α水平的临界值进行比较 4、最后得出接受或拒绝原假设的结论
什么是小概率? 在一次试验中,一个几乎不可能发生的事件发生的概率。 在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设。 小概率由研究者事先确定。 假设检验中的小概率原理
假设检验的依据 小概率事件在一次试验中很难发生, 但“很难发生”不等于“不发生”, 因而假设检验所作出的结论有可能是错误的。 这种错误有两类: 假设检验中的两类错误
假设检验中的两类错误 • 第一类错误(弃真错误) • 原假设为真时拒绝原假设,会产生一系列后果 • 第一类错误的概率为 α • 被称为显著性水平
第二类错误(取伪错误) 原假设为假时接受原假设 第二类错误的概率为ß 假设检验中的两类错误 注 1、当样本容量 n 一定时, 若减少犯第一类错误的概率α, 则犯第二类错误的概率ß往往增大。 2、若要使犯两类错误的概率都减小, 除非增加样本容量.
和的关系就像翘翘板,小就大, 大就小 你不能同时减少两类错误! 错误和 错误的关系
检验功效 检验效果的好与坏,与犯两类错误的概率都有关。一个有效的检验首先是犯第一类错误的概率α不能太大。否则的话,就经常产生弃真现象;另外,在犯第一类错误得到控制的条件下,犯第二类错误的概率ß也要尽可能的小,即不取伪的概率1-ß应尽可能增大。。1-ß越大,意味着当原假设不真实时,检验判断出原假设不真实的概率越大,检验的判断能力就越好;1-ß越小,意味着当原假设不真实时,检验判断出原假设不真实的概率越小,检验的判断能力就越差。 1-ß是反映统计检验判别能力大小的重要标志,故把1-ß称之为检验功效或检验力。
检验功效 在设计检验时,最理想的情况是: 犯第一类错误和第二类错误的概率都比较小。 但是第一类错误和第二类错误是一对矛盾体,减少犯第一类错误的可能性,势必增加犯第二类错误的可能性;增大第一类错误的可能性,又能减少犯第二类错误的可能性。可见α的大小,影响到ß的大小进而影响到1-ß的大小。犯第一类错误的概率或检验的显著性水平是影响检验力的一个重要因素。 α增大,ß随之减小,检验功效就增强。可见取α=0.1比取α=0.01时,检验的功效强,检验力大。
唯一的办法是 增大样本容量 因为增加样本容量能够保证满足较小α的需要,同时又能减小犯第二类错误的概率ß,抵消检验功效的衰减。可见样本容量大小是影响检验功效大小的一个重要因素。可通过增大样本容量的方法提高检验功效。
六、 显著性检验 只对犯第一类错误的概率加以控制, 而不考虑犯第二类错误的概率的检验, 称为显著性检验.
第二节 总体参数检验 一、单侧检验与双侧检验 二、总体平均数的检验 三、总体成数的检验
单侧检验与双侧检验 拒绝区域是检验统计量取值的小概率区域,我们可以将这个小概率区域安排在检验统计量分布的两端,也可以安排在分布的一侧,分别称作双侧检验与单侧检验。
单侧检验(右侧检验与左侧检验) 右侧检验与左侧检验统称为单侧检验
例如,某种零件的尺寸,要求其平均长度为10厘米,大于或小于10厘米均属于不合格例如,某种零件的尺寸,要求其平均长度为10厘米,大于或小于10厘米均属于不合格 建立的原假设与备择假设应为 H0: = 10 H1: 10 双侧检验 原假设与备择假设的确定
接受域 拒绝域 拒绝域 临界值 临界值 只要﹤10 或 ﹥10有一个成立, 就可以否定原假设。
抽样分布 置信水平 拒绝域 拒绝域 1 - a/2 a/2 接受域 H0值 样本统计量 临界值 临界值 显著性水平与拒绝域
抽样分布 置信水平 拒绝域 拒绝域 1 - a/2 a/2 接受域 H0值 样本统计量 临界值 临界值 显著性水平与拒绝域
抽样分布 置信水平 拒绝域 拒绝域 1 - a/2 a/2 接受域 H0值 样本统计量 临界值 临界值 显著性水平与拒绝域
抽样分布 置信水平 拒绝域 拒绝域 1 - a/2 a/2 接受域 H0值 样本统计量 临界值 临界值 显著性水平与拒绝域
检验研究中的假设 将所研究的假设作为备择假设H1, 或者说,把希望(想要)证明的假设作为备择假设先确立备择假设H1 单侧检验
例如,采用新技术生产后,将会使产品的使用寿命明显延长到1500小时以上例如,采用新技术生产后,将会使产品的使用寿命明显延长到1500小时以上 属于研究中的假设 建立的原假设与备择假设应为 H0: 1500 H1: 1500 再如,改进生产工艺后,会使产品的废品率降低到2%以下 属于研究中的假设 建立的原假设与备择假设应为 H0: 2% H1: < 2% 原假设与备择假设的确定
检验某项声明的有效性 将所作出的说明(声明)作为原假设H0 对该说明(声明)的质疑作为备择假设H1 先确立原假设H0 除非我们有证据表明“声明”无效,否则就应认为该“声明”是有效的。 单侧检验
例如,某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在1000小时以上例如,某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在1000小时以上 除非样本能提供证据表明使用寿命在1000小时以下,否则就应认为厂商的声称是正确的。 建立的原假设与备择假设应为 H0: 1000 H1: < 1000 原假设与备择假设的确定
左单侧检验 H0: 1000 H1: < 1000 拒绝域 接受域
右单侧检验 如前例: H0: 1500 H1: 1500 接受域 拒绝域
抽样分布 置信水平 拒绝域 1 - a 接受域 H0值 样本统计量 临界值 显著性水平与拒绝域
抽样分布 置信水平 拒绝域 1 - a 接受域 H0值 样本统计量 临界值 观察到的样本统计量 显著性水平与拒绝域
抽样分布 置信水平 拒绝域 1 - a 接受域 H0值 样本统计量 临界值 显著性水平与拒绝域
抽样分布 置信水平 拒绝域 1 - a 接受域 H0值 样本统计量 临界值 观察到的样本统计量