1.37k likes | 1.58k Views
第一节 假设检验问题 第二节 正态总体均值的假设检验 第三节 正态总体方差的检验 第四节 大样本检验法 第五节 假设检验的两类错误 第六节 非参数假设检验. 第八章 假设检验. 前一章我们讨论了统计推断中的参数估计问题,本章将讨论另一类统计推断问题-假设检验 . 在参数估计中我们按照参数的点估计方法建立了参数 的估计公式,并利用样本值确定了一个估计值 ,认为参数真值 。由于参数 是未知的, 只是一个假设(假说,假想),它可能是真,也可能是假,是真是假有待于用样本进行验证(检验).
E N D
第一节 假设检验问题 第二节 正态总体均值的假设检验 第三节 正态总体方差的检验 第四节 大样本检验法 第五节 假设检验的两类错误 第六节 非参数假设检验 第八章 假设检验
前一章我们讨论了统计推断中的参数估计问题,本章将讨论另一类统计推断问题-假设检验.在参数估计中我们按照参数的点估计方法建立了参数 的估计公式,并利用样本值确定了一个估计值 ,认为参数真值 。由于参数 是未知的, 只是一个假设(假说,假想),它可能是真,也可能是假,是真是假有待于用样本进行验证(检验). 第一节 假设检验问题 下面我们先对几个问题进行分析,给出假设检验的有关概念,然后总结给出检验假设的思想和方法.
某大米加工厂用自动包装机将大米装袋,每袋的标准重量规定为10kg,每天开工时,需要先检验一下包装机工作是否正常. 根据以往的经验知道,自动包装机装袋重量X服从正态分布N( )。某日开工后,抽取了8袋,如何根据这8袋的重量判断“自动包装机工作是正常的”这个命题是否成立? 一、 统计假设 请看以下几个问题: 问题1
引号内的命题可能是真,也可能是假,只有通过验证才能确定。如果根据抽样结果判断它是真,则我们接受这个命题,否则就拒绝接受它,此时实际上我们接受了“机器工作不正常”这样一个命题。 若用H0表示“ ”,用H1表示其对立面,即“ ”,则问题等价于检验H0: 是否成立,若H0不成立,则H1: 成立。
一架天平标定的误差方差为10-4(克2),重量为的物体用它称得的重量X服从N( )。某人怀疑天平的精度,拿一物体称n次,得n个数据,由这些数据(样本)如何判断“这架天平的精度是10-4(克2)”这个命题是否成立? 记H0: =10-4,其H1: 。则问题等价于检验H0成立,还是H1成立。 问题2
某种电子元件的使用寿命X服从参数为 的指数分布,现从一批元件中任取n个测得其寿命值(样本)如何判定“元件的平均寿命不小于5000小时”这个命题是否成立? 记 问题3 则问题等价于检验H0成立,还是H1成立。
某种疾病,不用药时其康复率为 ,现发明一种新药(无不良反应),为此抽查n位病人用新药的治疗效果,设其中有s人康复,根据这些信息,能否断定“该新药有效”? 记 问题4 则问题等价于检验H0成立,还是H1成立。
自1965年1月1日至1971年2月9日共2231天中,全世界记录到震级4级及以上的地震共计162次,问相继两次地震间隔的天数X是否服从指数分布? 记 服从指数分布, 不服从指数分布。 问题5 则问题也等价于检验H0成立,还是H1成立。
在很多实际问题中,我们常常需要对关于总体的分布形式或分布中的未知参数的某个陈述或命题进行判断,数理统计学中将这些有待验证的陈述或命题称为统计假设,简称假设.在很多实际问题中,我们常常需要对关于总体的分布形式或分布中的未知参数的某个陈述或命题进行判断,数理统计学中将这些有待验证的陈述或命题称为统计假设,简称假设. 如上述各问题中的H0和H1都是假设. 利用样本对假设的真假进行判断称为假设检验。 在总体的概率分布已知情形下,对分布中的未知参数作假设并进行检验,称为参数假设检验 若总体的分布未知,对总体的分布形式或参数作假设并进行检验,称为非参数假设检验。 如上述问题1~4为参数假设检验问题,问题5为非参数假设检验问题.
值得注意的是,当给定原假设后,其对立假设的形式可能有多个,如H0: 其对立形式有 在假设检验问题中,常把一个被检验的假设称为原假设或零假设,而其对立面就称为对立假设。 上述各问题中,H0为原假设,H1为对立假设。 当H0不成立时,就拒绝接受H0而接受其对立假设H1。
选择哪一种需根据实际问题确定,因而对立假设往往也称为备选假设,即在拒绝原假设后可供选择的假设.在假设检验问题中,必须同时给出原假设和对立假设.在参数假设中,不论是原假设还是对立假设,若其中只含有一个参数值,则称为简单假设,否则称为复合假设,如H0: , H1: 为简单假设;而H0: , H1: 为复合假设。
如何利用从总体中抽取的样本来检验一个关于总体的假设是否成立呢?由于样本与总体同分布,样本包含了总体分布的信息,因而也包含了假设H0是否成立的信息,如何来获取并利用样本信息是解决问题的关键.统计学中常用“概率反证法”和“小概率原理”来解决这个问题。 二、假设检验的思想方法
小概率原理 概率很小的事件在一次试验中不会发生.如果小概率事件在一次试验中竟然发生了,则事属反常,定有导致反常的特别原因,有理由怀疑试验的原定条件不成立。 概率反证法 欲判断假设H0的真假,先假定H0真,在此前提下构造一个能说明问题的小概率事件A。试验取样,由样本信息确定A是否发生,若A发生,这与小概率原理相违背,说明试验的前定条件H0不成立,拒绝H0,接受H1;若小概率事件A没有发生,没有理由拒绝H0,只好接受H0。
反证法的关键是通过推理,得到一个与常理(定理、公式、原理)相违背的结论。“概率反证法”依据的是“小概率原理”。那么多小的概率才算小概率呢?这要由实际问题的不同需要来决定。以后用符号 记小概率,一般取 等。 在假设检验中,若小概率事件的概率不超过 ,则称 为检验水平或显著性水平。
已知某炼铁厂的铁水含碳量X~N(4.55,0.06),现改变了工艺条件,又测得10炉铁水的平均含碳量 ,假设方差无变化,问总体的均值 是否有明显改变?(取 =0.05) 下面举例说明以上检验的思想与方法。 例1
由问题提出假设H0: ,H1: 则 与4.55应很接近 用其无偏估计 来代替 由于 未知 用 来衡量 与4.55之间的差异 则可认为 如果 较大 事件 较大,待定)不太可能发生 解 若H0成立 所以在H0成立的前提下 即P(A)很小 令P(A)=α,确定d是解决问题的关键
由 可知 因此在H0成立的前提下,统计量 显然 因此 即 由标准正态分布上分位点的定义可知 由此确定了小概率事件
由 =0.05,得 由于 即认为总体均值 等于4.55 说明小概率事件A未发生,因此接受假设H0
本例中,若取 由P(A)= 同样可确定d 越与4.55接近,越要拒绝 在随机试验中,小概率事件有许多,关键是要找一个能说明问题的小概率事件。 最后的检验将出现这样一种倾向 这样的判别方法显然不合理,错误在于:在H0成立的前提下,这样取小概率事件A不合理。
在本例中,若设 则A:( X1,X2,…,X10) 则拒绝接受H0等价于 样本观测值(x1,x2,…,x10) 一般,若拒绝接受 样本观测值(x1,x2,…,xn) 称D的补集 为H0的接受域 D是使小概率事件A发生的所有10维样本值(x1,…,x10)构成的集合 其中D是n维空间Rn中的区域,则称D为假设H0的拒绝域或否定域、临界域 检验中所用的统计量称为检验统计量
提出假设:根据问题的要求,提出原假设H0与对立假设H1,给定显著水平 及样本容量n。 确定拒绝域:用参数的一个好的估计量 (通常取为 的无偏估计)来代替 ,分析拒绝域D的形式,构造检验统计量g( ),在H0成立的前提下确定g( )的概率分布,通过等式 确定D 总结例8.1处理问题的思想与方法,可得处理参数假设检验问题的步骤如下: (1) (2) 执行统计判决:求统计量的值,并查表求出有关数据,判断小概率事件是否发生,由此作出判决 (3)
数据同例8.1,问总体的均值 是否明显大于4.55? 其中确定拒绝域是关键.拒绝域的形式一般由原假设与对立假设共同确定,对同一原假设H0,不同的对立假设,所得到的H0的拒绝域可能不同。 请看下例。 例2
此问题的合理假设为 代替 用 的无偏估计 是 的一个很好的近似值 在例8.1中,拒绝H0时接受的是H1: 在统计学中,只有当 与4.55的偏差大到一定程度时才可认为 因而其拒绝域设为 较合理 在本例中,拒绝H0时接受的是 ,因而H0的拒绝取为 较合理 解 两个数的偏差用其差的绝对值来衡量
发生的概率应很小 在H0成立的条件下,事件 设P(A)= ,统计量 所以拒绝域为 与例8.1中的拒绝域 不同 由 得 所以判决结果为:接受H0
是一个小概率事件 参数的区间估计则是找一个随机区间I,使I包含待估参数 是个大概率事件 对此两类问题,都是利用样本对参数作判断:一个是由小概率事件否定参数 属于某范围,另一个则是依大概率事件确信某区域包含参数 的真值.两者本质上殊途同归,一类问题的解决,导致解决另一类问题类比方案的形成。 三、 参数假设检验与区间估计的关系 参数假设检验的关键是要找一个确定性的区域(拒绝域) ,使得当H0成立时,事件 一旦抽样结果使小概率事件发生,就否定原假设H0
如设总体 已知,给定容量n的样本 样本均值为 的置信区间为 则参数 的置信度为 假设检验问题 的拒绝域为 也就是说,当 时,接受 即 在区间 内,此区间正是 的置信度 为 的置信区间 接受域为
1.何谓统计假设、复合假设? 2.试述普通反证法与概率反证法的异同点。 3.试述检验统计假设的步骤。 4.设总体 , 为未知参数, 为其一个样本,对下述假设检验问题 取拒绝域为: 试求常数c,使得该检验的显著水平为0.05。 m 习题8-1
若检验统计量服从标准正态分布( 分布,F分布) U检验法( 检验法,F检验法) 第二节 正态总体均值的假设检验 本节讨论有关正态总体的均值与方差的假设检验问题 构造合适的检验统计量并确定其概率分布是解决检验问题的关键 则所得到的相应检验法称为
已知, 设总体 给定显著水平 检验以下不同形式的假设问题: 一、 U检验法(方差已知) 在方差已知的条件下,对一个正态总体的均值或两个正态总体均值差的假设检验常用U检验法。 若X1,X2,…,Xn为取自总体X的样本
和 其中 (1) 前两个为简单假设检验问题,我们已在例8.1及例8.2中求出其拒绝域分别为 下面我们来求H03的拒绝域
H03的拒绝域形式为 (k待定) 等价形式为 若H03成立,则
要控制 只需令 由此得 所以H03的拒绝域为 (2) 此处
比较两种假设检验问题: 可以看出尽管两 者原假设形式不同,实际意义也不一样,但对于相同的显著水平α,它们的拒绝域是相同的。因此,遇到H03与H13的检验问题,可归结为H02与H12来讨论。 对于后面将要讨论的有关正态总体的参数假设检验问题也有类似结果
设总体 X与Y相互独立 已知 给定显著水平 用 、 分别表示样本均值 检验假设 的无偏估计分别为 显然,H0的拒绝形式应为 (k待定) 下面求两个正态总体均值差检验的拒绝域。 从两总体中分别取容量为n1、n2的样本
由于 若H0真,则统计量 由 得 拒绝域为 (3)
例1一种燃料的辛烷等级服从正态分布 ,其平均等级 ,标准差 。现抽取25桶新油,测试其等级,算得平均等级为97.7。假定标准差与原来一样,问新油的辛烷平均等级是否比原燃料的辛烷平均等级偏低?( ) 解 按题意需检验假设 检验统计量 拒绝域(参阅表8-1)
查正态分布表得 计算统计值 执行统计判决 故拒绝H0,即认为新油的辛烷平均等级比原燃料辛烷的平均等级确定偏低。
未知 设总体 对显著水平 检验假设 (k待定) 二、 T检验法(方差未知) 拒绝域形式
得 由于 未知,现在不能用 来作为检验统计量 所以拒绝域为 (4) 注意到S2是 的无偏估计,用S代替 作为检验统计量 采用 当H0真时, 由
类似可给出假设 的拒绝域为 (5) 对正态总体 关于 的各种形式的假设检验的拒绝域列于表8-1。
例2一手机生产厂家在其宣传广告中声称他们生产的某种品牌的手机的待机时间的平均值至少为71.5小时,一质检部门检查了该厂生产的这种品牌的手机6部,得到的待机时间为例2一手机生产厂家在其宣传广告中声称他们生产的某种品牌的手机的待机时间的平均值至少为71.5小时,一质检部门检查了该厂生产的这种品牌的手机6部,得到的待机时间为 69,68,72,70,66,75 设手机的待机时间 ,由这些数据能否说明其广告有欺骗消费者之嫌疑?( )
由于方差 未知,用T检验。 检验统计量 拒绝域 解问题可归结为检验假设
查t分布表,得 统计判决 计算统计值 故接受H0,即不能认为该厂广告有欺骗消费者之嫌疑
设总体 独立 未知 其样本均值为 样本方差为 其样本均值为 ,样本方差为 给定显著水平,检验假设 下面求两个正态总体均值相等性检验的拒绝域。 X1,…,Xn1取自总体X Y1,…,Yn2取自总体Y
(k待定) 拒绝域形式为 当H0成立时,统计量 由第六章第四节例2的结果知:
由 得
例3对用两种不同热处理方法加工的金属材料做抗拉强度试验,得到的试验数据如下:例3对用两种不同热处理方法加工的金属材料做抗拉强度试验,得到的试验数据如下: 方法Ⅰ:31,34,29,26,32,35,38,34,30,29,32,31 方法Ⅱ:26,24,28,29,30,29,32,26,31,29,32,28 设两种热处理加工的金属材料的抗拉强度都服从正态分布,且方差相等。比较两种方法所得金属材料的平均抗拉强度有无显著差异。( )
解 记两总体的正态分布为 本题是要检验假设 检验统计量为 拒绝域为
查t分布表,得 故拒绝H0 统计判决:由于 计算统计值 即认为两种热处理方法加工的金属材料的平均抗拉强度有显著差异。
设总体 未知,样本方差为 给定显著性水平 ,检验假设 的无偏估计为 , 若 成立,则比值 一般来说应在1附近摆动。 所以可取拒绝域形式为: 或 若 与1的偏差较大,则拒绝 第三节 正态总体方差的检验