650 likes | 757 Views
第四章 假设检验. 第一节 假设检验的基本思想和概念. 第二节 一个正态总体的假设检验. 第三节 两个正态总体的假设检验. 第四节 0-1 分布参数的假设检验. 第五节 总体分布的 检验. 第六节 独立性检验. 对所研究的总体的分布函数类型或分布函数中的某个(些)未知参数做出某种可能的假设,然后根据实验所得到的样本数据,对所作出的假设的正确性做出判断,这类问题就是所谓的 假设检验问题。. 假设检验的两类问题: 1. 总体的分布函数的类型是已知的,对总体的分布函数中的一个(些)参数或数字特征进行的检验,称为参数假设检验。
E N D
第四章 假设检验 第一节 假设检验的基本思想和概念 第二节 一个正态总体的假设检验 第三节 两个正态总体的假设检验 第四节 0-1分布参数的假设检验 第五节 总体分布的 检验 第六节 独立性检验
对所研究的总体的分布函数类型或分布函数中的某个(些)未知参数做出某种可能的假设,然后根据实验所得到的样本数据,对所作出的假设的正确性做出判断,这类问题就是所谓的假设检验问题。对所研究的总体的分布函数类型或分布函数中的某个(些)未知参数做出某种可能的假设,然后根据实验所得到的样本数据,对所作出的假设的正确性做出判断,这类问题就是所谓的假设检验问题。 假设检验的两类问题: 1.总体的分布函数的类型是已知的,对总体的分布函数中的一个(些)参数或数字特征进行的检验,称为参数假设检验。 2.对总体分布函数类型的假设检验,称为非参数假设检验。 本章主要讨论正态总体的参数假设检验。同时,简单介绍非参数假设检验。
第一节 假设检验的基本思想和概念 问题的提出 例1某车间用一台包装机包装食盐,设包装的袋装食盐重量服从正态分布。长期实践证明,其标准差为10克,当机器正常工作时,其均值为500克。为检验某天包装机是否工作正常,从该天所包装的食盐中任取16袋,称得其样本平均值为510克,试问:该天包装机是否工作正常? 分析 如果包装的食盐重量 ,由于 未知,因此,包装机器工作是否正常这一问题便是检验总体均值 是否等于500.
例2 A、B两厂生产同一铸件,假设两厂铸件的重量都服从正态分布,测的重量(单位:千克)如下: 问A、B两厂铸件重量的方差是否相等? 分析 设 、 分别表示A、B两厂铸件的重量,则 、 。题中问题便是检验 是否正确。
例3 假设随机抽查了100个铸件,测得其表面的沙眼数如下: 试问:铸件的沙眼数是否服从泊松分布? 分析 设 表示铸件的沙眼数,则 是随机变量。现在的问题是检验: 是否成立。
对总体未知参数或数字特征所作的假设用字母 来表示,如果关于总体有两个对立的假设 和 ,即要么 成立,而 不成立,要么 成立,而 不成立。习惯上,把其中的一个称作原假设(基本假设或零假设),而另外一个假设称为对立假设或备选假设。一般以 表示原假设, 表示备选假设 定义8.1利用样本提供的信息,在对参数或数字特征的原假设 和备选假设 之间做出接受哪一个假设,拒绝哪一个假设判断的过程称为参数假设检验。简称 对 的检验。
假设检验的基本思想 基本思想: 小概率事件在一次试验中实际不会发生。 实际操作: 先设定一个小概率 ( 比较接近于0), 称为显著性水平,在假定原假设成立的条件下,构造出一个基于原假设成立的小概率事件,得出拒绝原假设的区域(称为原假设的否定域或拒绝域),然后,利用样本提供的信息,得出小概率事件是否发生,若发生,则与小概率事件在一次试验中不会发生相矛盾。从而,拒绝原假设,否则,接受原假设。(使用反证法)
假设检验的一般步骤 小概率事件:对于小概率事件中的“小概率”并没有统一的规定,常根据实际问题的要求,规定一个界限 ,当一个事件发生的概率不大于 时,即认为它是小概率事件,通常情况下,界限或者说显著性水平 取0.10,0.05,0.01,0.025,0.005,0.001等比较小的数。 总体分布函数中未知参数的假设有三种形式: (1) (2) (3) 形如(1)的假设检验称为双侧(或双边)假设检验,形如(2)、(3)的假设检验称为单侧(或单边)假设检验。
假设检验的一般步骤 (1)根据问题的要求提出原假设 ; (2)选择检验的统计量或随机变量,并找出在 成立的条件下,该统计量或随机变量所服从的概率分布; (3)根据所给的显著性水平 ,查分位数表,并确定否定域; (4)利用样本值计算统计量的值,考察计算的统计量的值是否落在否定域,据此作出对 接受或拒绝的结论。
假设检验的两类错误 由于小概率事件原理不一定正确,因此假设检验有可能出现以下两类错误。 第一类错误:原假设 是正确的,但检验结果却把它否定了。这叫弃真错误,或叫以真为假错误,也称为第一类错误。常用 表示犯这类错误的概率。可知 第二类错误:原假设 是不正确的,但检验结果却把它肯定了。这叫取伪错误,或叫以假为真错误,也称为第二类错误。常用 表示犯这类错误的概率。 可知
第二节 一个正态总体的假设检验 假设:总体 , 是总体 的样本, 和 分别是样本均值和样本(修正)方差。 对均值的检验有三种形式(1) (2) (3) 对方差的检验有三种形式(1) (2) (3)
正态总体均值的假设检验 (一)方差已知,均值的假设检验 1. 取随机变量 ,则 得 故假设 的拒绝域为
2. 取随机变量 ,当 成立时, 不服从标准 正态分布,于是,引入随机变量 由 得 又 于是 故假设 的拒绝域为
3. 取随机变量 ,当 成立时, 不服从标准 正态分布,于是,引入随机变量 由 得 又 于是 故假设 的拒绝域为
例1 某种橡胶的伸长率 ,现改进橡胶配方,对改进配方后橡胶取样分析,测得其伸长率如下: 0.56,0.53,0.55,0.55,0.58,0.56,0.57,0.57,0.54 已知改进配方后橡胶的伸长率方差不变,问改进配方后橡胶的平均伸长率又无显著变化(取显著性水平 )? 例2 用传统工艺加工的红果罐头,每听平均维生素C的含量服从正态分布 。现改进加工工艺后,抽查9听罐头,测得维生素含量为:23,21,19,20.5,18.8,23,18,19.2,19.5(单位:克)。假设新工艺的方差 为已知。问新工艺下维生素C的含量是否比旧工艺高(取显著性水平 )? 例3 在例2的条件下,问新工艺下维生素C的含量是否比旧工艺低(取显著性水平 )?
(二)方差未知,均值的假设检验 1. 取统计量 ,则 得 故假设 的拒绝域为
2. 取统计量 ,当 成立时, 不服从 分布,于是,引入随机变量 由 得 又 于是 故假设 的拒绝域为
3. 取统计量 ,当 成立时, 不服从 分布,于是,引入随机变量 由 得 又 于是 故假设 的拒绝域为
例4 设某次考试的考生成绩 服从正态分布,从中随机地抽取36位考生,测得平均成绩为66.5分,标准差为15分,问在显著性水平0.05下,是否可以认为这次考生的平均成绩为70分? 例5 某装置的平均工作温度(据制造厂家称)不高于190度。今从一个16台装置构成的随机样本中测得工作温度的平均值和标准差分别为195度和8度。根据这些数据能否说明平均温度比制造商所说的要高?取显著性水平 ,并设工作温度服从正态分布。 例6 某厂生产的缆绳,其抗拉强度 服从正态分布,均值为10600公斤。今改变工艺,从工艺改进后生产的缆绳中任抽10根,测得抗拉强度为:10533,10641,10688,10572,10793,10729,10600,10633,10721,10570。试在显著性水平 下检验新工艺生产的缆绳抗拉强度是否比原来工艺生产的缆绳抗拉强度低?
正态总体方差的假设检验 (一)均值已知,方差的假设检验 1. 取统计量 ,则 。 得 故假设 的拒绝域为
2. 取统计量 ,则 不服从 , 引入随机变量 ,则 . 当 成立时,有 又由 有 故假设 的拒绝域为
3. 取统计量 ,则 不服从 , 引入随机变量 ,则 . 当 成立时,有 又由 有 故假设 的拒绝域为
例7 某厂生产的铜丝折断力 ,今从其生产的产品中任取10根,测得折断力数据如下(单位:公斤): 570,578,570,572,568,572,570,572,596,584. 试问:是否可以认为生产的铜丝的折断力的方差为64(取显著性水平 )? 例8 在例7条件下,试问:是否可以认为该厂生产的铜丝的折断力的方差小于64?(显著性水平 )
正态总体方差的假设检验 (二)均值未知,方差的假设检验 1. 取统计量 ,则 得 故假设 的拒绝域为
2. 取统计量 ,则 不服从 引入随机变量 ,则 . 当 成立时,有 又由 有 故假设 的拒绝域为
3. 取统计量 ,则 不服从 引入随机变量 ,则 . 当 成立时,有 又由 有 故假设 的拒绝域为
例9 用自动包装机包装食盐,每袋质量 。在正常情况下,每袋质量500克,标准差15克。每隔一段时间需要检验机器的工作情况,现从刚生产出来的袋装食盐中抽取9袋,测得其质量(单位:克)分别为524,506,518,511,497,510,488,512,515.试在显著性水平 下检验自动包装机的工作是否正常? 例10 电工器材厂生产一批保险丝,抽取10根试验其熔断时间,结果为42,65,75,78,71,59,57,68,54,55.问是否可以认为整批保险丝的熔断时间的方差不大于80(家设熔断时间服从正态分布,取显著性水平 ) ?
第三节 两个正态总体的假设检验 假设:两个总体 相互独立,且 和 分别是 和 的样本, 分别是 的样本均值, 分别是 的样本(修正)方差。 对均值的检验有三种形式(1) (2) (3) 对方差的检验有三种形式(1) (2) (3)
一.关于 的假设检验 (一) 均已知, 的假设检验 1. 引入随机变量 ,则 得 故 的拒绝域为:
2. 选取统计量 引入随机变量 ,则 在 成立的条件下, 故 的拒绝域为:
3. 选取统计量 引入随机变量 ,则 在 成立的条件下, 故 的拒绝域为:
例1 卷烟厂向化验室送去A、B两种烟草欲化验尼古丁的含量是否相同,从A、B中随机的抽取质量相同的5例进行化验,测得尼古丁的含量(单位:mg)为: 根据经验,尼古丁的含量服从正态分布,且A的方差为5,B的 方差为8。取 ,问这两种烟草的尼古丁含量是否有差异? 例2 在某大学中,从经常参加体育运动的男生中随意抽取50人,测得平均身高是174.34cm,在不经常参加体育运动的男生中随意选出50人测得平均身高是172.42cm,假设两种类型的男生的身高都服从正态分布,其标准差相应地为5.35cm和6.11cm,问该校中经常参加体育运动的男生是否比不参加运动的男生身高要高些(取 )?
(一) 均未知, 的假设检验 1. 引入随机变量 ,则 ,其中 得 故 的拒绝域为:
2. 选取统计量 引入随机变量 ,则 在 成立的条件下, 故 的拒绝域为:
3. 选取统计量 引入随机变量 ,则 在 成立的条件下, 故 的拒绝域为:
例3 对用两种不同的热处理方法加工的某金属材料作抗拉强度试验,得到试验的数据如下(单位:千克/米) 设用两种热处理方式加工的金属的抗拉强度军服从正态分布,且方差相等。在给定的显著性水平 下,问两种热处理方法加工的金属材料的抗拉强度有无显著差异?
二.关于 的假设检验 (一) 均未知, 的假设检验 1. 引入随机变量 当 为真时, 由 得 故 的拒绝域为:
2. 引入统计量 及随机变量 ,它服从 当 为真时, , 由 得 故 的拒绝域为:
3. 引入统计量 及随机变量 ,它服从 当 为真时, , 由 得 故 的拒绝域为:
例4 甲、乙两厂生产同一电阻,现从两厂生产的电阻中分别随机抽取12件和10件样本,测得他们的电阻后,计算出样本方差分别为 。假设电阻值服从正态分布,在显著性水平 下,我们是否可以认为两厂生产的电阻值的方差:(1) ;(2)
第四节 0-1分布参数的假设检验 假设:总体 ,其分布律为: 对 的检验有三种形式 (1) (2) (3)
对 的假设检验 在 成立时,则由中心极限定理知:当 充分大时 统计量 ,则 得 故假设 的拒绝域为
对 的假设检验 2. 引入统计量 由中心极限定理知:当 充分大时 统计量 ,则 由 得 故假设 的拒绝域为
对 的假设检验 3. 引入统计量 由中心极限定理知:当 充分大时 统计量 ,则 由 得 故假设 的拒绝域为
例1 按规定,某种型号的电子元件的使用寿命低于500小时为不合格产品。从某厂生产的产品中任意抽取300件样品进行检验,发现有14件的使用寿命低于500小时。问是否可以认为该厂产品的不合格率为4%( )
第五节 总体分布的 检验 当总体分布函数未知时,则需要根据样本观测值对总体的分布函数进行推断,这就是总体分布函数的拟合检验,下面介绍皮尔逊(Pearson)方法: 设总体 的分布函数 未知, 为总体 的样本,检验假设
若总体 为离散型随机变量,则检验假设 若 为连续型随机变量,则检验假设 检验的基本思想 将随机试验可能的结果的全体分为 个互不相容的事件 ,在 成立的条件下计算 在 次试验中,事件 出现的频率 与 常有差异,若试验次数很多,在 成立下, 的值应该比较小。选取统计量
检验的基本思想 皮尔逊定理 定理8.1 若 充分大( ),则当 成立时,不论总 体 服从何种分布,统计量 近似地服从自由度 为 的 分布。其中 是分布中的未知参数的个数。 在 成立时,可计算 的值,对于给定的显著性水平 ,查表得 。若 ,则拒绝 ,否则,接受 。
检验的一般步骤 (1)提出原假设 (2)将实数轴分为 个不相交的区间 其中 可取至 , 可取至 ,一般有 ; (3)计算观测值频数 ,即 个观测值落在 的个数 ; (4)在 成立时,计算 落在各区间的概率 进而得到理论的频数 ; (5)将 代入 的表达式求出其值; (6)查 分布表得 ; (7)作结论: 若 ,则拒绝 ,否则,可接受 。 注意: 检验一般要求 ,否则应适当的将相邻区间合并,以满足要求。此时区间个数相应减少。