第 5 章假设检验

第5章假设检验 会计学2011级主讲：王红娜

本章内容 • 假设检验的基本思想 • 5.1 假设检验的基本问题 • 5.2 一个总体参数的检验 • 讨论：假设检验与区间估计

假设检验的基本思想——引例 • 某企业生产一种零件，过去资料表明其平均长度为4厘米，标准差为0.1厘米。改革工艺后，随机抽查了100个零件，测得样本平均长度为3.95厘米。问：工艺改革前后零件的长度是否发生了显著变化？ • 改革后零件的平均长度事先并不知道。可先假设为4厘米，然后利用样本的平均长度来检验假设是否正确。 • 这就是一个假设检验问题。

分析引例，原假设 • 若原假设成立，即工艺改革后零件长度没有显著变化，则样本均值服从正态分布，且样本均值为3.95。如果二者有显著差异，我们有理由认为样本不是取自均值为的总体，即认为工艺改革后零件长度不是。

换言之，应当确定一个区间，如，如果样本取自均值为的总体，则只要是简单随机抽样，样本均值都应该以很大的概率落入此区间内。即落入此区间外的概率应该很小。一旦这个小概率事件发生，人们必然怀疑原假设的真实性。换言之，应当确定一个区间，如，如果样本取自均值为的总体，则只要是简单随机抽样，样本均值都应该以很大的概率落入此区间内。即落入此区间外的概率应该很小。一旦这个小概率事件发生，人们必然怀疑原假设的真实性。

在解决实际问题时，人们事先指定一个小概率，如取0.10，0.05，0.025等，使得当实际正确时否定的概率。可由概率等式来确定常数，即误差范围。在解决实际问题时，人们事先指定一个小概率，如取0.10，0.05，0.025等，使得当实际正确时否定的概率。可由概率等式来确定常数，即误差范围。 • 基本思路： • 首先假设成立，然后进行统计推断，如果导致一个不合理的现象发生，即小概率事件在一次抽样中发生了，则否定原假设，这里运用的是“小概率事件在一次实验中几乎是不可能发生的”这一原则。

若取置信度为0.99，则， • 也就是说，如果原假设为真，则样本均值的标准化值发生了，即小概率事件发生了，则拒绝。 • 本例计算结果： • 说明小概率事件发生了，这是不合理的，应拒绝原假设。

小结小概率事件发生对未知总体作某种假设样本观察结果抽样检验拒绝原假设不拒绝原假设小概率事件未发生

可见，假设检验的基本思想是——带有概率性质的反证法！可见，假设检验的基本思想是——带有概率性质的反证法！ • 假设检验的两个特点： • 其逻辑推理方法是反证法 • 判断结果合理与否，是基于“小概率事件不易发生”这一原理

5.1教学要求 • 能熟练陈述问题的假设 • 理解两类错误与显著性水平，理解两类错误之间的关系 • 理解检验统计量的构造方法，理解拒绝域的含义 • 理解值的含义，会用值进行决策判断

假设的陈述 • 两类错误与显著性水平 • 检验统计量与拒绝域 • 利用值进行决策 5.1 假设检验的基本问题一二三四转到5.2

一、假设的陈述 • 什么是假设？ • 对总体参数的具体数值所作的陈述 • 总体参数包括总体均值、比率、方差等 • 分析之前必须陈述我认为该企业生产的零件的平均长度为4厘米!

假设检验就是先对总体的参数(或分布形式)提出某种假设，然后利用样本信息判断假设是否成立的过程。假设检验就是先对总体的参数(或分布形式)提出某种假设，然后利用样本信息判断假设是否成立的过程。 • 假设检验包括参数检验和非参数检验两种方法。 • 假设检验逻辑上运用反证法，统计上依据小概率原理。

一个简单的例子 • 一名被告正在受法庭的审判，根据英国法律，先假设被告是无罪的，于是证明他有罪的责任就落在原告律师身上。用假设检验的术语就是要建立一个假设，记为：被告是无罪的，称为原假设或零假设。另一个可供选择的假设记作：被告是有罪的，称为备择假设或替代假设。法庭陪审团要审查各种证据，以确定原告律师是否证实了这些证据与“无罪”这一原假设不一致。如果陪审团员们认为证据与不一致，他们就拒绝该原假设而接受其备择假设，即认为被告有罪。

反证法 • 如果一个人说他从来没有骂过人。他能够证明吗？ • 要证明他没有骂过人，他必须出示他从小到大每一时刻的录音录像，所有书写的东西等等，还要证明这些物证是完全的、真实的、没有间断的。这简直是不可能的。即使他找到一些证人，比如他的同学、家人和同事，那也只能够证明在那些证人在场的某些片刻，他没有被听到骂人。反过来，如果要证明这个人骂过人很容易，只要有一次被抓住就足够了。 • 看来，企图肯定什么事物很难，而否定却要相对容易得多。这就是假设检验背后的哲学。 • 科学往往是在否定中发展。

在假设检验中，一般要设立一个原假设（上面的“从来没骂过人”就是一个原假设）；在假设检验中，一般要设立一个原假设（上面的“从来没骂过人”就是一个原假设）； • 而设立该假设的动机主要是企图利用人们掌握的反映现实世界的数据来找出假设与现实之间的矛盾，从而否定这个假设。

在多数统计教科书中（除理论探讨外），假设检验都是以否定原假设为目标。如否定不了，说明证据不足，无法否定原假设。但这并不等于原假设正确，而是“没有足够证据拒绝原假设”，因此“不能接受原假设”。在多数统计教科书中（除理论探讨外），假设检验都是以否定原假设为目标。如否定不了，说明证据不足，无法否定原假设。但这并不等于原假设正确，而是“没有足够证据拒绝原假设”，因此“不能接受原假设”。 • 就像一两次没有听过他骂人还远不能证明他从来没有骂过人。

假设检验的过程：提出假设→抽取样本→作出决策假设检验的过程：提出假设→抽取样本→作出决策

原假设(null hypothesis) • 研究者想收集证据予以反对的假设，又称“0假设”，总是有符号“”，“”或“”，表示为 • 如：： • 例如：：

备择假设(alternative hypothesis) • 研究者想收集证据予以支持的假设，也称“研究假设”，总是有符号“”，“”或“”，表示为 • ：某一数值或某一数值 • 例如：：或

提出假设(例题分析) • 例1：一种零件的生产标准是直径应为，为对生产过程进行控制，质量监测人员定期对一台加工机床检查，确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于，则表明生产过程不正常，必须进行调整。试陈述用来检验生产过程是否正常的原假设和备择假设。 • 研究者想收集证据予以证明的假设应该是“生产过程不正常”。 • 建立的原假设和备择假设为：

例2：某品牌洗涤剂在它的产品说明书中声称：平均净含量不少于500克。从消费者的利益出发，有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设。例2：某品牌洗涤剂在它的产品说明书中声称：平均净含量不少于500克。从消费者的利益出发，有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设。 • 研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述。 • 建立的原假设和备择假设为：

例3：一家研究机构估计，某城市中家庭拥有汽车的比率超过30%。为验证这一估计是否正确，该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设。例3：一家研究机构估计，某城市中家庭拥有汽车的比率超过30%。为验证这一估计是否正确，该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设。 • 研究者想收集证据予以支持的假设是“该城市中家庭拥有汽车的比率超过30%”。 • 建立的原假设和备择假设为：

提出假设(结论与建议) • 原假设和备择假设是一个完备事件组，而且相互对立 • 在一项假设检验中，原假设和备择假设必有一个成立，且只有一个成立 • 先确定备择假设，再确定原假设 • 等号“”总是放在原假设上 • 原假设的符号是“”，“”或“” • 因研究目的不同，对同一问题可能提出不同的假设(也可能得出不同的结论)

双侧检验与单侧检验 • 备择假设没有特定的方向性，并含有符号“”的假设检验，称为双侧检验或双尾检验(two-tailed test) • 备择假设具有特定的方向性，并含有符号“”或“”的假设检验，称为单侧检验或单尾检验(one-tailed test) • 备择假设的方向为“”，称为左侧检验 • 备择假设的方向为“”，称为右侧检验

双侧检验与单侧检验 ——假设的形式 返回5.1目录

二、两类错误与显著性水平 • 第Ⅰ类错误(弃真错误) • 原假设为真时拒绝原假设（原假设为真，但由于样本的随机性，样本统计量落入拒绝域，使我们做出错误决策）。 • 小概率事件只是发生的概率很小，但并非绝对不发生。犯这类错误的概率就是小概率事件发生的概率，称为显著性水平，记为。

第Ⅱ类错误(取伪错误) • 原假设为假时未拒绝原假设（原假设为假，但由于样本的随机性，样本统计量落入接受域，使我们做出错误决策）。 • 第Ⅱ类错误的概率记为。

假设检验中的两类错误—决策结果 假设检验就好像一场审判过程，：无罪统计检验过程

错误与错误的关系

小结 • 错误与错误此消彼长，但； • 要同时减少与，须增大样本容量； • 通常先控制犯错误的概率； • 发生第Ⅰ类错误的概率被称为显著性水平，记为，是人们事先指定的犯第Ⅰ类错误的概率的最大允许值； • 错误的概率不好控制，将“接受原假设”更倾向于说成“不拒绝原假设”。

显著性水平(significant level) • 显著性水平是一个概率值 • 原假设为真时，检验统计量落在拒绝域的概率 • 表示为 • 常用的值有0.01, 0.05, 0.10 • 值由研究者事先确定。

假设检验中的小概率原理 • 什么小概率？ • 在一次试验中，一个几乎不可能发生的事件发生的概率； • 在一次试验中小概率事件一旦发生，我们就有理由拒绝原假设； • 小概率的值由研究者事先确定。

专家视野 • 著名的英国统计学家Ronald Fisher在他的研究中常常使用的小概率标准为0.05。 • 作为一个普遍适用的原则，后来人们通常选择显著性水平为0.05，当然也可比它大一些或小一些。 • 较常用的显著性水平有： • ，，返回5.1目录

三、检验统计量与拒绝域 • 根据样本观测结果计算得到的，并据以对原假设和备择假设作出决策的某个样本统计量，称为检验统计量。 • 检验统计量实际上是总体参数的点估计量。 • 标准化的检验统计量： • 对样本统计量进行标准化的依据 • 原假设为真 • 点估计量的抽样分布

拒绝域与临界值 • 能够拒绝原假设的统计量的所有可能取值的集合称为拒绝域。在图上表现为由显著性水平所围成的区域。 • 拒绝域的大小与事先选定的显著性水平有一定关系：当样本量固定时，拒绝域的面积随的减小而减小。 • 根据给定的显著性水平确定的拒绝域的边界值，称为临界值（Critical Value）。

显著性水平和拒绝域——双侧检验

显著性水平和拒绝域——单侧检验

显著性水平和拒绝域——左侧检验

显著性水平和拒绝域——右侧检验

假设检验的结论是在给定的显著性水平下作出的。显著水平不同，对同一问题所下的结论可能完全相反。假设检验的结论是在给定的显著性水平下作出的。显著水平不同，对同一问题所下的结论可能完全相反。上图中的蓝点：在0.1的显著性水平下，拒绝原假设；在0.05的显著性水平下，不拒绝原假设。

即使在同一显著性水平下，由于临界值是固定的，拒绝域也就固定了。即使在同一显著性水平下，由于临界值是固定的，拒绝域也就固定了。讨论：和谁拒绝原假设的理由更充分？也就是说谁犯拒真错误的概率更小？

由显著性水平的含义可知： • 由图可以观察到： • 由于，显然，拒绝原假设的理由更充分，即犯拒真错误的概率更小。

思考题 • 生产耐高温玻璃，至少要能抗住500℃高温而玻璃不变形，这时对产品质量检验所设立的假设为（） A ：B ： C ： D ： • 加工零件所使用的毛坯如果过短，加工出来的零件则达不到规定的标准长度μ0，对生产毛坯的模框进行检验，所采用的原假设应当为（） A B CD

思考题 • 在假设检验中，原假设，备择假设，则称（）为犯第二类错误。 A为真，接受B 为真，拒绝 C不真，接受D不真，拒绝

思考题 • 在一次假设检验，当显著性水平为0.01时，原假设被拒绝，若用0.05的显著性水平去检验，则（） A一定会被拒绝 B 一定不会被拒绝 C有可能拒绝原假设 D 需要重新检

思考题 • 设是显著性水平，是置信水平，若是统计量的临界值，则，；若、是统计量的临界值，且，则，。

决策规则 • 给定显著性水平，查表得出相应的临界值或，或 • 将检验统计量的值与水平的临界值进行比较 • 作出决策 • 双侧检验：，拒绝 • 左侧检验：，拒绝 • 右侧检验：，拒绝返回5.1目录

第 5 章 假设检验