520 likes | 658 Views
总体均值的检验. 总体比率的检验. 总体方差的检验. 5.2 一 个总体参数的 检验. 一. 二. 三. 转到 5.3. 一个总体参数的检验分类及方法. 一个总体. 总体均值. 总体比率. 总体方差. 检验 (单尾和双尾). 检验 ( 单尾和双尾). 检验 ( 单尾和双尾). 检验 (单尾和双尾). 一、总体均值的检验. 样本容量. 大. 小. 是否已知. 是否已知. 是. 否. 是. 否. 检验. 检验. 检验. 检验. 总体均值的 检验情况 1 :大样本. 假定条件 正态 总体或非 正态 总体,大 样本 ( )
E N D
总体均值的检验 • 总体比率的检验 • 总体方差的检验 5.2 一个总体参数的检验 一 二 三 转到5.3
一个总体参数的检验分类及方法 一个总体 总体均值 总体比率 总体方差 检验 (单尾和双尾) 检验 (单尾和双尾) 检验 (单尾和双尾) 检验 (单尾和双尾)
一、总体均值的检验 样本容量 大 小 是否已知 是否已知 是 否 是 否 检验 检验 检验 检验
总体均值的检验情况1:大样本 • 假定条件 • 正态总体或非正态总体,大样本() • 使用z检验统计量 • 已知: • 未知:
总体均值的检验:已知(例题分析) • 一种罐装饮料采用自动生产线生产,每罐的容量是,标准差为。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了40罐进行检验,测得每罐平均容量为。取显著性水平,检验该天生产的饮料容量是否符合标准要求? 双侧检验
拒绝 H0 拒绝 H0 0.025 0.025 0 z 1.96 -1.96 • 提出假设 • 已知: • 临界值: • 检验统计量: • 决策: • 由于,所以不拒绝 • 结论 • 样本提供的证据表明:该天生产的饮料符合标准要求。
总体均值的检验(检验)(值的计算与应用) • 第1步:进入Excel表格界面,直接点击“”(粘贴函数); • 第2步:在函数分类中点击“统计”,并在函数名的菜单下选择“(标准正态分布函数)”,然后确定; • 第3步:将的绝对值1.01录入,得到的函数值为0.843752345,,值远远大于,故不拒绝。
总体均值的检验:未知(例题分析) • 一种机床加工的零件尺寸绝对平均误差为。生产厂家现采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取50个进行检验。利用这些样本数据,检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低?() 左侧检验
提出假设 • 已知: • 临界值: • 检验统计量: • 决策: • 由于,落在拒绝域,所以拒绝 • 结论 • 新机床加工的零件尺寸的平均误差与旧机床相比有显著降低。
总体均值的检验(检验)(值的计算与应用) • 第1步:进入Excel表格界面,直接点击“”(粘贴函数); • 第2步:在函数分类中点击“统计”,并在函数名的菜单下选择“(检验)”,然后确定; • 第3步:在所出现的对话框Array框中,输入原始数据所在区域;在后输入参数的某一假定值(这里为1.35);在Sigma后输入已知的总体标准差(若总体标准差未知则可忽略不填,系统将自动使用样本标准差代替) • 第4步:用1减去得到的函数值0.995421023,即为值 ,拒绝
总体均值的检验:未知(例题分析) • 某一小麦品种的平均产量为。一家研究机构对小麦品种进行了改良以期提高产量。为检验改良后的新品种产量是否有显著提高,随机抽取了36个地块进行试种,得到的样本平均产量为,标准差为。试检验改良后的新品种产量是否有显著提高?() 右侧检验
提出假设 • 已知: • 临界值: • 检验统计量: • 决策: • 由于,落在拒绝域,所以拒绝 • 结论 • 改良后的新品种产量有显著提高。
总体均值的检验情况2:小样本 • 假定条件 • 总体服从正态总体,小样本() • 使用z检验统计量 • 已知: • 未知:
总体均值的检验(例题分析) • 一种汽车配件的平均长度要求为12cm,高于或低于该标准均是不合格的。汽车生产企业在购进配件时,通常是经过招标,然后对中标的配件提供商提供的样品进行检验,以决定是否购进。现对一个配件提供商提供的10个样本进行了检验。假定该供货商生产的配件长度服从正态分布,在0.05的显著性水平下,检验该供货商提供的配件是否符合要求? 双侧检验
提出假设 • 已知: • 临界值: • 检验统计量: • 决策: • 由于,所以不拒绝 • 结论 • 该供货商提供的零件符合要求。
总体均值的检验(检验)(值的计算与应用) • 第1步:进入Excel表格界面,直接点击“”(粘贴函数); • 第2步:在函数分类中点击“统计”,并在函数名的菜单下选择“(标准正态分布函数)”,然后确定; • 第3步:在出现对话框的栏中输入计算出的的绝对值0.7035,在(自由度)栏中输入本例的自由度9,在栏中输入2(表明是双侧检验,如果是单测检验则在该栏输入1) • 第4步:,值,故不拒绝。 返回5.2目录
二、总体比率的检验 • 假定条件 • 大样本 • 检验的统计量 注:为总体比率的假设值
总体比率的检验(例题分析) • 一种以休闲和娱乐为主题的杂志,声称其读者群中有80%为女性。为验证这一说法是否属实,某研究部门抽取了由200人组成的一个随机样本,发现有146个女性经常阅读该杂志。分别取显著性水平和,检验该杂志读者群中女性的比率是否为80%?它们的值各是多少? 双侧检验
提出假设 • 已知: • 临界值: • 检验统计量 • 决策 • 由于,所以拒绝 • 结论 • 该杂志的说法并不属实。
提出假设 • 已知: • 临界值: • 检验统计量: • 决策: • 由于,所以不拒绝 • 结论 • 该杂志的说法属实。 返回5.2目录
三、总体方差的检验(检验) • 检验一个总体的方差或标准差 • 假设总体近似服从正态分布 • 使用分布 • 检验统计量 样本方差 总体方差的假设值
总体方差的检验(例题分析) • 啤酒生产企业采用自动生产线灌装啤酒,每瓶的装填量为,但由于受某些不可控因素的影响,每瓶的装填量会有差异。此时,不仅每瓶的平均装填量很重要,装填量的方差同样很重要。如果方差很大,会出现装填量太多或太少的情况,这样要么生产企业不划算,要么消费者不满意。假定生产标准规定每瓶装填量的标准差不应超过和不应低于。企业质检部门抽取了瓶啤酒进行检验,得到的样本标准差为。试以的显著性水平检验装填量的标准差是否符合要求? 双侧检验
提出假设 • 已知: • 临界值: • 检验统计量: • 决策: • 由于,所以不拒绝 • 结论 • 装填量的标准差符合要求。 返回5.2目录
5.3教学目标 • 理解区间估计与假设检验的关系 • 会用区间估计方法进行假设检验
区间估计与假设检验的关系 • 利用置信区间进行假设检验 5.3 区间估计与假设检验 一 二 本章小结
一、区间估计与假设检验的关系 • 区间估计是以 的概率保证总体参数落在置信区间内。越小,置信区间就越宽。 • 在假设检验中,当给定和确定检验统计量之后,临界值的位置已经确定,由临界值围成的接受域就是以为中心的置信区间。检验原假设是否成立,就是看检验统计量是否落在这个区间内。 • 因此,区间估计问题与假设检验问题可以相互转换。
实例讨论区间估计与假设检验的关系 • 例1:某商场从一批袋装食品中随机抽取10袋,测得平均每袋重量为791.1克,标准差为17.136克。要求:以95%的把握程度求这批食品平均每袋重量的置信区间。 • 解:, 即: 区间估计问题
例2:上例若要求判断总体均值是否为800克,则区间估计问题就变成了一个假设检验问题例2:上例若要求判断总体均值是否为800克,则区间估计问题就变成了一个假设检验问题 • 解:, 查分布表: 比较: 决策: • 不拒绝,可以认为总体均值为800克。
例3:某研究者估计本市居民家庭的电脑拥有率为30%。现在随机抽查了200个家庭,其中68个家庭拥有电脑。试问该研究者的估计是否可信?例3:某研究者估计本市居民家庭的电脑拥有率为30%。现在随机抽查了200个家庭,其中68个家庭拥有电脑。试问该研究者的估计是否可信? • 解:建立假设:, 查表:,由于,故不能拒绝原假设,即认为研究者的估计是可信的。 假设检验问题
例4:上例若是要求在90%的把握程度下,估计全市居民家庭拥有电脑比例的置信区间,则假设检验问题就转变成参数估计问题了。例4:上例若是要求在90%的把握程度下,估计全市居民家庭拥有电脑比例的置信区间,则假设检验问题就转变成参数估计问题了。 • 解:, • 即总体在90%的置信度的置信区间为 • 请思考:这一结论与例3中接受原假设“”有何联系?
区间估计与假设检验思想的一致性 • 需要根据样本选择合适的统计量,要求统计量的分布已知,且可以通过样本算出统计量的具体值。常用的统计量有、、。 • 要根据小概率原理构造小概率事件。 • 区间估计中用来确定置信水平的置信区间; • 而在假设检验中则用来确定拒绝域。 • 可以从置信区间出发作检验。
区间估计和假设检验的区别 • 二者的目的各不相同 • 区间估计的目的是求总体参数的范围,故总体参数是未知的,要求出它的置信区间; • 假设检验的目的是对总体参数等于某一特定值的认定,因而总体参数是已知的(是个假设值) • 二者考虑的重点有所不同 • 区间估计中考虑的是,即可信度为; • 假设检验中考虑的是,即犯第一类错误的概率为。
二者对问题的了解程度不同 • 区间估计是对未知参数一无所知,而假设检验是对未知参数有所了解,但无确切把握。
如果我们对实际问题有很多实际了解和经验,或有许多非样本信息需要考虑,则我们应使用假设检验的方法、非样本信息的影响通过和的选定发生作用。如果我们对实际问题有很多实际了解和经验,或有许多非样本信息需要考虑,则我们应使用假设检验的方法、非样本信息的影响通过和的选定发生作用。 • 如果我们对问题除样本外没有其他信息需要考虑,用区间估计的方法较稳妥,因为区间估计既能得到总体参数的区间,又有置信度的数值,作判断较为客观,能减少失误。 返回5.3目录
利用置信区间进行假设检验(双侧检验) • 求出双侧检验总体均值的置信区间 • 已知: • 未知: • 若总体的假设值在置信区间外,拒绝
利用置信区间进行假设检验(左侧检验) • 求出单边置信下限 (已知) 或: (未知) • 若总体的假设值小于单边置信下限,拒绝
利用置信区间进行假设检验(右侧检验) • 求出单边置信上限 或: • 若总体的假设值大于单边置信上限,拒绝
利用置信区间进行假设检验(例子) • 一种袋装食品每包的标准重量应为1000克。现从生产的一批产品中随机抽取16袋,测得其平均重量为991克。已知这种产品重量服从标准差为50克的正态分布。试确定这批产品的包装重量是否合格?() 属于决策的假设!
提出假设 • 已知: • 临界值: • 检验统计量: • 决策: • 假设的在置信区间内,接受 • 结论 • 表明这批产品的包装重量合格。 返回5.3目录
本章小节 • 假设检验的基本问题 • 一个总体参数的检验 • 用Excel进行检验 • 利用值进行检验
知识要点回顾 • 假设检验的原理 • 小概率事件在一次试验中几乎不会发生。 • 假设检验的步骤: • 根据要检验的问题提出检验假设。 • 根据已知条件选一个统计量,要求在成立时,该统计量分布已知。 • 根据显著性水平,确定的拒绝域。 • 根据样本观测值计算统计量,并与临界值比较。 • 下结论:如果计算的统计量在的拒绝域内,则拒绝,接受;如果计算的统计量不在的拒绝域内,则不拒绝。
假设检验易犯的两类错误及其关系 • 两类错误: • “弃真”错误(第一类错误,犯这类错误的概率不超过显著性水平) • “存伪”错误(第二类错误,犯这类错误的概率通常记作)。 • 两类错误的关系 • 在样本容量一定时,减小,则增大;减小,则增大。要想让二者都减小,只能增大样本容量。
一个正态总体参数的假设检验 • 一个总体均值的假设检验 • 大样本 • 已知 • 知 • 小样本 • 已知 • 知 • 一个总体比率的假设检验 • 一个总体方差的假设检验