960 likes | 1.09k Views
第 4 章 参数估计. 会计学 2011 级. 参数估计在统计方法中的地位. 统计方法. 描述统计. 推断统计. 参数估计. 假设检验. 统计推断的 过程. 参数估计的基本原理. 一个总体参数的区间估计. 样本量的确定. 第 4 章内容. 4 .1. 4.2. 4.3. 4.1 教学目标. 理解估计量 与估计值的 概念 了解 点估计的概念,理解区间估计的基本原理 掌握 评价 估计量优良性的 标准. 估计量与估计值. 点估计与区间估计. 评价估计量的标准. 4.1 参数估计的基本原理. 一. 二. 三. 至: 4.2.
E N D
第4章 参数估计 会计学2011级
参数估计在统计方法中的地位 统计方法 描述统计 推断统计 参数估计 假设检验
参数估计的基本原理 • 一个总体参数的区间估计 样本量的确定 第4章内容 4.1 4.2 4.3
4.1教学目标 • 理解估计量与估计值的概念 • 了解点估计的概念,理解区间估计的基本原理 • 掌握评价估计量优良性的标准
估计量与估计值 • 点估计与区间估计 • 评价估计量的标准 4.1 参数估计的基本原理 一 二 三 至:4.2
一、估计量与估计值 • 估计量:用于估计总体参数的统计量的名称 • 如样本均值、样本比率、样本方差等 • 例如:样本均值就是总体均值的一个估计量 • 总体参数用表示,估计量用表示 • 估计值:估计总体参数时计算出来的统计量的具体数值 • 如果样本均值,则就是的估计值
思考题 • 估计量的含义是指( ) • A.用来估计总体参数的统计量的名称 • B.用来估计总体参数的统计量的具体数值 • C.总体参数的名称 • D.总体参数的具体取值 返回4.1目录
二、点估计与区间估计 估计方法 点估计 区间估计
1. 点估计(point estimate) • 用样本估计量的值直接作为总体参数的估计值 • 用样本均值直接作为总体均值的估计,用样本方差直接作为总体方差的估计,用样本比率直接作为总体比率的估计,等等 • 用一个随机样本的平均成绩分作为全班学生平均成绩的估计值 • 用样本的合格率作为一批产品的合格率 • 点估计的缺陷 • 没有给出估计值接近总体参数真实值的程度的信息
2.区间估计(interval estimate) • 区间估计: • 在点估计的基础上,给出总体参数估计的一个区间范围,该估计区间由样本统计量加减抽样误差而得到; • 同时还能够根据样本统计量的抽样分布对样本统计量与总体参数的接近程度给出一个概率度量,或者说区间估计能给出总体参数以多大的概率落在这个范围内。
区间估计的概念 • 设为总体的未知参数,为来自总体的容量为的简单随机样本,对于预先给定的一个充分小的正数,我们构造两个统计量和,其中:,,使得,则称区间为总体参数的区间估计或置信区间。称为置信区间的置信度,也称置信概率、置信系数或置信水平,称为置信下限,称为置信上限。
90%的样本 95% 的样本 99% 的样本 区间估计的图示
置信水平 • 将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比率即为置信水平,表示为。 • 抽取100个样本,根据每个样本构造一个置信区间,那么,由100个样本构造的总体参数的100个置信区间中,有95%的区间包含了总体参数的真值,而5%则没有包含,则95%被称为置信水平。 • 是总体参数未落在区间内的比率。 • 常用的置信水平值有,,。相应的为,,。
举例说明置信水平 • 假设我们要在很短的时间内了解某个企业的职工工资水平,由于时间局限,只能在300名职工中选出10名,通过这10名职工的平均工资水平来估计全厂职工的工资水平。假设抽样误差不超过20元,如果这10名职工的平均工资为680元,则全场职工的平均工资水平应为。
但问题在于,如果我们在选样时备选单位工资分布较均匀,那么这种代表性当然就很强,出现误差数肯定在20元以内,但如果在选样时,被选单位工资过高或过低,那么算出来的工资与实际水平的误差就可能不止20元了,因为随机抽样,误差水平不同,所以无法使得误差水平一定在预先设定的范围内,而只能说在这个范围内的一种可能程度或概率,比如说有的可能会使误差在预先设定的范围内。但问题在于,如果我们在选样时备选单位工资分布较均匀,那么这种代表性当然就很强,出现误差数肯定在20元以内,但如果在选样时,被选单位工资过高或过低,那么算出来的工资与实际水平的误差就可能不止20元了,因为随机抽样,误差水平不同,所以无法使得误差水平一定在预先设定的范围内,而只能说在这个范围内的一种可能程度或概率,比如说有的可能会使误差在预先设定的范围内。 • 由此可见,置信水平应是一个以百分比表示的概率数,记作。
思考题 • 置信水平表达了置信区间的( ) A.准确性 B.精确性 C.显著性 D.可靠性 • 指出下面的说法哪一个是正确的( ) A.置信水平越大,估计的可靠性越大 B.置信水平越大,估计的可靠性越小 C.置信水平越小,估计的可靠性越大 D.置信水平的大小与估计的可靠性无关
解答: • D • A
置信区间(confidence interval) • 含义: • 在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。 • 置信区间是一个随机区间,因样本的不同而不同,且不是所有的区间都包含总体参数的真值。
置信区间与置信水平 • 统计学家在某种程度上确信这个估计区间会包含真正的总体参数,所以给它取名为置信区间。 • 如果用某种方法构造的所有区间中有95%的区间包含总体参数的真值,5%的区间不包含总体参数的真值,那么,用该方法构造的区间称为置信水平为95%的置信区间。 • 但在实际问题中,人们进行估计时往往只抽取一个样本,所构造的是与该样本相联系的95%的置信区间。由于用这个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值。 • 我们只能希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个。
思考题 • 根据一个具体的样本求出的总体均值的95%的置信区间( ) A.以95%的概率包含总体均值 B.有5%的可能性包含总体均值 C.一定包含总体均值 D.要么包含总体均值,要么不包含总体均值
解答 • D
思考题 • 某企业根据对顾客随机抽样的样本信息推断:对本企业产品表示满意的顾客比例的95%的置信水平的置信区间是(56%,64%)。试判断下列说法正确与否。 • 总体比例95%的置信水平的置信区间是(56%,64%) • 总体真实比例有95%的可能落在(56%,64%)中。 • 区间(56%,64%)有95%的概率包含了总体真实比例 • 在100次抽样得到的100个置信区间中,约有95个包含了总体真实比例
解答: • ①正确。 • ②③不正确。因为总体比例和所求区间都是确定的,不存在随机性,不涉及概率。 • ④正确,这是对置信区间的正确理解。
思考题 • 95%的置信水平是指( ) A.总体参数落在一个特定的样本所构造的区间内的概率是95% B.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比例为95% C.总体参数落在一个特定的样本所构造的区间内的概率是5% D.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比例为5%
解答 • B
思考题 • 一个95%的置信区间是指( ) • A.总体参数有95%的概率落在这一区间内 • B.总体参数有5%的概率未落在这一区间内 • C.在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数 • D.在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数
解答 • C
影响置信区间宽度的因素 • 总体数据的离散程度,用来测度 • 样本容量和置信水平 • 当样本容量一定时,置信区间的宽度随着置信水平的增大而增大; • 当置信水平固定时,置信区间的宽度随着样本量的增大而减小。
思考题 • 设总体,未知,设总体均值的置信度的置信区间宽度,那么与的关系为() A、增大,减小 B、增大,增大 C、增大,不变 D、与关系不确定 • 在其他条件相同的条件下,95%的置信区间比90%的置信区间( ) A.要宽 B.要窄 C.相同 D.可能宽也可能窄
解答 • A • A
思考题 • 当置信水平一定时,置信区间的宽度( ) A.随着样本量的增大而减小 B.随着样本量的增大而增大 C.与样本量的大小无关 D.与样本量的平方根成正比
解答 • A
思考题 • 设总体,且已知,现在以置信度估计总体均值,下列做法中一定能使估计更精确的是() A、提高置信度,增加样本容量 B、提高置信度,减少样本容量 C、降低置信度,增加样本容量 D、降低置信度,减少样本容量
解答 • C 返回4.1目录
三、评价估计量的标准 • 无偏性 • 有效性 • 一致性
P() 无偏 有偏 A B 无偏性(Unbiasedness) • 估计量抽样分布的数学期望等于被估计的总体参数,即,称为的无偏估计量。
的抽样分布 P() B 的抽样分布 A 有效性 • 对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效。 • 当比有效 的观察值在真值的附近较更密集
较大的样本容量 P() B 较小的样本容量 A 一致性(consistency) • 随着样本容量的增大,估计量的值越来越接近被估计的总体参数。
思考题 • 在参数估计中,要求通过样本的统计量来估计总体参数,评价统计量的标准之一是使它与总体参数的离差越小越好。这种评价标准称为( ) A.无偏性 B.有效性C.一致性 D.充分性
解答 • B 返回4.1目录
4.2教学目标 • 重点掌握一个总体下总体均值、总体比率的区间估计 • 掌握一个总体下总体方差的区间估计
总结:一个总体样本统计量的抽样分布 样本统计量 样本方差 样本均值 样本比率 正态总体或非正态总体大样本,正态总体小样本且已知 正态总体小样本,且总体方差未知 大样本 正态总体 正态分布 正态分布 分布 分布
总体均值的估计 • 总体比率的估计 • 总体方差的估计 4.2 一个总体参数的区间估计 一 二 三 至:4.3
一、总体均值的区间估计 • 在对总体均值进行区间估计时,需要考虑总体是否为正态分布、总体方差是否已知、用于构造估计量的样本是大样本还是小样本等情况。 • 大样本的估计方法 • 小样本的估计方法
1.大样本的估计方法 • 假定条件 • 总体服从正态分布或总体非正态分布,大样本() • 使用正态分布统计量: • 总体均值的置信水平的置信区间为:
称为置信下限,称为置信上限; • 是事先确定的一个概率值,也称为风险值,它是总体均值不包括在置信区间内的概率; • 称为置信水平; • 是标准正态分布上侧面积为时的值; • 是估计总体均值时的允许误差,也称为估计误差或误差范围。
也就是说,总体均值的置信区间由两部分组成:也就是说,总体均值的置信区间由两部分组成: • 点估计值; • 描述估计值精度的“值”,这个“值”称为允许误差。
总体均值的区间估计:例题分析1 • 由36名高年级学生组成一个随机样本,要求他们分别记下每周观看电视的时间,根据以往的调查,它服从标准差为6的正态分布,从记录结果算出样本平均数为15个小时,试求总体平均数99%的置信区间。