570 likes | 816 Views
点估计的问题就是要构造一个适当的统计量 ( X 1 , X 2 , …, X n ) ,用样 本的一组观察值( x 1 , x 2 , …, x n ),得到 的观察值 ( x 1 , x 2 , …, x n ), 以此来估计未知参数 θ .称统计量 ( X 1, X 2, … , X n )为 θ 的估计量,称. ( x 1 , x 2 , …, x n )为 θ 的估计值.. 第七章 参数估计. 第一节 参数的点估计. 一、点估计问题.
E N D
点估计的问题就是要构造一个适当的统计量 ( X1, X2, …,Xn ),用样 本的一组观察值( x1, x2, …,xn),得到 的观察值 ( x1, x2, …,xn ), 以此来估计未知参数θ.称统计量 ( X1, X2, …, Xn )为θ的估计量,称 ( x1, x2, …,xn)为θ的估计值. 第七章 参数估计 第一节 参数的点估计 一、点估计问题 设总体 X 的分布函数的形式为已知的F (x,θ),其中 x 是自变量,θ为未知参数(它可以是一个数,也可以是一个向量).借助于总体 X 的一个样本(X1, X2, …, Xn ),来估计未知参数θ的值的问题,称为参数的点估计问题.
设总体 X 的分布函数为 , 其中 为 k 个未知参数.假设总体 X 的各阶原点矩 存在, 则E (X l )是 的函数,记作μl=μl( ) 即 ,l=1,2,…,k. 对于总体 X 的样本( X1, X2, …,Xn ),样本的 l 阶原点矩为 ,l = 1,2, …,k. 二、矩估计法 令 μl =Al , l=1,2,…,k,
即 从上述方程组中解出 ,分别记作 以此作为未知参数 的估计量,称为矩估计量.
如果样本观察值为( x1, x2, …,xn),则得未知参数 的矩估计值为 上述估计未知参数的方法就叫做矩估计法. 例1设总体 X 服从参数为的泊松分布,其中 >0 为未知,又设X1, X2, …,Xn为 X 的样本,求的矩估计量. 解 令 ,即 得 的矩估计量为 .
例2设总体 X 服从参数为 的指数分布,其概率密度为 其中 为未知,又设 为 X 的样本,求 的矩估计量. 解 由于 , 即 因此得到 的矩估计量为 .
例3设总体 X 在区间 [a, b] 上服从均匀分布,a 与 b 为未知,X1 ,X2 ,,Xn是来自总体 X 的样本,求 a 与 b 的矩估计量. 解 令 即 整理得
例4设总体 X 的均值为 ,方差为 ,且 ,但 与 均未知,又设总体 X 的一个样本为(X1,X2 ,, Xn),求 与 的矩估计量. 解 令 即 解此方程组得到 与 的矩估计量为
注 此例说明,无论总体 X 服从什么分布,样本均值 都是总体均值 的矩估计量,样本二阶中心矩就是总体方差 的矩估计量. 例5某厂生产一批铆钉,现要检验铆钉头部直径,从这批产品中随机抽取12只,测得头部直径(单位:mm)如下: 13.30 13.38 13.40 13.43 13.32 13.48 13.54 13.31 13.34 13.47 13.44 13.50 设铆钉头部直径这一总体 X 服从正态分布 ,试求 与 的矩估计值. 解 由例4可得
1.设总体X为离散型随机变量,其分布律为 其中θ为未知参数,取值范围为 .设 X1, X2, , Xn为来自 X 的样本,则 X1, X2, ,Xn 的联合分布律为 .又设 x1, x2, , xn为一组样本值,令 称 L(θ)为样本的似然函数. (1) 若有 ,使得对一切 ,有 成立,则称 为θ的极大( 或最大 )似然估计值,相应的统计量 称为θ的极大( 或最大 )似然估计量. 三、极大似然估计法
我们规定,使得 的 就是θ的极大似然估计值.由于ln x是单增函数,所以与 有相同的驻点,因此只需从 中解出 就是θ的极大似然估计值,称方程 (2) (2)为极大似然方程.
例6设总体 ,X1, X2 , … , Xn 为总体 X 的样本,求 的极大似然估计量. 解 设样本值为x1,x2 ,…,xn. 由于 X 的分布律为 x = 0, 1, 2,… 所以似然函数为 令 得 的极大似然估计值为 因此得到 的极大似然估计量为
解 从总体中任取一件产品进行观测,其结果可用随机变量 X 表示如下: 则 X 服从参数为 p 的(0-1)分布,其分布律为 设 X1, X2 , … , Xn为 X 的一个样本,观察值为 x1,x2 ,…,xn,则似然函数为 例7设一批产品中含有次品,次品率 p 未知,从中抽取容量为 n 的样本,求 p 的极大似然估计量.
令 解得 p 的极大似然估计值为 因此 p 的极大似然估计量为 2.设总体 X 为连续型随机变量,其概率密度为 , ,θ为未知参数.设 X1, X2 , … , Xn 为来自总体 X 的样本,其观察值为 x1,x2 ,…,xn.则似然函数为 (3) 似然方程为 (4) 解出θ的极大似然估计值为 ( x1,x2 ,…,xn) . 极大似然估计量为 ( X1,X2 ,…,Xn) .
例8设总体 X 的概率密度为 其中 为未知参数,( X1, X2 , … , Xn )为样本,求 的极大似然估计量. 解 设样本值为( x1, x2 , … , xn )(xi>0, i = 1, 2 , … , n),似然函数为
令 得 的极大似然估计值为 于是得到 的极大似然估计量为
例9设总体 X 的概率密度为 又设 X1, X2 , … , Xn 为 X 的样本,求θ的矩估计量与极大似然估计量. 解 (1)由于 令 即 解得θ的矩估计量为
(2)设样本值为 x1, x2 , … , xn (0< xi < 1),似然函数为 令 解得θ的极大似然估计值为 因此, θ的极大似然估计量为
3.设总体 X 的分布中含有 k 个参数θ1, θ2 , …θk , 则似然函数是这些未知参数的函数 取对数后,求出lnL 关于θi 的偏导数并令它等于零,得到似然方程组 由此方程组解得θi 的极大似然估计值 .
例10设总体 , 与 未知,( X1, X2 , … , Xn )为总体 X 的样本,求 与 的极大似然估计量. 解X 的概率密度为 设 x1, x2,…, xn 为样本值,似然函数为
令 解得 与 的极大似然估计值为 因此, 与 的极大似然估计量为
解X 的概率密度为 设样本值为 x1, x2 , … , xn ( ),似然函数为 因为L(a, b)是 a 的单增函数,a 越大, L(a, b)就越大,但 a 不能大于 x(1) = min{x1, x2 , … , xn };又因为L(a, b)是 b 的单减函数,b 越小,L(a, b)就越大,但b 不能小于 x(n) = max{x1, x2 , … , xn } .对于满足a ≤ x(1), b ≥ x(n)的任意 a, b 有 例11设总体 X 在区间 [a, b] 上服从均匀分布,其中a、b未知,X1, X2, …,Xn为总体 X 的样本,求a、b的极大似然估计量.
当 a = x(1),b = x(n)时, L(a, b) 取得最大值 所以 a, b 的极大似然估计值为 a, b 的极大似然估计量为 , 4.极大似然估计的性质 设 u ( ) 是关于未知参数θ的函数, , u ( )具有单值反函数,又设 是总体分布中所含参数θ的极大似然估计,则 是 u 的极大似然估计.
定义 设 是未知参数θ的估计量,若 ,则称 为θ的无偏估计(量). 例12设 ( X1, X2, …,Xn)是来自具有有限均值 与方差 的总体 X 的一个样本.证明:样本均值 是 的无偏估计,样本方差 S 2是 的无偏估计. 四、估计量的评选标准 1.无偏性 估计量是样本的函数,它是一个随机变量,由不同的方法得到的估计量可能相同也可能不同.而对同一估计量,由不同的样本观察值得到参数的估计值也可能不同.我们很自然地要求估计量的期望等于参数的真值,即无偏性.
证 因此, 与 分别为 与 的无偏估计.
例13设总体 X 的均值为 ,( X1, X2, X3)是总体 X 的样本,证明下列两个估计量 都是 的无偏估计. 设 与 是参数θ的两个无偏估计量,若 , 则称 比 有效. 证 由于 所以 与 都是 的无编估计. (只需 k1+k2 + +kn=1,则 = k1 X1 +k2 X2 + +kn Xn 就是 的无偏估计) 2.有效性
例14比较例13中 与 哪个更有效. 解 设 .由于 显见 ,因此 比 有效. 另外,取 ,则 于是可知 比 更有效.
设 为参数θ的估计量,若当 时, 按概率收敛于θ,即对于任意正数ε,有 , 则称 为θ的一致估计(量). 根据大数定律可知,样本均值 是总体均值 的一致估计量. 3.一致性
点估计是通过构造统计量 (X1, X2, … ,Xn)来对总体 X 中的未知参数θ进行估计,由一个样本值( x1, x2, … ,xn)可得到θ的估计值 ( x1, x2, … ,xn) .这种估计值是无法知道误差的.我们要定出一个范围,并要求以一 定的概率保证这个范围包含着θ的真值.这个范围通常以区间的形式给出,我们把这个区间称为置信区间. 定义 设总体 X 的分布中含有一个未知参数θ,(X1, X2, …,Xn)是来自总体 X 的一个样本.如果对于给定的常数 ,统计量 θ1= θ1 (X1, X2, …,Xn)与θ2= θ2(X1, X2, …,Xn)满足 (1) 则称随机区间(θ1 ,θ2 )是θ的置信度为 的置信区间,分别称θ1与θ2为θ的置信下限与置信上限. 第二节 参数的区间估计
1- 称为置信度或置信水平.(1)式的含义是,随机区间(θ1 ,θ2 )以 的概率包含着θ, 也就是说,对每一个样本值 ( x1, x2, … ,xn)可求得一个具体的区间(θ1(x1, x2, … ,xn ),θ2 (x1, x2, … ,xn )).在这些众多的区间中,包含θ的有100 ( ) %个,不包含θ的有100 %个. 例1设总体 , 为已知, 未知,( X1, X2, …,Xn)为来自总体 X 的一个样本,求 的置信度为 的置信区间. 解 由于 是 的无偏估计,且有 由正态分布表可查得 ,使
即有 取 ,于是得到 的置信度为 的置信区间为
求未知参数θ的置信区间的一般方法: 1°对于给定的样本X1, X2, … , Xn,构造样本函数 , 它包含待估参数θ,而不含其它未知参数, 并且 Z 的分布已知,在 Z 的分布中不依赖任何未知参数. 2°对于给定的置信度 ,定出两个常数 a,b(一般地,按 Z 所服从的分布的上 分位点来确定),使 3°从 a < Z (X1, X2, … , Xn ) < b 得到等价的不等式θ1(X1, X2, … , Xn ) <θ< θ2(X1, X2, … , Xn ) ,其中θ1 =θ1(X1, X2, … , Xn )与θ2 =θ2(X1, X2, … , Xn )都是统计量,于是得到θ的一个置信度为 的置信区间( θ1 ,θ2).
设(X1, X2, … , Xn)是来自正态总体 的样本. 1.设 已知,求 的置信度为 的置信区间 2.设 未知,求 的置信度为 的置信区间 第三节 正态总体 均值与方差的置信区间 一、单个正态总体均值的置信区间
由于 S 2 是 的无偏估计,因此用S 2 代替 ,有 由附表3查得 ,有 即 于是得到 的 置信区间为 , 图
例1某车间生产的螺杆直径服从正态分布 , 今随机地从中抽取5只测得直径值为22.3,21.5,22.0,21.8,21.4. (1)已知 ,求 的0.95置信区间; (2)如果 未知,求 的0.95置信区间. 解 (1)已知 、 ,查表得 ,因此 的0.95置信区间为
(2) 未知, , s = 0.367.查表得 =2.7764,因此 的0.95置信区间为
1.设 已知, 求 的置信度为 的置信区间 由于 对于给定置信度 ,查表可得 及 ,使 即 因此, 的 置信区间为 二、单个正态总体方差的置信区间
2.设 未知, 求 的置信度为 的置信区间 由于 对于给定置信度 , 查表可得 及 , 使得 即 因此,方差 的置信度为 的置信区间为
而标准差 的 的置信区间为 例2从正态总体 中抽取容量为5的样本,其观测值为 1.86 3.22 1.46 4.01 2.64 (1)已知 ,求 的0.95置信区间; (2)如果 未知,求 的0.95置信区间. 解 (1)已知 ,查表得 , =12.833.由已知数据算得 ,因此 的0.95置信区间为
(2) 未知, 查表得 , =11.143,由已知数据算得 ,因此 的0.95置信区 间 为
设总体 ,总体 ,X与 Y 独立,( X1, X2, … , Xm)与( Y1, Y2, … , Yn)分别来自 X 与 Y 的相互独立的样本,并设它们的样本均值分别为 , ,样本方差分别为 , . 1.设 和 都已知,求 的置信度为 的置信区间 由于 与 相互独立,且 , ,于是可知 , 从而 三、两个正态总体均值差的置信区间
对于给定的置信度 ,查表得 ,使 , 即 从而得到 的置信度为 的置信区间为
2.设 为未知, 求 的置信度为 的置信区间 其中 . 例3设总体 X~ N( ,4),总体Y~N( ,6),分别独立地从这两个总体中抽取样本,样本容量依次为16和24,样本均值依次为16.9和15.3,求两个总体均值差 的置信度为0.95的置信区间. 解 由题设可知 m=16,n =24, =16.9, =15.3, = 4, = 6, = 0.95, =0.05,查附表1得 1.96.从而可得 的置信度为 0.95 的 置信区间为
例4为了估计磷肥对某种农作物增产的作用,选20块条件大致相同的地块进行对比试验.其中10块地施磷肥,另外10块地不施磷肥,得到单位面积的产量(单位:kg)如下:例4为了估计磷肥对某种农作物增产的作用,选20块条件大致相同的地块进行对比试验.其中10块地施磷肥,另外10块地不施磷肥,得到单位面积的产量(单位:kg)如下: 施 磷 肥:620 570 650 600 630 580 570 600 600 580 不施磷肥:560 590 560 570 580 570 600 550 570 550 设施磷肥的地块单位面积产量 X ~ N ( , ),不施磷肥的地块单位面积产量 Y ~ N( , ).求 的置信度为0.95的置信区间. 解 由题设,两个正态总体的方差相等,但 未知, m=10,n=10, =0.05, =0.95, =600, = 570, , , ,查表得 , 因此 , 的置信度为0.95的置信区间为
1.设 均已知,求 的置信水平为 的置信区间 由于 与 相互独立,且 从而可知 . 四、两个正态总体方差比的置信区间
对于给定的置信度 , 查表得 及 ,使 即 , , 因此, 的置信度为 的置信区间为 .
2.设 与 都未知,求 的置信水平为 的置信区间 . 例5设总体 X ~ N(24, ), 总体Y ~ N (20, ) .从总体 X 和 Y 中独立地抽得样本值如下: 总体 X:23,22,26,24,22,25; 总体 Y:22,18,19,23,17. 求 的置信度为0.95的置信区间. 解 已知 =24, m = 6; = 20,n = 5.由已知数据可算得 , . 因 =0.95,故 = 0.05.查附表5,可得 F0.025(6, 5) = 6.98, F0.025(5, 6) = 5.99 . 从而可得 的置信度为0.95的置信区间为
例6从参数 都未知的两正态总体 中分别独立地抽取样本,它们的样本容量分别为 m = 10,n = 8,样本方差分别为 s12 = 3.6,s22 = 2.8,求二总体方差比 的置信度为0.95的置信区间. 解 这里 = 0.95, = 0.05,查 F 分布表得: , . 的置信度为0.95的置信区间为
设 X为非正态总体,其均值E ( X )与方差D ( X )均存在但未知.(X1,X2,…,Xn )为来自总体 X 的一个样本,样本容量 n 很大( n ≥50 ).我们要求 E ( X )的置信度为 的近似置信区间. 由中心极限定理可知随机变量 当 n 很大时近似地服从标准正态分布 N (0, 1). 由于样本方差 S 2 是D ( X )的无偏估计,利用 S 2 代替D( X ),有 近似地服从标准正态分布N(0,1). 第四节 非正态总体参数的区间估计 一、总体均值的区间估计
对于给定的置信度 ,有 , 从而得到E ( X )的置信度为 的近似置信区间为 .