1 / 42

第五章 统计原理 § 5.1 数理统计的基本概念 5.1.1 总体和样本 在实际中,我们把研究对象的全体组成的集合称为总体;组成总体的每一个元素称为个体;总体的一个子集称为样本。

第五章 统计原理 § 5.1 数理统计的基本概念 5.1.1 总体和样本 在实际中,我们把研究对象的全体组成的集合称为总体;组成总体的每一个元素称为个体;总体的一个子集称为样本。 在数学上,我们把随机变量 X 称为总体, 并把随机变量 X 的概率分布称为总体分布 ; 把相互独立且与总体 X 同分布的随机变量( X 1 , X 2 , … , X n )称为来自总体 X 的一个简单随机样本; n 称为样本容量;把样本( X 1 , X 2 , … , X n )的每一个具体值.

Download Presentation

第五章 统计原理 § 5.1 数理统计的基本概念 5.1.1 总体和样本 在实际中,我们把研究对象的全体组成的集合称为总体;组成总体的每一个元素称为个体;总体的一个子集称为样本。

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 第五章 统计原理 §5.1数理统计的基本概念 5.1.1 总体和样本 在实际中,我们把研究对象的全体组成的集合称为总体;组成总体的每一个元素称为个体;总体的一个子集称为样本。 在数学上,我们把随机变量X称为总体,并把随机变量X的概率分布称为总体分布;把相互独立且与总体X 同分布的随机变量(X1,X2,…,Xn)称为来自总体X的一个简单随机样本;n称为样本容量;把样本(X1,X2,…,Xn)的每一个具体值

  2. (x1,x2,…,xn)称为样本(X1,X2,…,Xn)的一组样本观测值或样本实现。(x1,x2,…,xn)称为样本(X1,X2,…,Xn)的一组样本观测值或样本实现。 5.1.2 统计量 设(X1,X2,…,Xn)是来自总体X的一个简单随机样本,称样本的函数T=g(X1,X2,…,Xn)为统计量,如果它不依赖于任何未知参数。统计量的具体值亦称做统计量的实现。 几个常用的统计量: 1、样本均值

  3. 2、样本方差 3、样本标准差 4、样本k 阶原点矩

  4. 5、样本k 阶中心矩 6、顺序统计量 最小统计量 最大统计量 极差

  5. 例1 设假设总体X服从参数为p(0<p<1)的0-1分布,p未知。(X1,X2,…,X5)是来自X的简单随机样本。 (1)指出X1+X3,min(X1,X2,…,X5),X5+2p(X5-X2),X2-EX4,(X3-X5)2,中哪些是统计量,哪些不是统计量? (2)如果(0,1,0,1,1)是一个样本值,求样本均值和样本方差 。

  6. 例2 设一个样本由六个6,七个7,八个8,九个9和十个10组成.求样本容量,样本均值、样本方差和样本极差。 例3 设某地区抽样调查200个居民家庭,得到月支出的统计资料如下:

  7. 求样本均值和样本方差近似值。 5.1.3 经验分布函数 对于任意实数x,设μn表示样本(X1,X2,…,Xn)的n个观察值中不大于x的观察值的个数,则μn表示在对总体X的n次独立重复观测中,事件{X≤x}出现的次数。因此在对总体X的n次独立重复观测中,事件{X≤x}出现的频率

  8. 称为总体X的经验分布函数或样本分布函数 。 对于给定的样本值(x1,x2,…,xn),经验分布函数具有分布函数的一切性质,经验分布函数也是一个阶梯型的函数;经验分布函数依概率收敛于总体的分布函数。 经验分布函数依概率收敛于总体的分布函数这个结论,为进行统计推断提供了依据。 例4根据例1(2)和例2中的数据,分别求其经验分布函数。

  9. §5.2 抽样分布 5.2.1χ2分布 设(X1,X2,…,Xn)是来自正态总体N(0,1)的样本,称统计量 χ2 =X12+X22+…+Xn2 服从自由度为n的χ2分布,记为χ2 ~ χ2(n)。 χ2分布上α分位点:对于给定的α(0<α<1),称满足条件 为χ2(n)分布的上α分位点。

  10. 5.2.2 t分布 随机变量X~N(0,1),Y~χ2(n),且X和Y相互独立,则称随机变量 服从自由度为n的t分布,记为T~t(n)。 t分布上α分位点:对于给定的α(0<α<1),称满足条件 为t(n)分布的上α分位点。

  11. 5.2.3 正态总体的抽样分布 设(X1,X2,…,Xn)是来自正态总体N(μ,σ2)的一个样本,则 (1)样本均值 (2)随机变量 (3)样本均值和样本方差相互独立 (4)随机变量

  12. 例5 设总体X服从N(0,0.32),(X1,X2,…,X10)是来自X的一个容量为10的样本,求概率 例6 假设一种电子元件的使用寿命X(小时)服从正态分布N(3000,8002)。一名顾客购买了50个元件,试求这50个元件的平均使用寿命超过3250的概率。

  13. §5.3 参数估计 5.3.1 统计估计的概念 在统计中,估计既表示由样本特征求总体特征的过程,也表示由样本求得的总体特征的估计值。 一、参数估计和非参数估计 可以用有限个参数表示的估计问题,统称为参数估计,否则称为非参数估计。 二、参数估计的方法 参数估计有两种基本类型:点估计和区间估计。

  14. 点估计,也称“定值估计”,既可以指用统计量的值做为未知参数的估计值,也可以指用来估计未知参数的统计量。点估计,也称“定值估计”,既可以指用统计量的值做为未知参数的估计值,也可以指用来估计未知参数的统计量。 区间估计是指根据估计可靠程度的要求,由样本确定总体参数的一个区间范围。 5.3.2 参数的点估计 最常用的点估计方法:矩估计法和极大似然估计法。 一、矩估计法 矩估计法是用样本矩来估计总体矩,用样本矩的函数来估计总体矩的相应函数的一种估计方法。

  15. 例7设总体X服从参数为λ的指数分布,其中λ未知。(X1,X2,,Xn)是来自X的简单随机样本,求λ的矩估计量。 例8 设X为任意总体,EX =μ,DX =σ2>0存在,但未知。(X1,X2,,Xn)是来自总体X的简单随机样本,求μ和σ2的矩估计量。 二、极大似然估计法 设总体X的概率密度为f(x,θ)(当X为离散型时, f(x,θ)=P{X=x},即为概率分布),其中θ为待估参数。设(x1,x2,,xn)为样本(X1,X2,,Xn)的一组观测值,称

  16. 为似然函数 。 对于给定的样本观测值(x1,x2,,xn),使似然函数L(θ)达到最大值的参数值 ,称为未知参数θ的极大似然估计值,相应的统计量称为未知参数θ的极大似然估计量。 极大似然估计量,可以用微积分中求函数的极大值的方法来求.不过,这里求的不是函数的极大值,而求是函数的极大值点。

  17. 由于lnx是x的严格单增函数,因此L(θ)和lnL(θ)在同一处取极大值,因此我们也称lnL(θ)为似然函数。由于lnx是x的严格单增函数,因此L(θ)和lnL(θ)在同一处取极大值,因此我们也称lnL(θ)为似然函数。 求极大似然的一般步骤: (1)由总体分布写出似然函数L(θ)和ln L(θ) ; (2)求似然函数关于θ的导数: 如果分布含有多个未知参数(θ1,θ2,…,θr),这时似然函数就是这些未知参数的函数,由方程组

  18. (3)解上述方程可以得到参数θ的极大似然估计。(3)解上述方程可以得到参数θ的极大似然估计。 例9设总体X服从参数为(1/θ)的指数分布,求参数θ的极大似然估计量。若有一组样本值340,410,450,520,620,190,210,800,270,500,求θ的极大似然估计值。

  19. 例10设总体X服从参数为p的0-1分布,求参数p的极大似然估计量。例10设总体X服从参数为p的0-1分布,求参数p的极大似然估计量。 若从一大批产品中,用还原方法抽取了50件产品,发现其中有2件是次品,求p的极大似然估计值。 例11 假设总体X~N(μ,σ2), μ与σ2都未知.试根据来自X的简单随机样本(X1,X2,,Xn),求μ与σ2的极大似然估计量。

  20. 三、评价估计量的标准 1、无偏性 设 是未知参数θ的估计量,如果E =θ,则称 是θ的无偏估计量。 例12 设X为任意总体,EX =μ,DX = σ2存在。(X1,X2,,Xn)是来自总体X的简单随机样本,证明(1)样本均值是μ的无偏估计量;(2)样本方差是σ2的无偏估计量。

  21. 2、有效性 设 与 为未知参数θ的两个无偏估计量,如果 D <D 则称 是比 有效的估计量。 在未知参数的任意两个无偏估计中,显然应该选更有效的,即方差较小的。 3、一致性 设 为未知参数θ的估计量,如果 依概率收敛于θ,则称 是θ的一致估计量。

  22. 例13 设X为任意总体,其k阶原点矩ak= EXk(k>0)存在。设(X1,X2,,Xn)是来自总体X的简单随机样本,证明样本k阶原点矩 是总体k阶原点矩ak的无偏与一致估计量。 5.3.3 正态总体参数的区间估计 一、区间估计的概念 未知参数θ的区间估计,也称置信区间,是以统计量为端点,以充分大的概率包含未知参数θ值的随机区间。

  23. 设θ是总体X的未知参数,(X1,X2,,Xn)是来自总体X的简单随机样本。对给定的数α(0<α<1),如果存在两个统计量 和 ,满足 则称(随机)区间 称为参数θ的区间估计或置信区间,称概率1-α为置信区间的置信度(水平)。 二、一个正态均值μ的置信区间 1、总体方差σ2已知 均值的1-α为置信区间为

  24. 其中uα/2为标准正态分布双侧分位数。 例14某企业生产的滚珠直径X服从N(μ,0.0006)。现从产品中随机抽取6颗进行检测,得到它们的平均值为1.495cm,标准差为0.0226cm。试求滚珠平均直径的置信水平为0.95的置信区间。 置信区间的长度l为

  25. 2、总体方差σ2未知 均值的1-α为置信区间为 其中tα/2(n-1)为t( n-1 )分布双侧分位数。 例15 在例14中若总体方差未知,试求滚珠平均直径的置信水平为0.95的置信区间。 三、一个总体方差σ2的置信区间 总体方差σ2的1-α置信区间为

  26. 其中 是是自由度为ν的χ2分布水平p的上侧分位数。 标准差的1-α置信区间为

  27. 例16从自动车床加工的一批零件中随机抽取了16件,测得零件长度的平均值为2.125cm,标准差为0.017cm。假设零件的长度服从正态分布,求零件长度标准差的0.95置信区间。例16从自动车床加工的一批零件中随机抽取了16件,测得零件长度的平均值为2.125cm,标准差为0.017cm。假设零件的长度服从正态分布,求零件长度标准差的0.95置信区间。 §5.4假设检验 一、假设检验的基本概念 1、统计假设的概念 统计假设是关于总体参数或数字特征、总体的分布以及两个或两个以上总体之间的关系的一切论断或命题,简称假设。通常用字母“H”表示假设。

  28. 2、统计假设的基本类型 (1)参数假设与非参数假设 可以用有限个参数表示的统计假设称为参数假设,否则称为非参数假设。 (2)原假设与备择假设 两个二者必居其一的假设,其中一个称做原假设,习惯上记为H0;而另一个称做备择假设,习惯上记为H1。原假设也称为零假设;备择假设也称为对立假设。 3、统计假设的检验

  29. 统计假设的检验,简称假设检验,是指按照一定规则即检验准则,根据样本来判断所作假设的真伪,以决定接受还是否定假设。统计假设的检验,简称假设检验,是指按照一定规则即检验准则,根据样本来判断所作假设的真伪,以决定接受还是否定假设。 (1)检验准则 检验准则,简称为检验,指接受还是否定假设所依据的规则。检验准则通常用原假设的否定域来表示。 否定域亦称拒绝域或临界域,假设H0的否定域是样本空间的一个区域V,当样本值落入区域V时,否定假设H0。

  30. (2)假设检验的理论依据 小概率原则。所谓小概率原则,就是根据具体问题的要求,指定一个可以认为“充分小”的数α(0<α<1),并且把概率不大于α的事件认为是“实际不可能事件”,即认为这样的事件在一次试验或观测中实际上不会出现。 4、假设检验的基本步骤 (1)根据实际问题的要求提出原假设H0和备择假设H1,并且在作出最后的判断之前,将始终在假设H0成立的假定下进行分析;

  31. (2)构造适当的检验统计量J,在假设H0成立下,其分布已知;(2)构造适当的检验统计量J,在假设H0成立下,其分布已知; (3)对给定的水平(0<<1),确定否定域V; (4)根据检验统计量J的观察值,作出统计决策。 5、假设检验的两类错误 否定了本来真实的假设,称为第一类(弃真)错误,犯这类错误的概率记为 ; 接受了本来错误的假设,称为第二类(存伪)错误,犯这类错误的概率记为β。

  32. 二、一个总体参数的假设检验 1、一个总体均值的假设检验 (1)正态总体,方差σ2已知

  33. 例17 味精厂用一台包装机自动包装味精,包得的袋装味精重量服从N(μ,0.0152)。当机器正常时,其均值为0.5kg。某日开工后随机地抽取9袋味精,称得平均重量为0.511kg,问在显著性水平0.05下,这台包装机是否正常?

  34. (2)正态总体,方差σ2未知

  35. 例18 某厂生产的螺杆直径服从正态分布N(μ,σ2)。现从中抽取5件,测得平均直径为21.8mm,标准差为0.367mm。若σ2未知,在显著性水平0.05下,检验假设H0:μ=21是否成立。 例19 用某种农药施入农田种防治病虫害,经过三个月后,如果土壤中的浓度不低于5ppm,认为仍有残效。在一块已施药的农田中随机抽取10个土样进行分析,其浓度的平均值为4.08ppm,标准差为1.80ppm。假设土壤残余农药的浓度服从正态分布,在显著性水平0.05下,问该农药经过三个月后是否仍有残效?

  36. (3)总体分布未知,但大样本情形

  37. 例20 某厂生产的一种型号的电阻元件其平均电阻一直保持在2.64欧姆。改变生产工艺后,测得所生产的100个元件的平均电阻为2.62欧姆,标准差为0.06欧姆,在显著性水平0.01下,问新工艺对该电阻元件的生产有无显著影响?

  38. - 2 ( n 1 ) S c = 2 s 2 0 2、一个正态总体方差σ2的假设检验(自由度为n-1)

  39. 例21 设某厂生产的产品服从N(μ, 0.0482)。今任取5件进行检测,得到其平均值为1.414,方差为0.00778。问在显著性水平0.1下,能否认为总体的方差没有显著变化?

  40. 3、一个总体比率的假设检验(大样本)

  41. 例22 某厂生产了一批产品,按规定次品率不超过0.05才能出厂,否则不能出厂。现从产品中随机抽取50件进行检查,发现有4件次品,问在显著性水平0.05下,该批产品能否出厂?

More Related