350 likes | 484 Views
概率论与数理统计讲义. 此幻灯片可在网址 http://www.appmath.cn 上下载. 第 17 讲. 第五章 大数定律和中心极限定理. 第一节 大数定律. 在第一章曾讲过,事件 A 在多次独立重复试验中发生的频率 f n ( A ) 具有“稳定性”,即当 n 时, f n ( A ) 在“一定的意义下收敛于 P ( A )= p ” ,注意,此处的“收敛”不是指通常意义下的数列的收敛,即. 不一定成立 . 这一点可说明如下:
E N D
概率论与数理统计讲义 此幻灯片可在网址http://www.appmath.cn上下载 第17讲
在第一章曾讲过,事件A在多次独立重复试验中发生的频率fn(A)具有“稳定性”,即当n时,fn(A)在“一定的意义下收敛于P(A)=p”,注意,此处的“收敛”不是指通常意义下的数列的收敛,即在第一章曾讲过,事件A在多次独立重复试验中发生的频率fn(A)具有“稳定性”,即当n时,fn(A)在“一定的意义下收敛于P(A)=p”,注意,此处的“收敛”不是指通常意义下的数列的收敛,即 不一定成立. 这一点可说明如下: 若(1)式成立,由数列极限的定义,对于任意给定的e>0, 总存在N>0,使当n>N时, 总有|fn(A)-p|<e. 但是,若取e<p,由于
P{fn(A)=0}=(1-p)n>0,即不论N多大, 在N以后总有可能存在着n, 使fn(A)=0,对于这样的n,总有|fn(A)-p|=|0-p|=p>e. 所以fn(A)不可能在通常的收敛意义下收敛到p.事实上,上述在“一定意义下fn(A)收敛于P(A)=p”是指 对任意的e>0成立,此即为下述依概率收敛的定义。
定义1设Y1,Y2,…,Yn,…是一个随机变量序列, a是一个常数, 若对任何正数e, 有 则称序列Y1,Y2,…,Yn,…依概率收敛于a, 记为
定理1(伯努利大数定律) 设试验E是可重复进行的,事件A在每次试验中出现的概率P(A)=p(0<p<1), 将试验独立地进行n次,用nA表示其中事件A出现的次数,则对于任意正数e, 有 或 或可写成 即频率收敛于概率
证 因为 nA~b(n,p), 故E(nA)=np, D(nA)=np(1-p).由数学期望和方差的性质,有 于是任取e>0, 由切比雪夫不等式可得 即
定理1以严格的数学形式表述了概率的稳定性,即当n很大时,事件发生的频率与概率有较大偏差的可能性很小,由实际推断原理,在应用中,当试验次数很大时,便可以用事件发生的频率来代替事件发生的概率.定理1以严格的数学形式表述了概率的稳定性,即当n很大时,事件发生的频率与概率有较大偏差的可能性很小,由实际推断原理,在应用中,当试验次数很大时,便可以用事件发生的频率来代替事件发生的概率.
若记Xi为第i次试验中事件A出现的次数,即在第i次试验中,A出现则X取值为1,否则取值为0,则若记Xi为第i次试验中事件A出现的次数,即在第i次试验中,A出现则X取值为1,否则取值为0,则 故定理1可以写成 定理1是大数定律的一种特殊情形. 一般地, 若随机变量序列X1,X2,…,的数学期望都存在,且满足(4)式,则称其此序列满足大数定律.
定理2(切比雪夫大数定律的特殊情况) 设随机变量X1,X2,…,Xn,…相互独立,且具有相同的数学期望和方差: E(Xk)=m,D(Xk)=s2 (k=1,2,…). 作前n个随机变量的算术平均 则对于任意正数e, 有
证 由于 任取e>0, 由切比雪夫不等式可得 在上式令n, 并注意概率不能大于1,可得
定理3 (辛钦大数定律) 设随机变量X1,X2 ,…,Xn ,…相互独立,服从同一分布,具有数学期望E(Xk)=m(k=1,2,…,), 则对于任意正数e,有 辛钦大数定律的证明超过了我们的知识范围. 它在数理统计中十分有用。
对于中心极限定理的掌握,不需要去了解任何定理,只需要记住如下的描述即可:当一个随机变量X是由n个相互独立的随机变量的和构成,即X=X1+X2+…+Xn,则只要n足够大(最好超过100,但是,如果n大于20就足够好, 大于10有时也凑合),而且这n个随机变量的数学期望和方差都存在,且它们的方差都差不多大,则X近似服从正态分布。(这里不管这n个随机变量的分布有多么地不同,甚至有的是离散型有的连续型。)
说严格点,假设X1,X2,…,Xn是n个相互独立的随机变量,其中E(Xi)=mi, D(Xi)=si2, i=1,2,…,n, X=X1+X2+…+Xn, 则根据数学期望和方差的性质可得E(X)=m=m1+m2+…+mn, D(X)=s2=s12+s22+…+sn2, 则只要n相当大(>10),就近似有X~N(m,s2).最常见的情况是X1,X2,…,Xn相互独立同分布它们的期望和方差都是m, s2, 则X=X1+…+Xn近似服从N(nm,ns2). 这其实就是定理1的意思.
一种情况是X~b(n,p), 则X可被视为由n个相互独立的0-1分布的随机变量相加构成,因为E(X)=np, D(X)=np(1-p),因此只要n足够大(>20),就近似有X~N(np, np(1-p)). 这其实就是定理2(德莫佛-拉普拉斯中心极限定理).
可以用excel结合应用数学家园网站的直方图功能来观察大致的中心极限定律的效果, 在excel的一个单元格中键入=rand()+rand()+rand()+rand()+rand()+rand()+rand()+rand()+rand()+rand()将此单元格复制到多个单元格,然后将值复制到应用数学家园网站的直方图功能中, 就可以看到大致的正态分布的形状.如果每一个单元格只是一个rand(), 将看到均匀分布的直方图.
例1独立地掷10颗骰子,求掷出的点数之和在30到40点之间的概率.解 以Xi表示第i颗骰子掷出的点数(i=1,2,…,10), 则 点数之和为X=X1+X2+…+X10, 则近似有 或 X~N(35,29.16667)
例2在一家保险公司有一万人参加保险,每年每人付12元保险费. 在一年内这些人死亡的概率都为0.006,死亡后家属可向保险公司领取1000元,试求:(1) 保险公司一年的利润不少于6万元的概率;(2) 保险公司亏本的概率.解 设参保的一万人中一年内死亡的人数为X,则X~b(10000, 0.006),E(X)=60, D(X)=59.64, 因此近似有X~N(60, 59.64), 保险公司年收入10000元保险费,付给死者家属1000X元,一年的利润为120000-1000X=1000(120-X).
解 设参保的一万人中一年内死亡的人数为X,则X~b(10000, 0.006),E(X)=60, D(X)=59.64, 因此近似有X~N(60, 59.64), 保险公司年收入10000元保险费,付给死者家属1000X元,一年的利润为120000-1000X=1000(120-X).(1) 保险公司一年利润不少于6万元的概率为
解 设参保的一万人中一年内死亡的人数为X,则X~b(10000, 0.006),E(X)=60, D(X)=59.64, 因此近似有X~N(60, 59.64), 保险公司年收入10000元保险费,付给死者家属1000X元,一年的利润为120000-1000X=1000(120-X).(2) 保险公司亏本的概率为
例3独立地测量一个物理量,每次测量产生的误差都服从区间(-1,1)上的均匀分布.(1) 如果取n次测量的算术平均值作为测量结果, 求它与其真值的差小于一个小的正数e的概率;(2) 计算(1)中当n=36, e=1/6时的概率的近似值;(3) 取e=1/6, 要使上述概率不小于a=0.95, 应进行多少次测量?解(1) 用m表示所测量物理量的真值,X表示第i次测量值, ei表示第i次测量所产生的随机误差(i=1,2,…,n), 于是Xi=m+ei, 由题设ei~U(-1,1)
(1) 如果取n次测量的算术平均值作为测量结果, 求它与其真值的差小于一个小的正数e的概率;解(1) 用m表示所测量物理量的真值,X表示第i次测量值, ei表示第i次测量所产生的随机误差(i=1,2,…,n), 于是Xi=m+ei, 由题设ei~U(-1,1), 所以
(1) 如果取n次测量的算术平均值作为测量结果, 求它与其真值的差小于一个小的正数e的概率;
作业题讲解:习题4-1 10. 若有n把看上去样子相同的钥匙, 其中只有一把能打开门上的锁, 用它们去试开门上的锁, 设取到每只钥匙是等可能的, 若每把钥匙试开一次后除去, 求试开次数X的期望.
作业题讲解:习题4-1 10. 若有n把看上去样子相同的钥匙, 其中只有一把能打开门上的锁, 用它们去试开门上的锁, 设取到每只钥匙是等可能的, 若每把钥匙试开一次后除去, 求试开次数X的期望.解: 试开次数可能为1次,2次,3次,…,n次共n种可能, 这些可能的大小一样, 即有P{X=1}=P{X=2}=…=P{X=n}=1/n, 因此