基于 MATLAB 的概率统计数值实验二、随机变量及其分布

基于MATLAB的概率统计数值实验二、随机变量及其分布基于MATLAB的概率统计数值实验二、随机变量及其分布本科生必修课：概率论与数理统计主讲教师：董庆宽研究方向：密码学与信息安全 Email ：qkdong@mail.xidian.edu.cn 个人主页：http://web.xidian.edu.cn/qkdong/

内容介绍 二、随机变量及其分布 1. MATLAB中概率分布函数 2. 二项分布实验 3. 泊松分布实验 4. 二项分布与泊松分布关系实验 5. 连续型随机变量分布实验 6. 随机变量的均值与方差 7. 逆累积分布函数实验 8. 中心极限定理实验

1. MATLAB中概率分布函数 • MATLAB为常见自然概率分布提供了下列5类函数 • ①概率密度函数（pdf），求随机变量X在x点处的概率密度值 • ②累积分布函数（cdf），求随机变量X在x点处的分布函数值 • ③逆累积分布函数（inv），求随机变量X在概率点处的分布函数反函数值 • ④均值与方差计算函数（stat），求给定分布的随机变量X的数学期望E(X)和方差var(X) • ⑤随机数生成函数（rnd），模拟生成指定分布的样本数据(调用格式：x=分布rnd(分布参数)，如x=normrnd(0,1))

1. MATLAB中概率分布函数 • 常见的分布类型名如下

1. MATLAB中概率分布函数 • 具体函数的命名规则是： • 函数名＝分布类型名称+函数类型名称(pdf、cdf、inv、stat、rnd) • 例如，normpdf、normcdf、norminv、normstat和normrnd分别是正态分布的概率密度、累积分布、逆累积分布、数字特征和随机数生成函数。 • 关于这5类函数的语法，请详见有关书籍 • 快捷的学习可借助MATLAB的系统帮助，通过指令doc获得具体函数的详细信息，语法是doc <函数名>

2. 二项分布实验 • 已知Y~b(20, 0.3)求Y分布率的值，并划出图形 • 在Matlab中输入以下命令： • binopdf(10,20,0.2) • x=0:1:20; • y=binopdf(x,20,0.2) • plot(x,y,’r.’) 结果： ans = 0.0020 y =0.0115 0.0576 0.1369 0.2054 0.2182 0.1746 0.1091 0.0545 0.0222 0.0074 0.0020 0.0005 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000

2. 二项分布实验 • 已知Y~b(20, 0.3)求Y分布函数的值，画出函数图像 • 在Matlab中输入以下命令： • binocdf(10,20,0.2) • x=0:1:20; • y=binocdf(x,20,0.2) • ezplot('binocdf(t,20,0.3)',[0,20]) 结果： ans = 0.9994 y = 0.0115 0.0692 0.2061 0.4114 0.6296 0.8042 0.9133 0.9679 0.9900 0.9974 0.9994 0.9999 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000

2. 二项分布实验

2. 二项分布实验 • 到某服务机构办事总是要排队等待的。设等待时间T是服从指数分布的随机变量(单位：分钟)，概率密度为 • 设某人一个月内要到此办事10次，若等待时间超过15分钟，他就离去。求：(1)恰好有两次离去的概率；(2)最多有两次离去的概率；(3)至少有两次离去的概率；(4)离去的次数占多数的概率。

2. 二项分布实验 • 解首先求任一次离去的概率，依题意 • 设10次中离去的次数为X，则X~b(10, p) • >> p=1-expcdf(15,10) %任一次离去的概率 • p1=binopdf(2,10,p)%恰有两次离去的概率 • q=binopdf([0:2],10,p);p2=sum(q)%最多有两次离去的概率 • q=binopdf([0:1],10,p);p3=1-sum(q)%最少有两次离去的概率 • q=binopdf([0:5],10,p);p4=1-sum(q)%离去的次数占多数的概率 • p = 0.2231 • p1 = 0.2972 • p2 = 0.6073 • p3 = 0.6899 • p4 = 0.0112

3. 泊松分布实验 • 假设电话交换台每小时接到的呼叫次数X服从参数=3的泊松分布，求 • (1) 每小时恰有4次呼叫的概率 • (2) 一小时内呼叫不超过5次的概率 • (3) 画出分布律图像在Matlab中输入以下命令： (1)p1= poisspdf(4,3) (2)p2= poisscdf(5,3) (3)x=0:1:20;y=poisspdf(x,3);plot(x,y)

3. 泊松分布实验

4. 二项分布与泊松分布关系实验 • 二项分布与泊松分布的关系 • 例7：X~b(200,0.02)，Y 服从参数为4的泊松分布，划出分布率图像 • x=0:20; • y1=binopdf(x,200,0.02); • y2=poisspdf(x,4); • plot(x,y1,’r.’,x,y2,’b.’)

4. 二项分布与泊松分布关系实验 • 泊松定理 • (用泊松分布来逼近二项分布的定理) • 设λ>0是一个常数，n是任意正整数，设npn＝λ，则对于任意固定的非负整数k，有 • 例9 某种重大疾病的医疗险种，每份每年需交保险费100元，若在这一年中，投保人得了这种疾病，则每份可以得到索赔额10000元，假设该地区这种疾病的患病率为0.0002，现该险种共有10000份保单，问：(1)保险公司亏本的概率是多少?(2)保险公司获利不少于80万元的概率是多少?

解设 表示这一年中发生索赔的份数，依题意，的统计规律可用二项分布来描述。由二项分布与泊松分布的近似计算关系有 • 近似服从参数为2的泊松分布。 • 当索赔份数超过100份时，则保险公司发生亏本，亏本的概率为 • 当索赔份数不超过20份时，则保险公司获利就不少于80万元，其概率为

>> [p]=poisspdf([0:100],2);%计算101个泊松分布概率值或 [p]=binopdf([0:100],10000,0.0002); %按二项分布计算 • p1=1-sum(p) %求出保险公司亏本的概率p1 = 0.0000 • >> [p]=poisspdf([0:19],2);%计算出20个泊松分布概率值或 [p]=binopdf([0:19],10000,0.0002); %按二项分布计算 • p2=sum(p)%求出保险公司获利不少于80万元的概率 p2 = 1.0000

5. 连续型随机变量分布实验 • 离散均匀分布的概率密度函数和累积分布函数 unidpdf(X,N) unidcdf(X,N) • 随机变量X在1到N上的N各自然数之间等可能取值 • 在Matlab中输入以下命令： • x=1:1:10; y=unidpdf(x,10) • 结果：y = 0.1000 0.1000 0.1000 0.1000 0.1000 0.1000 0.1000 0.1000 0.1000 0.1000 • 在Matlab中输入以下命令： • x=0:1:10; y=unidcdf(x,10) • 结果：y = 0 0.1000 0.2000 0.3000 0.4000 0.5000 0.6000 0.7000 0.8000 0.9000 1.0000

5. 连续型随机变量分布实验 • 连续均匀分布 • 密度函数：f=unifpdf(x,a,b) • 分布函数：f=unifcdf(x,a,b) • 例: 画出均匀分布U(2,5)的概率密度函数和分布函数的图形. • 在Matlab中输入以下命令： • x=0:0.01:7; • y=unifpdf(x,2,5); • z=unifcdf(x,2,5); • plot(x,y,x,z)

5. 连续型随机变量分布实验 • (2) 指数分布 • 密度函数：f=exppdf(x,) • 分布函数：F=expcdf(x,) • 例: 画出指数分布E(1)的概率密度函数和分布函数的图形. 求P(0<X<5) P(0<X<20). • 在Matlab中输入以下命令： • x=0:0.1:5; • y=exppdf(x,2); • z=expcdf(x,2); • plot(x,y,x,z) • result1=expcdf(5,2)-expcdf(0,2) • result2=expcdf(20,2)-expcdf(0,2)

结果：result1 = 0.91791500137610 result2 = 0.99995460007024

5. 连续型随机变量分布实验 • (3) 正态分布 • 密度函数：f=normpdf(x,,) • 分布函数：F=normcdf(x,,) • 例: 画出正态分布N(1,4)的概率密度函数和分布函数的图形. 求P(1<X<6). • 在Matlab中输入以下命令： • x=-5:0.1:6; • y=normpdf(x,1,2); • z=normcdf(x,1,2); • plot(x,y,x,z) • result=normcdf(6,1,2)-normcdf(1,1,2)

5. 连续型随机变量分布实验 结果：Result =0.4938

5. 连续型随机变量分布实验 例11：在同一坐标下,画下列正态分布的密度函数图像 (1) μ=3, σ=0.5, 0.7, 1, 1.5, 2 (2) σ=0.5, μ=1,2,3,4 (1)命令： x=-6:0.1:6; y1=normpdf(x,3,0.5); y2=normpdf(x,3,0.7); y3=normpdf(x,3,1); y4=normpdf(x,3,1.5); y5=normpdf(x,3,2); plot(x,y1,'.',x,y2,'+',x,y3,'*',x,y4,'d',x,y5)

例观察正态分布参数对密度曲线的影响。 • 解：>> clear • mu1=2.5;mu2=3;sigma1=0.5;sigma2=0.6; • x=(mu2-4*sigma2):0.01:(mu2+4*sigma2); • y1=normpdf(x,mu1,sigma1); %考察均值的影响 • y2=normpdf(x,mu2,sigma1); • y3=normpdf(x,mu1,sigma1); %考察方差的影响 • y4=normpdf(x,mu1,sigma2); • subplot(1,2,1) %考察结果的可视化 • plot(x,y1,'-g',x,y2,'-b') • xlabel('\fontsize{12}μ1<μ2,σ1=σ2' ) • legend('μ1','μ2') • subplot(1,2,2) • plot(x,y3,'-g',x,y4,'-b') • xlabel('\fontsize{12}μ1=μ2,σ1<σ2' ) • legend('σ1','σ2')

5. 连续型随机变量分布实验 • 计算正态分布的累积概率值 • 例，设X~N(4,32), P{3<X<6}, P{X>3} • 调用函数normcdf(x,μ,σ) • 返回函数值 • 解： • >> p1=normcdf(6,4,3)-normcdf(3,4,3) • p1 = 0.3781 • >> p2=1-normcdf(3,4,3) • p2 = 0.6306

例正态分布参数μ和σ对变量x取值规律的约束——3σ准则。例正态分布参数μ和σ对变量x取值规律的约束——3σ准则。解：>> clear,clf %（标准）正态分布密度曲线下的面积 • X=linspace(-5,5,100); • Y=normpdf(X,0,1); • yy=normpdf([-3,-2,-1,0,1,2,3],0,1); • plot(X,Y,'k-',[0,0],[0,yy(4)],'c-.') • hold on • plot([-2,-2],[0,yy(2)],'m:',[2,2],[0,yy(6)],'m:',[-2,-0.5],[yy(6),yy(6)],'m:',[0.5,2],[yy(6),yy(6)],'m:') • plot([-1,-1],[0,yy(3)],'g:',[1,1],[0,yy(5)],'g:',[-1,-0.5],[yy(5), yy(5)],'g:',[0.5,1],[yy(5),yy(5)],'g:') • plot([-3,-3],[0,yy(1)],'b:',[3,3],[0,yy(7)],'b:',[-3,-0.5],[yy(7), yy(7)],'b:',[0.5,3],[yy(7),yy(7)],'b:')

5. 连续型随机变量分布实验 • hold off • text(-0.5,yy(6)+0.005,'\fontsize{14}95.44%') • text(-0.5,yy(5)+0.005,'\fontsize{14}68.26%') • text(-0.5,yy(7)+0.005,'\fontsize{14}99.74%') • text(-3.2,-0.03,'\fontsize{10}μ-3σ') • text(-2.2,-0.03,'\fontsize{10}μ-2σ') • text(-1.2,-0.03,'\fontsize{10}μ-σ') • text(-0.05,-0.03,'\fontsize{10}μ') • text(0.8,-0.03,'\fontsize{10}μ+σ') • text(1.8,-0.03,'\fontsize{10}μ+2σ') • text(2.8,-0.03,'\fontsize{10}μ+3σ')

6. 随机变量的数学期望和方差 • 对于任意的分布，可用Matlab中的函数和运算编程实现 • 对于给定的分布，只需给出分布的参数，即可调用stat族函数，得出数学期望和方差，调用格式 • [E,D]=分布+stat(参数) • 例：求二项分布参数n=100，p=0.2的数学期望和方差： • 解：>>n=100; >>p=0.2; >>[E,D]=binostat(n,p); 结果显示：E= 20 D= 16

例绘制正态分布的密度函数、分布函数曲线，并求均值与方差 6. 随机变量的数学期望和方差解： • >> clear • mu=2.5;sigma=0.6; • x=(mu-4*sigma):0.005:(mu+4*sigma); • y=normpdf(x,mu,sigma); • f=normcdf(x,mu,sigma); • plot(x,y,'-g',x,f,':b') • [M,V]=normstat(mu,sigma) • legend('pdf','cdf',-1)

M=2.5000 • V=0.3600 从图中可以看出，正态密度曲线是关于x＝μ对称的钟形曲线(两侧在μ±σ处各有一个拐点)，正态累积分布曲线当x＝μ时F(x)＝0.5。

7. 逆累积分布函数 • 逆累积分布函数就是返回给定概率条件下的自变量的临界值，实际上是分布函数的逆函数。 • icdf(Inverse Cumulative Distribution Function) • 即：在分布函数F(x)=p中已知p求其相对应的x的值 • 调用：在分布函数名后加inv • 如:X=norminv(p,mu,sgm) • 也有2)X=icdf(‘name’,p,A1,A2,A3),其中name为相应的函数名，如‘normal’;p为给定的概率值； • A1,A2,A3为相应的参数

7. 逆累积分布函数 例、计算标准正态分布N(0,1)概率值0.1，0.3， 0.5，0.7，0.9，所对应的x的值命令： y=0.1:0.2:0.9； x=norminv(y,0,1) 结果： x=-1.2816 -0.5244 0 0.5244 1.2816 检验：y1=normcdf(x,0,1); y1=0.1000 0.3000 0.5000 0.7000 0.9000

7. 逆累积分布函数 例、计算二项分布b(10,0.5)概率值0.1，0.3， 0.5，0.7，0.9，所对应的x的值命令： p=0.1:0.2:0.9; x=binoinv(p,10,0.5) 结果： x=3 4 5 6 7 检验：y1=binocdf(x,10,0.5); 结果： y1=0.1719 0.3770 0.6230 0.8281 0.9453

7. 逆累积分布函数 • 在离散分布情形下，icdf 返回使cdf(x)p的第一个值x • 上例中，对p=0.1，对应cdf(x)0.1的第一个值为3，故返回值为3 • B(10,0.5)的分布函数图像

定义：上 分位点：设随机变量X的分布函数为： F(x),如果实数满足P(X> )= ,则称为上分位点例14、计算自由度为8的卡方分布的上分位点，其中α=0.1，0.05，0.025 7.逆累积分布函数-上分位点命令： x=[0.1,0.05,0.025]; y=chi2inv(1-x,8) 结果： y=13.3616 15.5073 17.5345

例标准正态分布α分位数的概念图示。 解 >> %α分位数示意图（标准正态分布，α=0.05） • clear,clf • data=normrnd(0,1,300,1); • xalpha1=norminv(0.05,0,1); • xalpha2=norminv(0.95,0,1); • xalpha3=norminv(0.025,0,1); • xalpha4=norminv(0.975,0,1); • subplot(3,1,1) • capaplot(data,[-inf,xalpha1]);axis([-3,3,0,0.45]) • subplot(3,1,2) • capaplot(data,[xalpha2,inf]);axis([-3,3,0,0.45]) • subplot(3,1,3) • capaplot(data,[-inf,xalpha3]);axis([-3,3,0,0.45]) • hold on • capaplot(data,[xalpha4,inf]);axis([-3,3,0,0.45]) • hold off • xalpha1xalpha2xalpha3xalpha4

xalpha1 = -1.6449 • xalpha2 = 1.6449 • xalpha3 = -1.9600 xalpha4 = 1.9600

8. 中心极限定理 • 例1利用随机数样本验证中心极限定理 • 独立同分布的随机变量的和的极限分布服从正态分布，通过产生容量为n的poiss分布和exp分布的样本，研究其和的渐近分布。 • 算法如下： • ① 产生容量为n的独立同分布的随机数样本，得其均值和标准差； • ② 将随机数样本和标准化； • ③ 重复①、②； • ④ 验证所得标准化的随机数样本和是否服从标准正态分布

8. 中心极限定理 • >> clear • n=2000; • means=0; • s=0; • y=[]; • lamda=4; • a=lamda; • for i=1:n • r=poissrnd(a,n,1);%可换成r=exprnd(a,n,1)； • means=mean(r);%计算样本均值 • s=std(r);%计算样本标准差 • y(i)=sqrt(n).*(means-a)./sqrt(s); • end • normplot(y);%分布的正态性检验 • title('poiss分布，中心极限定理')

8. 中心极限定理 • 棣莫弗-拉普拉斯定理的应用 • Galton钉板模型和二项分布 • Galton钉板试验是由英国生物统计学家和人类学家Galton设计的。故而得名。 • 通过模拟Calton钉板试验，观察和体会二项分布概率分布列的意义、形象地理解De Moivre -Laplace中心极限定理。

小球最后落入的格数 ? x -8 -7 -6 -5 -4 -3 -2 -11 2 3 4 5 6 7 8 O 记小球向右落下的次数为则记小球向左落下的次数为则 8. 中心极限定理高尔顿( Francis Galton,1822-1911) 英国人类学家和气象学家高尔顿钉板试验落下的位置为 15层中向右的次数减向左的次数共15层小钉符号函数,大于0返回1,小于0返回-1,等于0返回0 W取值从-8到8

什么曲线 ？ x 小球碰第层钉后向右落下 -8 -7-6-5-4-3-2-11 2 3 4 5 6 7 8 小球碰第层钉后向左落下近似 8. 中心极限定理高尔顿钉板试验共15层小钉 O 记则

基于 MATLAB 的概率统计数值实验二、随机变量及其分布