1 / 60

基于 MATLAB 的概率统计数值实验 二、随机变量及其分布

基于 MATLAB 的概率统计数值实验 二、随机变量及其分布. 本科生必修课:概率论与数理统计. 主讲教师 :董庆宽 研究方向 :密码学与信息安全 Email : qkdong@mail.xidian.edu.cn 个人主页: http://web.xidian.edu.cn/qkdong/. 内容介绍. 二、随机变量及其分布 1. MATLAB 中概率分布函数 2. 二项分布实验 3. 泊松分布实验 4. 二项分布与泊松分布关系实验 5. 连续型随机变量分布实验 6. 随机变量的均值与方差 7. 逆累积分布函数 实验

trixie
Download Presentation

基于 MATLAB 的概率统计数值实验 二、随机变量及其分布

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 基于MATLAB的概率统计数值实验二、随机变量及其分布基于MATLAB的概率统计数值实验二、随机变量及其分布 本科生必修课:概率论与数理统计 主讲教师:董庆宽 研究方向:密码学与信息安全 Email :qkdong@mail.xidian.edu.cn 个人主页:http://web.xidian.edu.cn/qkdong/

  2. 内容介绍 二、随机变量及其分布 1. MATLAB中概率分布函数 2. 二项分布实验 3. 泊松分布实验 4. 二项分布与泊松分布关系实验 5. 连续型随机变量分布实验 6. 随机变量的均值与方差 7. 逆累积分布函数实验 8. 中心极限定理实验

  3. 1. MATLAB中概率分布函数 • MATLAB为常见自然概率分布提供了下列5类函数 • ①概率密度函数(pdf),求随机变量X在x点处的概率密度值 • ②累积分布函数(cdf),求随机变量X在x点处的分布函数值 • ③逆累积分布函数(inv),求随机变量X在概率点处的分布函数反函数值 • ④均值与方差计算函数(stat),求给定分布的随机变量X的数学期望E(X)和方差var(X) • ⑤随机数生成函数(rnd),模拟生成指定分布的样本数据(调用格式:x=分布rnd(分布参数),如x=normrnd(0,1))

  4. 1. MATLAB中概率分布函数 • 常见的分布类型名如下

  5. 1. MATLAB中概率分布函数 • 具体函数的命名规则是: • 函数名=分布类型名称+函数类型名称(pdf、cdf、inv、stat、rnd) • 例如,normpdf、normcdf、norminv、normstat和normrnd分别是正态分布的概率密度、累积分布、逆累积分布、数字特征和随机数生成函数。 • 关于这5类函数的语法,请详见有关书籍 • 快捷的学习可借助MATLAB的系统帮助,通过指令doc获得具体函数的详细信息,语法是doc <函数名>

  6. 2. 二项分布实验 • 已知Y~b(20, 0.3)求Y分布率的值,并划出图形 • 在Matlab中输入以下命令: • binopdf(10,20,0.2) • x=0:1:20; • y=binopdf(x,20,0.2) • plot(x,y,’r.’) 结果: ans = 0.0020 y =0.0115 0.0576 0.1369 0.2054 0.2182 0.1746 0.1091 0.0545 0.0222 0.0074 0.0020 0.0005 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000

  7. 2. 二项分布实验 • 已知Y~b(20, 0.3)求Y分布函数的值,画出函数图像 • 在Matlab中输入以下命令: • binocdf(10,20,0.2) • x=0:1:20; • y=binocdf(x,20,0.2) • ezplot('binocdf(t,20,0.3)',[0,20]) 结果: ans = 0.9994 y = 0.0115 0.0692 0.2061 0.4114 0.6296 0.8042 0.9133 0.9679 0.9900 0.9974 0.9994 0.9999 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000

  8. 2. 二项分布实验

  9. 2. 二项分布实验 • 到某服务机构办事总是要排队等待的。设等待时间T是服从指数分布的随机变量(单位:分钟),概率密度为 • 设某人一个月内要到此办事10次,若等待时间超过15分钟,他就离去。求:(1)恰好有两次离去的概率;(2)最多有两次离去的概率;(3)至少有两次离去的概率;(4)离去的次数占多数的概率。

  10. 2. 二项分布实验 • 解 首先求任一次离去的概率,依题意 • 设10次中离去的次数为X,则X~b(10, p) • >> p=1-expcdf(15,10) %任一次离去的概率 • p1=binopdf(2,10,p)%恰有两次离去的概率 • q=binopdf([0:2],10,p);p2=sum(q)%最多有两次离去的概率 • q=binopdf([0:1],10,p);p3=1-sum(q)%最少有两次离去的概率 • q=binopdf([0:5],10,p);p4=1-sum(q)%离去的次数占多数的概率 • p = 0.2231 • p1 = 0.2972 • p2 = 0.6073 • p3 = 0.6899 • p4 = 0.0112

  11. 3. 泊松分布实验 • 假设电话交换台每小时接到的呼叫次数X服从参数=3的泊松分布,求 • (1) 每小时恰有4次呼叫的概率 • (2) 一小时内呼叫不超过5次的概率 • (3) 画出分布律图像 在Matlab中输入以下命令: (1)p1= poisspdf(4,3) (2)p2= poisscdf(5,3) (3)x=0:1:20;y=poisspdf(x,3);plot(x,y)

  12. 3. 泊松分布实验

  13. 4. 二项分布与泊松分布关系实验 • 二项分布与泊松分布的关系 • 例7:X~b(200,0.02),Y 服从参数为4的泊松分布,划出分布率图像 • x=0:20; • y1=binopdf(x,200,0.02); • y2=poisspdf(x,4); • plot(x,y1,’r.’,x,y2,’b.’)

  14. 4. 二项分布与泊松分布关系实验 • 泊松定理 • (用泊松分布来逼近二项分布的定理) • 设λ>0是一个常数,n是任意正整数,设npn=λ,则对于任意固定的非负整数k,有 • 例9 某种重大疾病的医疗险种,每份每年需交保险费100元,若在这一年中,投保人得了这种疾病,则每份可以得到索赔额10000元,假设该地区这种疾病的患病率为0.0002,现该险种共有10000份保单,问:(1)保险公司亏本的概率是多少?(2)保险公司获利不少于80万元的概率是多少?

  15. 解 设 表示这一年中发生索赔的份数,依题意, 的统计规律可用二项分布 来描述。由二项分布与泊松分布的近似计算关系有 • 近似服从参数为2的泊松分布。 • 当索赔份数超过100份时,则保险公司发生亏本,亏本的概率为 • 当索赔份数不超过20份时,则保险公司获利就不少于80万元,其概率为

  16. >> [p]=poisspdf([0:100],2);%计算101个泊松分布概率值或 [p]=binopdf([0:100],10000,0.0002); %按二项分布计算 • p1=1-sum(p) %求出保险公司亏本的概率p1 = 0.0000 • >> [p]=poisspdf([0:19],2);%计算出20个泊松分布概率值 或 [p]=binopdf([0:19],10000,0.0002); %按二项分布计算 • p2=sum(p)%求出保险公司获利不少于80万元的概率 p2 = 1.0000

  17. 5. 连续型随机变量分布实验 • 离散均匀分布的概率密度函数和累积分布函数 unidpdf(X,N) unidcdf(X,N) • 随机变量X在1到N上的N各自然数之间等可能取值 • 在Matlab中输入以下命令: • x=1:1:10; y=unidpdf(x,10) • 结果:y = 0.1000 0.1000 0.1000 0.1000 0.1000 0.1000 0.1000 0.1000 0.1000 0.1000 • 在Matlab中输入以下命令: • x=0:1:10; y=unidcdf(x,10) • 结果:y = 0 0.1000 0.2000 0.3000 0.4000 0.5000 0.6000 0.7000 0.8000 0.9000 1.0000

  18. 5. 连续型随机变量分布实验 • 连续均匀分布 • 密度函数:f=unifpdf(x,a,b) • 分布函数:f=unifcdf(x,a,b) • 例: 画出均匀分布U(2,5)的概率密度函数和分布函数的图形. • 在Matlab中输入以下命令: • x=0:0.01:7; • y=unifpdf(x,2,5); • z=unifcdf(x,2,5); • plot(x,y,x,z)

  19. 5. 连续型随机变量分布实验 • (2) 指数分布 • 密度函数:f=exppdf(x,) • 分布函数:F=expcdf(x,) • 例: 画出指数分布E(1)的概率密度函数和分布函数的图形. 求P(0<X<5) P(0<X<20). • 在Matlab中输入以下命令: • x=0:0.1:5; • y=exppdf(x,2); • z=expcdf(x,2); • plot(x,y,x,z) • result1=expcdf(5,2)-expcdf(0,2) • result2=expcdf(20,2)-expcdf(0,2)

  20. 结果:result1 = 0.91791500137610 result2 = 0.99995460007024

  21. 5. 连续型随机变量分布实验 • (3) 正态分布 • 密度函数:f=normpdf(x,,) • 分布函数:F=normcdf(x,,) • 例: 画出正态分布N(1,4)的概率密度函数和分布函数的图形. 求P(1<X<6). • 在Matlab中输入以下命令: • x=-5:0.1:6; • y=normpdf(x,1,2); • z=normcdf(x,1,2); • plot(x,y,x,z) • result=normcdf(6,1,2)-normcdf(1,1,2)

  22. 5. 连续型随机变量分布实验 结果:Result =0.4938

  23. 5. 连续型随机变量分布实验 例11:在同一坐标下,画下列正态分布的密度函数图像 (1) μ=3, σ=0.5, 0.7, 1, 1.5, 2 (2) σ=0.5, μ=1,2,3,4 (1)命令: x=-6:0.1:6; y1=normpdf(x,3,0.5); y2=normpdf(x,3,0.7); y3=normpdf(x,3,1); y4=normpdf(x,3,1.5); y5=normpdf(x,3,2); plot(x,y1,'.',x,y2,'+',x,y3,'*',x,y4,'d',x,y5)

  24. 例 观察正态分布参数对密度曲线的影响。 • 解:>> clear • mu1=2.5;mu2=3;sigma1=0.5;sigma2=0.6; • x=(mu2-4*sigma2):0.01:(mu2+4*sigma2); • y1=normpdf(x,mu1,sigma1); %考察均值的影响 • y2=normpdf(x,mu2,sigma1); • y3=normpdf(x,mu1,sigma1); %考察方差的影响 • y4=normpdf(x,mu1,sigma2); • subplot(1,2,1) %考察结果的可视化 • plot(x,y1,'-g',x,y2,'-b') • xlabel('\fontsize{12}μ1<μ2,σ1=σ2' ) • legend('μ1','μ2') • subplot(1,2,2) • plot(x,y3,'-g',x,y4,'-b') • xlabel('\fontsize{12}μ1=μ2,σ1<σ2' ) • legend('σ1','σ2')

  25. 5. 连续型随机变量分布实验 • 计算正态分布的累积概率值 • 例,设X~N(4,32), P{3<X<6}, P{X>3} • 调用函数normcdf(x,μ,σ) • 返回函数值 • 解: • >> p1=normcdf(6,4,3)-normcdf(3,4,3) • p1 = 0.3781 • >> p2=1-normcdf(3,4,3) • p2 = 0.6306

  26. 例正态分布参数μ和σ对变量x取值规律的约束——3σ准则。例正态分布参数μ和σ对变量x取值规律的约束——3σ准则。 解:>> clear,clf %(标准)正态分布密度曲线下的面积 • X=linspace(-5,5,100); • Y=normpdf(X,0,1); • yy=normpdf([-3,-2,-1,0,1,2,3],0,1); • plot(X,Y,'k-',[0,0],[0,yy(4)],'c-.') • hold on • plot([-2,-2],[0,yy(2)],'m:',[2,2],[0,yy(6)],'m:',[-2,-0.5],[yy(6),yy(6)],'m:',[0.5,2],[yy(6),yy(6)],'m:') • plot([-1,-1],[0,yy(3)],'g:',[1,1],[0,yy(5)],'g:',[-1,-0.5],[yy(5), yy(5)],'g:',[0.5,1],[yy(5),yy(5)],'g:') • plot([-3,-3],[0,yy(1)],'b:',[3,3],[0,yy(7)],'b:',[-3,-0.5],[yy(7), yy(7)],'b:',[0.5,3],[yy(7),yy(7)],'b:')

  27. 5. 连续型随机变量分布实验 • hold off • text(-0.5,yy(6)+0.005,'\fontsize{14}95.44%') • text(-0.5,yy(5)+0.005,'\fontsize{14}68.26%') • text(-0.5,yy(7)+0.005,'\fontsize{14}99.74%') • text(-3.2,-0.03,'\fontsize{10}μ-3σ') • text(-2.2,-0.03,'\fontsize{10}μ-2σ') • text(-1.2,-0.03,'\fontsize{10}μ-σ') • text(-0.05,-0.03,'\fontsize{10}μ') • text(0.8,-0.03,'\fontsize{10}μ+σ') • text(1.8,-0.03,'\fontsize{10}μ+2σ') • text(2.8,-0.03,'\fontsize{10}μ+3σ')

  28. 6. 随机变量的数学期望和方差 • 对于任意的分布,可用Matlab中的函数和运算编程实现 • 对于给定的分布,只需给出分布的参数,即可调用stat族函数,得出数学期望和方差,调用格式 • [E,D]=分布+stat(参数) • 例:求二项分布参数n=100,p=0.2的数学期望和方差: • 解:>>n=100; >>p=0.2; >>[E,D]=binostat(n,p); 结果显示:E= 20 D= 16

  29. 绘制正态分布的密度函数、分布函数曲线,并求均值与方差 6. 随机变量的数学期望和方差 解: • >> clear • mu=2.5;sigma=0.6; • x=(mu-4*sigma):0.005:(mu+4*sigma); • y=normpdf(x,mu,sigma); • f=normcdf(x,mu,sigma); • plot(x,y,'-g',x,f,':b') • [M,V]=normstat(mu,sigma) • legend('pdf','cdf',-1)

  30. M=2.5000 • V=0.3600 从图中可以看出,正态密度曲线是关于x=μ对称的钟形曲线(两侧在μ±σ处各有一个拐点),正态累积分布曲线当x=μ时F(x)=0.5。

  31. 7. 逆累积分布函数 • 逆累积分布函数就是返回给定概率条件下的自变量的临界值,实际上是分布函数的逆函数。 • icdf(Inverse Cumulative Distribution Function) • 即:在分布函数F(x)=p中已知p求其相对应的x的值 • 调用:在分布函数名后加inv • 如:X=norminv(p,mu,sgm) • 也有2)X=icdf(‘name’,p,A1,A2,A3),其中name为相应的函数名,如‘normal’;p为给定的概率值; • A1,A2,A3为相应的参数

  32. 7. 逆累积分布函数 例、计算标准正态分布N(0,1)概率值0.1,0.3, 0.5,0.7,0.9,所对应的x的值 命令: y=0.1:0.2:0.9; x=norminv(y,0,1) 结果: x=-1.2816 -0.5244 0 0.5244 1.2816 检验:y1=normcdf(x,0,1); y1=0.1000 0.3000 0.5000 0.7000 0.9000

  33. 7. 逆累积分布函数 例、计算二项分布b(10,0.5)概率值0.1,0.3, 0.5,0.7,0.9,所对应的x的值 命令: p=0.1:0.2:0.9; x=binoinv(p,10,0.5) 结果: x=3 4 5 6 7 检验:y1=binocdf(x,10,0.5); 结果: y1=0.1719 0.3770 0.6230 0.8281 0.9453

  34. 7. 逆累积分布函数 • 在离散分布情形下,icdf 返回使cdf(x)p的第一个值x • 上例中,对p=0.1,对应cdf(x)0.1的第一个值为3,故返回值为3 • B(10,0.5)的分布函数图像

  35. 定义:上 分位点:设随机变量X的分布函数为: F(x),如果实数 满足P(X> )= ,则称 为上 分位点 例14、计算自由度为8的卡方分布的上 分位点, 其中α=0.1,0.05,0.025 7.逆累积分布函数-上分位点 命令: x=[0.1,0.05,0.025]; y=chi2inv(1-x,8) 结果: y=13.3616 15.5073 17.5345

  36. 例 标准正态分布α分位数的概念图示。 解 >> %α分位数示意图(标准正态分布,α=0.05) • clear,clf • data=normrnd(0,1,300,1); • xalpha1=norminv(0.05,0,1); • xalpha2=norminv(0.95,0,1); • xalpha3=norminv(0.025,0,1); • xalpha4=norminv(0.975,0,1); • subplot(3,1,1) • capaplot(data,[-inf,xalpha1]);axis([-3,3,0,0.45]) • subplot(3,1,2) • capaplot(data,[xalpha2,inf]);axis([-3,3,0,0.45]) • subplot(3,1,3) • capaplot(data,[-inf,xalpha3]);axis([-3,3,0,0.45]) • hold on • capaplot(data,[xalpha4,inf]);axis([-3,3,0,0.45]) • hold off • xalpha1xalpha2xalpha3xalpha4

  37. xalpha1 = -1.6449 • xalpha2 = 1.6449 • xalpha3 = -1.9600 xalpha4 = 1.9600

  38. 8. 中心极限定理 • 例1利用随机数样本验证中心极限定理 • 独立同分布的随机变量的和的极限分布服从正态分布,通过产生容量为n的poiss分布和exp分布的样本,研究其和的渐近分布。 • 算法如下: • ① 产生容量为n的独立同分布的随机数样本,得其均值和标准差; • ② 将随机数样本和标准化; • ③ 重复①、②; • ④ 验证所得标准化的随机数样本和是否服从标准正态分布

  39. 8. 中心极限定理 • >> clear • n=2000; • means=0; • s=0; • y=[]; • lamda=4; • a=lamda; • for i=1:n • r=poissrnd(a,n,1);%可换成r=exprnd(a,n,1); • means=mean(r);%计算样本均值 • s=std(r);%计算样本标准差 • y(i)=sqrt(n).*(means-a)./sqrt(s); • end • normplot(y);%分布的正态性检验 • title('poiss分布,中心极限定理')

  40. 8. 中心极限定理 • 棣莫弗-拉普拉斯定理的应用 • Galton钉板模型和二项分布 • Galton钉板试验是由英国生物统计学家和人类学家Galton设计的。故而得名。 • 通过模拟Calton钉板试验,观察和体会二项分布概率分布列的意义、形象地理解De Moivre -Laplace中心极限定理。

  41. 小球最后落入的格数 ? x -8 -7 -6 -5 -4 -3 -2 -11 2 3 4 5 6 7 8 O 记小球向右落下的次数为则 记小球向左落下的次数为则 8. 中心极限定理 高尔顿( Francis Galton,1822-1911) 英国人类学家和气象学家 高尔顿钉板试验 落下的位置为 15层中向右的次数减向左的次数 共15层小钉 符号函数,大于0返回1,小于0返回-1,等于0返回0 W取值从-8到8

  42. 什么曲线 ? x 小球碰第 层钉后向右落下 -8 -7-6-5-4-3-2-11 2 3 4 5 6 7 8 小球碰第 层钉后向左落下 近似 8. 中心极限定理 高尔顿钉板试验 共15层小钉 O 记 则

More Related