430 likes | 596 Views
第三章 随机变量及其分布. 从本章开始,我们引入随机变量,从而使概率论的研究. 对象由随机事件扩大为随机变量。随机变量概念的建立是概. 率论发展史上的重大突破。对于随机变量的分布函数,我们. 能够用微积分为工具进行研究,强有力的高等数学的工具大. 大增强了我们研究随机现象的 手段,从而使概率论的发展进. 入了一个新阶段。. 本章主要介绍随机变量、分布函数、随机变量的分布. (包括离散型和连续型)、常用的离散 型和连续型分布以及. 随机变量函数的分布。. X( ωn). X( ω1). X( ω2).
E N D
第三章 随机变量及其分布 从本章开始,我们引入随机变量,从而使概率论的研究 对象由随机事件扩大为随机变量。随机变量概念的建立是概 率论发展史上的重大突破。对于随机变量的分布函数,我们 能够用微积分为工具进行研究,强有力的高等数学的工具大 大增强了我们研究随机现象的手段,从而使概率论的发展进 入了一个新阶段。 本章主要介绍随机变量、分布函数、随机变量的分布 (包括离散型和连续型)、常用的离散型和连续型分布以及 随机变量函数的分布。
X(ωn) X(ω1) X(ω2) Ω={ω1, ω2, ω3, ω4, ………… , ωn, …………} 第一节 随机变量和分布函数 一、随机变量 定义3-1 设随机试验的样本空间为 Ω={ω}。若对于 每一个ω∈Ω,有一个实数X(ω)与之对应,这样就得到一 个定义在Ω上的实值单值函数X(ω),则称X(ω)为随机 变量(random variable),简记为 X。 随机变量通常用字母 X, Y, Z 或 ξ,η等表示。
设随机试验的样本空间为 Ω={ω}。若 A 为 Ω 的某 个随机事件,则定义 这样就有 A={ω|X(ω)=1} 通常将{ω|X(ω)=1}记为{X=1}, 即A={X=1}。 从而可得出:任意事件都可以用一个随机变量表示。相 应地,求事件A的概率P(A)等价于求随机变量 X 等于 1 的概率,即P(A)=P(X=1) 这样一来,事件的研究就可纳入随机变量的研究之中, 所有关于事件的性质和定理都可搬过来用。
例3-1有5件产品,其中2件是次品(用a1,a2表示), 3件是正品(用b1,b2,b3表示)。从中任意取出2件, 此时随机试验的样本空间为: Ω={(a1,a2),(a1,b1),(a1,b2), (a1,b3),(a2,b1),(a2,b2), (a2,b3),(b1,b2),(b1,b3), (b2,b3)} 我们将Ω中的样本点依次记为: 考虑抽取的两件产品中次品的个数X,显然X是定义在Ω上的 一个随机变量,即X=X(ω)。可具体表示为: 随机变量X=X(ω)取不同数值的概率为:
X 0 1 2 P 随机变量X=X(ω)取不同数值的概率为: 通常记为: 称为随机变量的概率分布。 根据概率分布,可以清楚地看到随机变量X的取值和概率。 例如: 为此我们引入随机变量分布函数的定义。
二、随机变量的分布函数 定义 3-2 设 X 是一个随机变量,x 是任意实数,概 率P(X ≤ x)是 x 的函数,则称此函数为随机变量 X 的 分布函数(distribution function),记为F(x),即 分布函数F(x)具有下列四个基本性质: 即单调不减; 即右连续。 证明 (1) 由于F(x)是事件{X≤x}的概率,所以显然有
定义 3-2 设 X 是一个随机变量,x 是任意实数,概 率P(X ≤ x)是 x 的函数,则称此函数为随机变量 X 的 分布函数(distribution function),记为F(x),即 分布函数F(x)具有下列四个基本性质: 即单调不减; 即右连续。 证明 (2)由于 因而有 即 又由概率的非负性知,
定义 3-2 设 X 是一个随机变量,x 是任意实数,概 率P(X ≤ x)是 x 的函数,则称此函数为随机变量 X 的 分布函数(distribution function),记为F(x),即 分布函数F(x)具有下列四个基本性质: 即单调不减; 即右连续。 证明 (3) 只能直观地来说明一下。在 x 趋向-∞ 的过程中, 中的样本点越来越少,从而有 同理,在x趋向+∞的过程中,{X≤x}中的样本点越来越多,从而有
定义 3-2 设 X 是一个随机变量,x 是任意实数,概 率P(X ≤ x)是 x 的函数,则称此函数为随机变量 X 的 分布函数(distribution function),记为F(x),即 分布函数F(x)具有下列四个基本性质: 即单调不减; 即右连续。 证明 (4)证明超出课程范围,从略。
a b 在性质(2)中,我们证明了一个公式:当 时,有 再利用概率的运算,就可得到其他事件的概率。例如, 我们只要知道一个随机变量的分布函数,就能知道该随 机变量取值于任何一个区间,乃至取任一实数值的概率。
若随机变量 X 以函数F(x)为其分布函数,通常也 称 X 服从分布函数F(x),常记作X~F 如有函数F(x)满足上述4个基本性质,则F(x)一 定是某个随机变量的分布函数。 有些书中将分布函数定义为F(x)=P(X<x), 这与我们的定义无本质区别。在此定义下,上述4个基本 性质中(1)、(2)和(3)同样成立,性质(4)则由“右 连续”变为“左连续”。 随机变量的分类: (1) 离散型随机变量:随机变量仅取数轴上的有限个或可列个点。 (2) 连续型随机变量:随机变量的可能取值充满数轴上的一个或若干区间。 (3) 奇异型随机变量:既不是离散型随机变量,也不 是连续型随机变量。在理论上很有价值而实际问题中很少有 应用。本课程不作讨论。
第三章 习题 (P66) 1,2,3,4,5,6*,7*,8*
第二节 离散型随机变量及其分布 一、 离散型随机变量和概率分布 定义3-3 若随机变量 X 只取下列值: (可以是有限个也可以是可列个) 则称随机变量 X 为离散型随机变量(discrete random variable)。 例如,从一批产品中抽取n件,抽到的次品个数 X只能取 有限个可能值0, 1, …, n;某交换台在单位时间内收到的 呼叫次数X只能取可列个可能值 0,1,2, …。以上所说的 X 都是离散型随机变量。 对于一个离散型随机变量,要掌握它的统计规律,首先 要了解它的所有可能取值,除此之外,更主要的是要了解它 取各可能值的概率。
定义 3-4 设离散型随机变量 X 的所有可能取值为 且 是 X 取 的概率, 即 则称上式为离散型随机变量 X 的概率分布. (probability distribution) 或分布律(distribution law),通常还可以形象地表示为 概率分布完整地描述了离散型随机变量的统计规律。 概率分布具有下列两个基本性质:
概率分布具有下列两个基本性质: 证明 (1) 由概率的非负性知,显然有 (2) 由于 是 X 所有可能取值,因此 再由概率的可列可加性知, 即
概率分布具有下列两个基本性质: 具有以上两个性质,则 反之,若一串 一定可作为某一离散型随机变量的概率分布。
X 2 3 4 P 下面举例说明如何求离散型随机变量的概率分布。 例3-2 一盒中装有编号为1,2,3,4,5的五只球,现从 中任取三只球,求所抽出三只球的中间号码 X 的概率分布。 解 X 所有可能取值为2,3,4。当 时,另两只球中的一只在小于k的k-1只球中取,还有一只 球在大于 k 的 5-k只球中取,所以, 即
X 1 2 3 P 例 3-3 袋中有一个白球和二个黑球,每次从中任取一个球 直到取得白球为止,求取球次数的概率分布。 假定:(1) 每次取出的黑球不放回; (2) 每次取出的黑球仍放回。 解 用 X 表示取球次数。 (1) X 所有可能取值为 1, 2, 3。 令 =“第k次抽到白球”,k=1, 2, 3,则 即
X 1 2 3 ……i ……. P 例 3-3 袋中有一个白球和二个黑球,每次从中任取一个球 直到取得白球为止,求取球次数的概率分布。 假定:(1) 每次取出的黑球不放回; (2) 每次取出的黑球仍放回。 解 用 X 表示取球次数。 (2)X 所有可能取值为 1, 2,…。 令 =“第k次抽到白球”,k=1, 2, ……则 即
离散型随机变量概率分布和分布函数如何相互表示。离散型随机变量概率分布和分布函数如何相互表示。 1.已知概率分布求分布函数: 则其分布函数为: 离散型随机变量的分布函数是一个阶梯函数,在每一 xi 有 一跃度,这是离散型随机变量的重要特征。
离散型随机变量概率分布和分布函数如何相互表示。离散型随机变量概率分布和分布函数如何相互表示。 2.已知分布函数求概率分布: 设分布函数为 : 则其概率分布为:
X 0 1 2 P 例 3-4 设随机变量 X 的概率分布为 求: (1) X 的分布函数; (2) 解 (1)
X 0 1 2 P 例 3-4 设随机变量 X 的概率分布为 求: (1) X 的分布函数; (2) 解(2) 或 或
X 0 1 二、 常用离散型随机变量的分布 1. 0 – 1 分布 定义 3-5 设随机变量的概率分布为: 或写为 其中 则称随机变量X服从0-1分布(0-1 distribution) 或两点分布(twopoint distribution)。 设随机试验中事件A发生的概率为p(0<p<1),令 则 X 服从 0-1 分布。 由此可知,任何一个只有两种可能结果的随机试验,都 可以用一个服从0-1分布的随机变量来描述。
X 0 1 2 ……n 2. 二项分布 定义3-6若随机变量X的所有可能取值为 0,1,…,n, 且它的分布为: 或写为 其中 则称随机变量 X 服从二项分布, (binomial distribution),记作X~B(n,p)。 我们容易验证二项分布满足: 所以二项分布由此得名。 我们还常常记: n重伯努利试验中事件A出现的次数X是服从二项分布的。
例3-5 已知一公司生产某零件的次品率为0.01,并设各零 件是否次品是相互独立的。该公司将每10个零件装成一盒出售, 并承诺若发现某盒内次品多于1个则可退款,问售出的各盒零件 将被退回公司的概率为多少? 解 设 X 表示某盒零件中次品的个数,又各零件是否为次品 是相互独立,则 X 服从二项分布,即X~B(10,0.01)。 所以 又因为“售出的各盒零件被退回公司”等价于事件{ X > 1 }, 所以售出的各盒零件被退回公司的概率为
例3-6 某一大学的校网球队与该校某系网球队举行对抗赛。一般地,校队的实力比系队为强,每个校队队员获胜的概率为0.55。现有校和系双方代表商讨对抗赛的比赛方式,提出了三种方案供选择: (1) 双方各出3人; (2) 双方各出5人; (3) 双方各出7人。 三种方案中均以比赛中获胜人数多的一方为胜。问对系队而言,哪一种方案较为有利? 解 设系队获胜人数为 X,系队队员获胜概率为 0.45, 一般可以认为队员间比赛的胜负结果是相互独立的,则 X 服从 二项分布。因此,系队获胜的概率分别为: 第一种方案对系队最有利,也即对校队最不利。
第i次试验中A出现 第i次试验中A不出现 二项分布具有下面的一些性质。 性质3-1 二项分布B(n,p)中当n=1时的特殊分布为0-1分布。 性质3-2 二项分布的随机变量是n个独立的 0-1分布随机变量之和。 证明 二项分布的随机变量 X 可以看做是n重贝努利试验 中事件 A出现的次数,其中事件A在每次试验中出现的概率为p, 则X~B(n,p)。设: 显然 是服从 0-1 分布的随机变量,且 相互独立, 在第i次试验中,A出现时Xi取1,A不出现时Xi取0,所以 表示 n 次试验中A出现的次数,则 且 ,相互独立,
X 0 1 2 ……n …… 3. 普阿松分布 定义 3-7 若随机变量X的取值为非负整数,且其概率分布为 或写为 其中 是某个常数,则称随机变量 X 服从普阿松分布, (Poisson distribution),记作X~P(λ)。 容易验证普阿松分布满足: 普阿松分布是概率论中最重要的概率分布之一,在各种服 务中系统中大量出现普阿松分布。
X 0 1 2 ……n …… 普阿松分布是概率论中最重要的概率分布之一,在各种服务中系统中大量出现普阿松分布。 例如,观察某电话交换台在单位时间内收到用户的呼叫次数、某公共汽车站在单位时间内来车站乘车的乘客数等均是服从普阿松分布。 在工业生产中,每米布的疵点数、纺织机上的断头数、每件钢铁铸件的缺陷数等也近似地服从普阿松分布。 另外,像宇宙中单位体积内星球的个数、放射性分裂落到某区域的质点数等也近似地服从普阿松分布。 由于许多实际问题中的随机变量都可以用普阿松分布来描述,从而使得普阿松分布对于概率论的应用来说,有着很重要的作用; 而概率论理论的研究又表明普阿松分布在理论上也有其特殊重要的地位。
例 3-7 一家商店销售某一型号的彩色电视机。由该商店过去的销售记录知道,该型号彩色电视机每月的销售数可以用参数 λ=10 的普阿松分布来描述。为了以 95% 以上的把握保证不脱销,问商店在月底至少应该进该型号彩色电视机多少台? 解 设 X 表示商店每月销售该型号彩色电视机的台数, 且月底的进货为t台,则当 X≤t 时就不会脱销,因而按题 意要求为 又因为X~P(10),所以上式也可以表示为: 由查表和计算得 所以,满足条件的最小 t 为15。
在二项分布中,要计算 当 n 较大时,计算量很大的。但是,当 n充分大、p充分小 大小适中时,我们有如下定理,可以简化计算。 定理 3-1 在 n 重伯努利试验中,事件A在一次试验中出现 时概率为p,记np=λ。若n充分大,p充分小,而 np=λ 大小 适中时,则有 证明见第五章例 5-38(略)。 在实际计算中,当 n ≥100、p ≤ 0.1、np≤10时,我们就 可以使用以上近似公式计算。当然,当n越大,p越小,np大小 适中时,近似公式计算就越精确。 在n重伯努利试验中,我们把在每次试验中出现的概率p很 小的事件称为稀有事件。因此,由以上定理可知,在实际应用 中,通常多重伯努利试验中稀有事件出现的次数可以用普阿松 分布来描述。例如,不幸事件、意外事故、故障、非常见病和 自然灾害等都是稀有事件,所以这类事件在大量重复试验中出 现的次数均近似地服从普阿松分布。这是普阿松分布会有如此 广泛应用的重要原因。
例 3-8 我国一航天部门组织生产某一型号的运载火箭,其中需要某同一型号的元件100个,该元件的次品率为0.01,问应该一次性购进该元件至少多少个,才能以95%以上的把握不用重新去采购? 解 设 X 表示购进 100 + a 个元件中所含次品个数,其 中 a 为需另外增购的备用元件个数。又各元件是否合格显然 可以认为是相互独立的,则 X 服从二项分布,即 根据题目要求,我们只需找到最小的 a 使之满足不等式 即可。又因为 其中100+a 较大,0.01较小,而(100+a)·0.01=1+0.01a 大小适中,所以可以近似地用普阿松分布来计算。 由于在 100个元件中只有一个左右的次品,可见a一定很小,因此有 1+0.01a≈1。即 X 近似地服从普阿松分布P(1),所以
解 设 X 表示购进 100 + a 个元件中所含次品个数,其 中 a 为需另外增购的备用元件个数。又各元件是否合格显然 可以认为是相互独立的,则 X 服从二项分布,即 根据题目要求,我们只需找到最小的 a 使之满足不等式 即可。又因为 即 X 近似地服从普阿松分布P(1),所以 由查表和计算得 (1) 当a=2时,P(X≤2)≈0.9197; (2) 当a=3时,P(X≤3)≈0.9801。 由此可见,a至少应为3,即应一次性购进该元件至少103个 才能以95%以上的把握不用重新去采购。
例3-9(寿命保险问题)在保险公司里有2500个同一年龄和同社会阶层的人参加了人寿保险。在一年里每个人死亡的概率为0.002,每个参加保险的人在元旦付12元保险费,而在死亡时家属可以从保险公司领取2000元。问: (1) “保险公司亏本”(记为 A )的概率是多少? (2) “保险公司获利不少于10000元和20000元”(分别记为B1和B2)的概率是多少? 解 显然,我们可以把考察“参加保险的人在一年中是否 死亡”看做一次随机试验,因为有2500个人参加保险,所以我 们可以把该问题看做为具有死亡概率p=0.002的 2500重伯 努利试验。设 X 表示一年中死亡的人数,这样在一年的元旦 保险公司收入为2500×12=30000(元),而保险公司在这一 年中应付出的为2000X(元)。 (1) “保险公司亏本”(不计利息)等价于2000X>30000, 即 X >15(人),所以
例3-9(寿命保险问题)在保险公司里有2500个同一年龄和同社会阶层的人参加了人寿保险。在一年里每个人死亡的概率为0.002,每个参加保险的人在元旦付12元保险费,而在死亡时家属可以从保险公司领取2000元。问: (1) “保险公司亏本”(记为 A )的概率是多少? (2) “保险公司获利不少于10000元和20000元”(分别记为B1和B2)的概率是多少? 解(2) “保险公司获利不少于10000元”等价于30000- 2000X ≥ 10000,即 X≤10,所以“保险公司获利不少于 10000元”的概率为: “保险公司获利不少于20000元”等价于 30000-2000X ≥20000 即 X≤5,所以“保险公司获利不少于20000元”的概率为:
X 1 2 3 ……n …… 4. 几何分布 定义 3-8 设随机变量 X 的概率分布为 其中 则称X服从几何分布(geometric distribution) 记作X~G(p)。 容易验证几何分布分布满足: 在重复独立试验中, 每次试验观察 A 发生与否, 且 P(A)=p。记 X 为事件 A 首次发生时的试验次数, 则 X服从几何分布,即X~G(p)。
例3-10 某血库急需AB型血,需从献血者中获得。根据经验,每100个献血者中只能获得2名身体合格的AB型血的人,今对献血者一个接一个进行化验,用X表示在第一次找到合格的AB型血时,献血者已被化验的人数,求X的概率分布。 解 设Ai表示第i个献血者血型合格,i=1,2,…。由 假设知,每个献血者是合格的AB型血的概率是p=0.02,显然 可以认为是否合格独立,则 由此可知,X~G(0.02)。
性质 3-3 设X~G(p),n,m为任意两个自然数,则 证明 这个性质称为几何分布的无记忆性。实际意义是:在上例 中,若已化验了n个人,没有获得合格的AB型血,则再化验m个 找不到合格 AB型血的概率与已知的信息(即前n个人不是合格 的AB型血)无关,即并不因为已查了n个人不合格,而第n+1 人,…,n+m人是合格AB型血的概率会因此而变化。
X 0 1 2 ……r 5. 超几何分布 定义3-9 设1≤M≤N,1≤n≤N,若随机变量X的概率分布为 其中 , 则称随机变量X服从超几何分布 (hypergeometric distribution),记作X~H( M , N , n )。 容易验证超几何分布分布满足:
5. 超几何分布 定义3-9 设1≤M≤N,1≤n≤N,若随机变量X的概率分布为 X 0 1 2 ……r 其中 , 则称随机变量X服从超几何分布 (hypergeometric distribution),记作X~H( M , N , n )。 例如,有一批产品共N件,其中M件是次品。从中随机地 (不放回)抽取n件产品进行检验。以X表示抽取的n件产品中 次品的个数,则有 其中r=min{n,M},也即随机变量X是服从超几何分布的。 超几何分布产生于n次不放回抽样,因此它在抽样理论中 占有重要地位。超几何分布与二项分布有着密切的联系。
超几何分布产生于不放回抽样,而二项分布产生于有放回抽样。 在实际工作中,抽样一般都采用不放回方式,因此计算 时应该用超几何分布。但是,当N较大时,超几何分布计算 较繁琐。若产品总数N很大,而抽样的次数n相对于N很小时, 超几何分布可以用二项分布来近似,即有以下定理: 定理3-2 对于任意固定的n(≥1),当N充分大时,则有: 其中 。 定理3-2在直观上还是比较容易理解的。因为当产品总 数 N 很大而抽样的次数 n 相对于N很小时,可以认为不放回 抽样与有放回抽样的差别应该是很小的, 即超几何分布可以 用二项分布来近似。 在实际计算中,一般当n≤0.1 N 时,就可以运用以 上的近似公式。
第三章 习题 (P66) 6 , 7*,8 9*,10,11*,12,13*,14 (Binomial) 15*,16,17*,18 (Poisson) 19*,20,21*,22,23*