980 likes | 1.15k Views
第二章 随机变量及其分布. §1 随机变量. 为了全面研究随机试验的结果 , 揭示随机现象的统计规律性 , 将随机试验的结果与实数对应起来 , 将随机试验的结果数量化 , 引入随机变量的概念 . 在随机试验完成时 , 人们常常不是关心试验结果本身 , 而是对于试验结果联系着的某个数感兴趣. 例 1 在一袋中装有编号分别为 1,2,3 的 3 只球 . 在袋中任取一只球 , 放回 . 再取一只球 , 记录它们的编号 . 计算两只球的号码之和. j. 5. 4. 6. 3.
E N D
为了全面研究随机试验的结果, 揭示随机现象的统计规律性, 将随机试验的结果与实数对应起来, 将随机试验的结果数量化, 引入随机变量的概念.在随机试验完成时, 人们常常不是关心试验结果本身, 而是对于试验结果联系着的某个数感兴趣.
例1 在一袋中装有编号分别为1,2,3的3只球. 在袋中任取一只球, 放回. 再取一只球, 记录它们的编号. 计算两只球的号码之和. j 5 4 6 3 试验的样本空间S={e}={i,j},i,j=1,2,3. 这里i,j分别表示第一,二球的号码. 以X记两球号码之和, 对于每一个样本点e, X都有一个值与之对应, 如图所示. 3 4 5 2 2 3 4 1 1 2 3 i
例2 将一枚硬币抛掷3次. 关心3次抛掷中, 出现H的总次数, 而对H,T出现的顺序不关心. 比如说, 我们仅关心出现H的总次数为2, 而不在乎出现的是"HHT","HTH"还是"THH". 以X记三次抛掷中出现H的总数, 则对样本空间S={e}中的每一个样本点e, X都有一个值与之对应, 即有
定义设随机试验的样本空间为S={e}. X=X(e)是定义在样本空间S上的实值单值函数. 称X=X(e)为随机变量. e1 e2 x e3 S
有许多随机试验, 它的结果本身是一个数, 即样本点e本身是一个数. 我们令X=X(e)=e, 则X就是一个随机变量. 例如, 用Y记某车间一天的缺勤人数, 以W记录某地区第一季度的降雨量, 以Z记某工厂一天的耗电量, 以N记某医院某一天的挂号人数. 那么Y, W, Z, N都是随机变量.本书中, 一般以大写字母如X,Y,Z,W,...表示随机变量, 而以小写字母x,y,z,w,...表示实数.
随机变量的取值随试验结果而定, 而试验的各个结果出现有一定的概率, 因而随机变量的取值有一定的概率. 例如, 在例2中X取值为2, 记成{X=2}, 对应于样本点的集合A={HHT, HTH, THH}, 这是一个事件, 当且仅当事件A发生时有{X=2}. 则称P(A)=P{HHT, HTH, THH}为{X=2}的概率, 即P(X=2)=P(A)=3/8. 类似地有
一般, 若L是一个实数集合, 将X在L上取值写成{XL}. 它表示事件B={e|X(e)L}, 即B是由S中使得X(e)L的所有样本点e所组成的事件. 此时有P{XL}=P(B)=P{e|X(e)L},随机变量的取值随试验的结果而定, 在试验之前不能预知它取什么值, 且它的取值有一定的概率. 这些性质显示了随机变量与普通函数有着本质的差异.
有些随机变量, 它全部可能取到的不相同的值是有限个或可列无限多个, 这种随机变量称为离散型随机变量. 例如§1例2中的随机变量X, 它只可能取0,1,2,3四个值, 它是一个离散型随机变量. 又如某城市的120急救电话台一昼夜收到的呼唤次数也是离散型随机变量. 若以T记某元件的寿命, 它所可能取的值充满一个区间, 是无法按一定次序一一列举出来的, 因而它是一个非离散型的随机变量. 本节讨论离散型随机变量
要掌握一个离散型随机变量X的统计规律, 必须且只需知道X的所有可能取的值及取每一个可能值的概率.设X所有可能取的值为xk(k=1,2,...), 而P{X=xk}=pk, k=1,2,.... (2.1)由概率的定义, pk满足如下两个条件
称(2.1)式为离散型随机变量X的分布律. 分布律也可用表格的形式来表示: (2.4)
例1 设一汽车在开往目的地的道路上需经过四组信号灯, 每组信号灯以1/2概率允许或禁止汽车通过. 以X表示汽车首次停下时, 它已通过的信号灯组数(设各组信号灯的工作是相互独立的), 求X的分布律.解 以p表示每组信号灯禁止汽车通过的概率, 易知X的分布律为
P={X=k}=(1-p)kp, k=0,1,2,3, P{X=4}=(1-p)4. 以p=1/2代入得 下面介绍三种重要的离散型随机变量.
(一) (0-1)分布设随机变量X只可能取0与1两个值, 它的分布律是P(X=k)=pk(1-p)1-k, k=0,1 (0<p<1),则称X服从(0-1)分布或两点分布.(0-1)分布的分布律也可写成
对一个随机试验中的任何一个给定的事件A, 0<P(A)<1, 都可以根据事件A定义一个服从0-1分布的随机变量 来描述. 例如, 对新生婴儿的性别进行登记, 检查产品的质量是否合格, 某车间的电力消耗是否超过负荷以及前面多次讨论过的"抛硬币"试验等都可以用(0-1)分布的随机变量来描述. (0-1)分布是经常遇到的一种分布.
定义随机变量X表示n重伯努利试验中事件A发生的次数, 我们来求它的分布律. X所有可能取的值为0,1,2,...,n. 由于各次试验是相互独立的, 因此事件A在指定的k(0kn)次试验中发生, 在其它n-k次试验中A不发生的概率为
记q=1-p, 即有 n,p的二项分布, 记为X~b(n,p).
例2按规定, 某种型号电子元件的使用寿命超过1500小时的为一级品. 已知一大批产品的一级品率为0.2, 现在从中随机地抽查20只. 问20只元件中恰有k只(k=0,1,...,20)为一级品的概率是多少?解 这是不放回抽样. 但由于这批元件的总数很大, 且抽查的元件数量相对于元件的总数来说又很小, 因而可以当作放回抽样来处理, 这样做会有一些误差, 但误差不大. 检查一只元件看它是否为一级品, 检查20只元件相当于20重贝努利试验, 以X记其中一级品总数, 则
X~b(20,0.2). 由(2.6)式即得所求概率为 将计算结果列表如下:
例3某人进行射击, 设每次射击命中率为0.02, 独立射击400次, 试求至少击中两次的概率.解 将一次射击看成是一次试验. 设击中的次数为X, 则X~b(400,0.02). X的分布律为 P{X2}=1-P{X=0}-P{X=1} =1-(0.98)400-400(0.02)(0.98)399 =0.9972.
例4设有80台同类型设备, 各台工作是相互独立的, 发生故障的概率都是0.01, 且一台设备的故障能由一个人处理, 考虑两种配备维修工人的方法, 其一是由4人维护, 每人负责20台; 其二是由3人共同维护80台. 试比较这两种方法在设备发生故障时不能及时维修的概率的大小.解 按第一种方法, 以X记"第1人维护的20台中同一时刻发生故障的台数", 以Ai(i=1,2,3,4)表示事件"第i人维护的30台中发生故障不能及时维修".
则知80台中发生故障而不能及时维修的概率为P(A1A2A3A4)P(A1)=P(X2).而X~b(20,0.01), 故有 即有P(A1A2A3A4)0.0169.
按第二种方法, 以Y记80台中同一时刻发生故障的台数. 此时, Y~b(80,0.01), 故80台中发生故障而不能及时维修的概率为 可以看出, 在后一种情况下尽管任务重了(每人平均维护约27台), 但工作效率不仅没有降低, 反而提高了.
(三)泊松分布设随机变量X所有可能取的值为0,1,2,..., 而取各个值的概率为 其中l>0是常数. 则称X服从参数为l的泊松分布, 记为X~p(l). 易知, P(X=k)0, k=0,1,2,...,且有
对于非离散型随机变量X, 由于其可能取的值不能一个一个地列举出来, 因而就不能像离散型随机变量那样可以用分布律来描述它. 另外, 通常所遇到的非离散型随机变量取任一指定的实数值的概率都等于0. 再者, 在实际中, 对于这样的随机变量, 例如误差e, 元件的寿命T等, 我们并不会对误差e=0.05(mm), 寿命T=1251.3(h)的概率感兴趣, 而是考虑误差落在某个区间的概率, 寿命T大于某个数的概率. 因而我们转而去研究随机变量所取的值落在一个区间的概率, P{x1<Xx2}.
由于P{x1<Xx2}=P{xx2}-P{xx1}.所以我们只需知道P{xx2}和P{xx1}就可以了. 由此引出分布函数的概念.定义设X是一个随机变量, x是任意实数. 函数F(x)= P{xx}称为X的分布函数.对于任意实数x1,x2(x1<x2), 有P{x1<Xx2}=P{xx2}-P{xx1} =F(x2)-F(x1), (3.1)称为X的分布函数.
分布函数是一个普通的函数, 正是通过它, 我们能用数学分析的方法来研究随机变量. 如果将X看成是数轴上的随机点的坐标, 则分布函数F(x)在x处的函数值就表示X落在区间(-, x]上的概率.分布函数F(x)具有以下的基本性质: 1. F(x)是一个不减函数.事实上, 由(3.1)式对于任意实数x1,x2(x1<x2)有F(x2)-F(x1)=P{x1<Xx2}0.
x O X 2, 0F(x)1, 且 • 如图, 将区间端点x沿数轴无限向左移动(即x-, 则"随机点X落在x左边"这一事件趋于不可能事件, 从而其概率趋于0, 即有F(-)=0;又若将点x无限右移, (即x), 则"随机点X落在x左边"这一事件趋于必然事件, 从而其概率趋于1, 即有F()=1. • 3 F(x+0)=F(x), 即F(x)是右连续的(证略).
例1设随机变量X的分布律为 解X仅在x=-1,2,3三点处其概率0, 而F(x)的值是Xx的累积概率值, 由概率的有限可加性, 知它即为小于或等于x的那些xk处的概率pk之和.
F(x)的图形为 F(x) 1 x -1 1 2 3 O
一般, 设离散型随机变量X的分布律为P{X=xk}=pk, k=1,2,....由概率的可列可加性得X的分布函数为 这里和式是对于所有满足xkx的k求和的. 分布函数F(x)在x=xk(k=1,2,...)处有跳跃, 其跳跃值为pk=P{X=xk}.
例2一个靶子是半径为2米的圆盘, 设击中靶上任一同心圆盘上的点的概率与该圆盘的面积成正比, 并设射击都能中靶, 以X表示弹着点与圆心的距离. 试求随机变量X的分布函数.解 若x<0, 则{Xx}是不可能事件, 于是F(x)=P{Xx}=0.若0x2, 由题意, P{0Xx}=kx2, k是某一常数, 为了确定k的值, 取x=2, 有P{0X2}=22k. 但已知P{0X2}=1, 故得k=1/4, 即
于是 若x2, 由题意{Xx}是必然事件, 于是 F(x)=P{Xx}=1. 综上所述, 即得X的分布函数为
F(x) 1 1/2 O 3 x 1 2 它的图形是一条连续曲线如图所示
另外, 容易看到本例中的分布函数F(x)对于任意x可以写成形式 其中 这就是说, F(x)是非负函数f(t)在区间(-,x)上的 积分, 在这种情况下我们称X为连续型随机变量.
F(x) 1 1/2 O 3 x 1 2 对照f(x)和F(x): f(x) 1 1/2 O 3 x 1 2
如果对于随机变量X的分布函数F(x), 存在非负函数f(x), 使对于任意实数x有 • 则称X为连续型随机变量, 其中函数f(x)称为X的概率密度函数, 简称概率密度. • 连续型随机变量的分布函数是连续函数. 在实际应用中遇到的基本上是离散型或连续型 随机变量. 本课程只讨论这两种随机变量.
由性质2知道介于曲线y=f(x)与Ox轴之间的面积等于1. 由性质3知道X落在区间(x1,x2]的概率P{x1<Xx2}等于区间(x1,x2]上的曲线y=f(x)之下的曲边梯形面积. f(x) f(x) 1 1 x1 x2 O x O x
由性质4在f(x)的连续点x处有 看出概率密度的定义与物理学中的线密度的定 义相类似, 这就是为什么称f(x)为概率密度的原 因. 由(4.2)式知道, 若不计高阶无穷小, 有 P(x < X x+Dx)f(x)Dx. (4.3)
f(x) 1/2 kx O x 3 4 解 f(x)的曲线形状如图所示