1 / 98

第二章 随机变量及其分布

第二章 随机变量及其分布. §1 随机变量. 为了全面研究随机试验的结果 , 揭示随机现象的统计规律性 , 将随机试验的结果与实数对应起来 , 将随机试验的结果数量化 , 引入随机变量的概念 . 在随机试验完成时 , 人们常常不是关心试验结果本身 , 而是对于试验结果联系着的某个数感兴趣. 例 1 在一袋中装有编号分别为 1,2,3 的 3 只球 . 在袋中任取一只球 , 放回 . 再取一只球 , 记录它们的编号 . 计算两只球的号码之和. j. 5. 4. 6. 3.

haroun
Download Presentation

第二章 随机变量及其分布

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 第二章 随机变量及其分布

  2. §1 随机变量

  3. 为了全面研究随机试验的结果, 揭示随机现象的统计规律性, 将随机试验的结果与实数对应起来, 将随机试验的结果数量化, 引入随机变量的概念.在随机试验完成时, 人们常常不是关心试验结果本身, 而是对于试验结果联系着的某个数感兴趣.

  4. 例1 在一袋中装有编号分别为1,2,3的3只球. 在袋中任取一只球, 放回. 再取一只球, 记录它们的编号. 计算两只球的号码之和. j 5 4 6 3 试验的样本空间S={e}={i,j},i,j=1,2,3. 这里i,j分别表示第一,二球的号码. 以X记两球号码之和, 对于每一个样本点e, X都有一个值与之对应, 如图所示. 3 4 5 2 2 3 4 1 1 2 3 i

  5. 例2 将一枚硬币抛掷3次. 关心3次抛掷中, 出现H的总次数, 而对H,T出现的顺序不关心. 比如说, 我们仅关心出现H的总次数为2, 而不在乎出现的是"HHT","HTH"还是"THH". 以X记三次抛掷中出现H的总数, 则对样本空间S={e}中的每一个样本点e, X都有一个值与之对应, 即有

  6. 定义设随机试验的样本空间为S={e}. X=X(e)是定义在样本空间S上的实值单值函数. 称X=X(e)为随机变量. e1 e2 x e3 S

  7. 有许多随机试验, 它的结果本身是一个数, 即样本点e本身是一个数. 我们令X=X(e)=e, 则X就是一个随机变量. 例如, 用Y记某车间一天的缺勤人数, 以W记录某地区第一季度的降雨量, 以Z记某工厂一天的耗电量, 以N记某医院某一天的挂号人数. 那么Y, W, Z, N都是随机变量.本书中, 一般以大写字母如X,Y,Z,W,...表示随机变量, 而以小写字母x,y,z,w,...表示实数.

  8. 随机变量的取值随试验结果而定, 而试验的各个结果出现有一定的概率, 因而随机变量的取值有一定的概率. 例如, 在例2中X取值为2, 记成{X=2}, 对应于样本点的集合A={HHT, HTH, THH}, 这是一个事件, 当且仅当事件A发生时有{X=2}. 则称P(A)=P{HHT, HTH, THH}为{X=2}的概率, 即P(X=2)=P(A)=3/8. 类似地有

  9. 一般, 若L是一个实数集合, 将X在L上取值写成{XL}. 它表示事件B={e|X(e)L}, 即B是由S中使得X(e)L的所有样本点e所组成的事件. 此时有P{XL}=P(B)=P{e|X(e)L},随机变量的取值随试验的结果而定, 在试验之前不能预知它取什么值, 且它的取值有一定的概率. 这些性质显示了随机变量与普通函数有着本质的差异.

  10. §2 离散型随机变量及其分布律

  11. 有些随机变量, 它全部可能取到的不相同的值是有限个或可列无限多个, 这种随机变量称为离散型随机变量. 例如§1例2中的随机变量X, 它只可能取0,1,2,3四个值, 它是一个离散型随机变量. 又如某城市的120急救电话台一昼夜收到的呼唤次数也是离散型随机变量. 若以T记某元件的寿命, 它所可能取的值充满一个区间, 是无法按一定次序一一列举出来的, 因而它是一个非离散型的随机变量. 本节讨论离散型随机变量

  12. 要掌握一个离散型随机变量X的统计规律, 必须且只需知道X的所有可能取的值及取每一个可能值的概率.设X所有可能取的值为xk(k=1,2,...), 而P{X=xk}=pk, k=1,2,.... (2.1)由概率的定义, pk满足如下两个条件

  13. 称(2.1)式为离散型随机变量X的分布律. 分布律也可用表格的形式来表示: (2.4)

  14. 例1 设一汽车在开往目的地的道路上需经过四组信号灯, 每组信号灯以1/2概率允许或禁止汽车通过. 以X表示汽车首次停下时, 它已通过的信号灯组数(设各组信号灯的工作是相互独立的), 求X的分布律.解 以p表示每组信号灯禁止汽车通过的概率, 易知X的分布律为

  15. P={X=k}=(1-p)kp, k=0,1,2,3, P{X=4}=(1-p)4. 以p=1/2代入得 下面介绍三种重要的离散型随机变量.

  16. (一) (0-1)分布设随机变量X只可能取0与1两个值, 它的分布律是P(X=k)=pk(1-p)1-k, k=0,1 (0<p<1),则称X服从(0-1)分布或两点分布.(0-1)分布的分布律也可写成

  17. 对一个随机试验中的任何一个给定的事件A, 0<P(A)<1, 都可以根据事件A定义一个服从0-1分布的随机变量 来描述. 例如, 对新生婴儿的性别进行登记, 检查产品的质量是否合格, 某车间的电力消耗是否超过负荷以及前面多次讨论过的"抛硬币"试验等都可以用(0-1)分布的随机变量来描述. (0-1)分布是经常遇到的一种分布.

  18. 定义随机变量X表示n重伯努利试验中事件A发生的次数, 我们来求它的分布律. X所有可能取的值为0,1,2,...,n. 由于各次试验是相互独立的, 因此事件A在指定的k(0kn)次试验中发生, 在其它n-k次试验中A不发生的概率为

  19. 记q=1-p, 即有 n,p的二项分布, 记为X~b(n,p).

  20. 例2按规定, 某种型号电子元件的使用寿命超过1500小时的为一级品. 已知一大批产品的一级品率为0.2, 现在从中随机地抽查20只. 问20只元件中恰有k只(k=0,1,...,20)为一级品的概率是多少?解 这是不放回抽样. 但由于这批元件的总数很大, 且抽查的元件数量相对于元件的总数来说又很小, 因而可以当作放回抽样来处理, 这样做会有一些误差, 但误差不大. 检查一只元件看它是否为一级品, 检查20只元件相当于20重贝努利试验, 以X记其中一级品总数, 则

  21. X~b(20,0.2). 由(2.6)式即得所求概率为 将计算结果列表如下:

  22. 计算结果的图形:

  23. 例3某人进行射击, 设每次射击命中率为0.02, 独立射击400次, 试求至少击中两次的概率.解 将一次射击看成是一次试验. 设击中的次数为X, 则X~b(400,0.02). X的分布律为 P{X2}=1-P{X=0}-P{X=1} =1-(0.98)400-400(0.02)(0.98)399 =0.9972.

  24. 例4设有80台同类型设备, 各台工作是相互独立的, 发生故障的概率都是0.01, 且一台设备的故障能由一个人处理, 考虑两种配备维修工人的方法, 其一是由4人维护, 每人负责20台; 其二是由3人共同维护80台. 试比较这两种方法在设备发生故障时不能及时维修的概率的大小.解 按第一种方法, 以X记"第1人维护的20台中同一时刻发生故障的台数", 以Ai(i=1,2,3,4)表示事件"第i人维护的30台中发生故障不能及时维修".

  25. 则知80台中发生故障而不能及时维修的概率为P(A1A2A3A4)P(A1)=P(X2).而X~b(20,0.01), 故有 即有P(A1A2A3A4)0.0169.

  26. 按第二种方法, 以Y记80台中同一时刻发生故障的台数. 此时, Y~b(80,0.01), 故80台中发生故障而不能及时维修的概率为 可以看出, 在后一种情况下尽管任务重了(每人平均维护约27台), 但工作效率不仅没有降低, 反而提高了.

  27. (三)泊松分布设随机变量X所有可能取的值为0,1,2,..., 而取各个值的概率为 其中l>0是常数. 则称X服从参数为l的泊松分布, 记为X~p(l). 易知, P(X=k)0, k=0,1,2,...,且有

  28. §3 随机变量的分布函数

  29. 对于非离散型随机变量X, 由于其可能取的值不能一个一个地列举出来, 因而就不能像离散型随机变量那样可以用分布律来描述它. 另外, 通常所遇到的非离散型随机变量取任一指定的实数值的概率都等于0. 再者, 在实际中, 对于这样的随机变量, 例如误差e, 元件的寿命T等, 我们并不会对误差e=0.05(mm), 寿命T=1251.3(h)的概率感兴趣, 而是考虑误差落在某个区间的概率, 寿命T大于某个数的概率. 因而我们转而去研究随机变量所取的值落在一个区间的概率, P{x1<Xx2}.

  30. 由于P{x1<Xx2}=P{xx2}-P{xx1}.所以我们只需知道P{xx2}和P{xx1}就可以了. 由此引出分布函数的概念.定义设X是一个随机变量, x是任意实数. 函数F(x)= P{xx}称为X的分布函数.对于任意实数x1,x2(x1<x2), 有P{x1<Xx2}=P{xx2}-P{xx1} =F(x2)-F(x1), (3.1)称为X的分布函数.

  31. 分布函数是一个普通的函数, 正是通过它, 我们能用数学分析的方法来研究随机变量. 如果将X看成是数轴上的随机点的坐标, 则分布函数F(x)在x处的函数值就表示X落在区间(-, x]上的概率.分布函数F(x)具有以下的基本性质: 1. F(x)是一个不减函数.事实上, 由(3.1)式对于任意实数x1,x2(x1<x2)有F(x2)-F(x1)=P{x1<Xx2}0.

  32. x O X 2, 0F(x)1, 且 • 如图, 将区间端点x沿数轴无限向左移动(即x-, 则"随机点X落在x左边"这一事件趋于不可能事件, 从而其概率趋于0, 即有F(-)=0;又若将点x无限右移, (即x), 则"随机点X落在x左边"这一事件趋于必然事件, 从而其概率趋于1, 即有F()=1. • 3 F(x+0)=F(x), 即F(x)是右连续的(证略).

  33. 例1设随机变量X的分布律为 解X仅在x=-1,2,3三点处其概率0, 而F(x)的值是Xx的累积概率值, 由概率的有限可加性, 知它即为小于或等于x的那些xk处的概率pk之和.

  34. 由此得

  35. F(x)的图形为 F(x) 1 x -1 1 2 3 O

  36. 一般, 设离散型随机变量X的分布律为P{X=xk}=pk, k=1,2,....由概率的可列可加性得X的分布函数为 这里和式是对于所有满足xkx的k求和的. 分布函数F(x)在x=xk(k=1,2,...)处有跳跃, 其跳跃值为pk=P{X=xk}.

  37. 例2一个靶子是半径为2米的圆盘, 设击中靶上任一同心圆盘上的点的概率与该圆盘的面积成正比, 并设射击都能中靶, 以X表示弹着点与圆心的距离. 试求随机变量X的分布函数.解 若x<0, 则{Xx}是不可能事件, 于是F(x)=P{Xx}=0.若0x2, 由题意, P{0Xx}=kx2, k是某一常数, 为了确定k的值, 取x=2, 有P{0X2}=22k. 但已知P{0X2}=1, 故得k=1/4, 即

  38. 于是 若x2, 由题意{Xx}是必然事件, 于是 F(x)=P{Xx}=1. 综上所述, 即得X的分布函数为

  39. F(x) 1 1/2 O 3 x 1 2 它的图形是一条连续曲线如图所示

  40. 另外, 容易看到本例中的分布函数F(x)对于任意x可以写成形式 其中 这就是说, F(x)是非负函数f(t)在区间(-,x)上的 积分, 在这种情况下我们称X为连续型随机变量.

  41. F(x) 1 1/2 O 3 x 1 2 对照f(x)和F(x): f(x) 1 1/2 O 3 x 1 2

  42. §4 连续型随机变量及其概率密度

  43. 如果对于随机变量X的分布函数F(x), 存在非负函数f(x), 使对于任意实数x有 • 则称X为连续型随机变量, 其中函数f(x)称为X的概率密度函数, 简称概率密度. • 连续型随机变量的分布函数是连续函数. 在实际应用中遇到的基本上是离散型或连续型 随机变量. 本课程只讨论这两种随机变量.

  44. 由定义知道, 概率密度f(x)具有以下性质:

  45. 由性质2知道介于曲线y=f(x)与Ox轴之间的面积等于1. 由性质3知道X落在区间(x1,x2]的概率P{x1<Xx2}等于区间(x1,x2]上的曲线y=f(x)之下的曲边梯形面积. f(x) f(x) 1 1 x1 x2 O x O x

  46. 由性质4在f(x)的连续点x处有 看出概率密度的定义与物理学中的线密度的定 义相类似, 这就是为什么称f(x)为概率密度的原 因. 由(4.2)式知道, 若不计高阶无穷小, 有 P(x < X  x+Dx)f(x)Dx. (4.3)

  47. 例1设随机变量X具有概率密度

  48. f(x) 1/2 kx O x 3 4 解 f(x)的曲线形状如图所示

More Related