510 likes | 776 Views
Data, Model and Decisions 数据、模型与决策. 第3章 随机变量和概率分布. Session Topics. Basic Probability Concepts 基本概率概念 Discrete Random Variable 离散随机变量 Continuous Random Variable 连续随机变量. Sample Spaces 样本空间. 收集所有可能出现的结果 : 例如 6 个摔子都出现 1 点 今天老师备课笔记丢了. 随机事件. (一)随机试验与事件
E N D
Data, Model and Decisions 数据、模型与决策 第3章 随机变量和概率分布
Session Topics • Basic Probability Concepts 基本概率概念 • Discrete Random Variable 离散随机变量 • Continuous Random Variable 连续随机变量
Sample Spaces 样本空间 • 收集所有可能出现的结果 : • 例如 6个摔子都出现1点 • 今天老师备课笔记丢了
随机事件 • (一)随机试验与事件 • 随机现象的特点是:在条件不变的情况下,一系列的试验或观测会得到不同的结果,并且在试验或观测前不能预见何种结果将出现。对随机现象的试验或观测称为随机试验,它必须满足以下的性质: • (1)每次试验的可能结果不是唯一的; • (2)每次试验之前不能确定何种结果会出现; • (3)试验可在相同条件下重复进行。
随机事件 • 在随机试验中,可能出现也可能不出现的结果,称之为随机事件,简称事件。试验的结果可能是一个简单事件,也可能是一个复杂事件。简单事件就是不可以再分解的事件,又称为基本事件。复杂事件是由简单事件组合而成的事件。基本事件还可称为样本点,设试验有n个基本事件,分别记为 (i=1,2,…,n)。集合Ω={ω1 ,ω2 , … ,ωn}称为样本空间,Ω中的元素就是样本点。
Events 事件 • 简单事件(Simple event): 从样本空间出现的结果只有一个特征 例如:从一副牌中抽出的是一张红桃 • 联合或混合事件(Joint/Compound event): 涉及同时出现两个或以上特征 例如:从一副牌中抽出的是一张红桃 这是一张红桃Ace
Ace Not Ace Total Black 2 24 26 Red 2 24 26 Total 4 48 52 Visualizing Events 事件形象化 • 关联表 • 树图
Special Events 特殊事件 • 空事件(Null Event) • 非事件、补事件(Complement of Event) • 独立与非独立事件 (Dependent or Independent Events)
一副52张的牌 Red Ace Not an Ace Total Ace Red 2 24 26 Black 2 24 26 Total 4 48 52 样本空间 Contingency Table 关联表
Ace 事件可能性 Red Cards Not an Ace 所有牌 Ace Black Cards Not an Ace Tree Diagram 树形图
(二)概率 • 1. 概率的定义 • 概率就是指随机事件发生的可能性,或称为机率,是对随机事件发生可能性的度量。 进行n次重复试验,随机事件A发生的次数是m次,发生的频率是m/n,当试验的次数n很大时,如果频率在某一数值p附近摆动,而且随着试验次数n的不断增加,频率的摆动幅度越来越小,则称p为事件A发生的概率,记为:P(A)=p。在古典概型场合, 即基本事件发生的概率都一样的场合:
2. 概率的基本性质 • 性质1 1≥P(A)≥0。 • 性质2 P(Ω)=1。 • 性质3 若事件A与事件B互不相容,即AB=Ф,则P(A∪B)=P(A)+P(B)。 • 推论1 不可能事件的概率为0,即:P(Ф)=0。 • 推论2 P( )=1-P(A), 表示A的对立事件,即它们二者必有一事件发生但又不能同时发生。
3. 事件的独立性 • 定义 对事件A与B,若p(AB)=p(B)p(A),则称它们是统计独立的,简称相互独立。 • 例:已知袋中有6只红球, 4只白球。从袋中有放回地取两次球,每次都取1球。设 表示第i次取到红球。那么, • 因此, ,也就是说,B1,B2相互独立。从题目条件看,这一结论是显然的。
Computing Joint Probability 计算联合概率 A 和 B 事件的联合概率为: P(A and B) = A 和 B 事件联合出现的结果个数 样本空间的总个数 例如. P(Red Card 和 Ace) =
Computing Compound Probability 计算混合概率 A、B的混合事件(A or B): 例如:P(Red Card or Ace)
事件 Total B1 B2 事件 A1 P(A1 and B1) P(A1 and B2) P(A1) P(A2 and B1) P(A2 and B2) A2 P(A2) 1 Total P(B1) P(B2) Compound Probability Addition Rule 混合概率规则 P(A1 or B1 ) = P(A1) +P(B1) - P(A1 and B1) 对于互斥事件: P(A or B) = P(A) + P(B)
Computing Conditional Probability 计算条件概率 条件概率是指一个事件给定下另一事件发生的可能性: 给定事件 B 发生,事件 A 发生的概率 P(A ê B) = 例如: P(Red Card 给定是一张 Ace) =
Discrete Random Variable 离散随机变量 • 随机变量:是一次试验的结果的数值性描述 • 离散随机变量: • 指有限个数值或一系列无穷个数值的随机变量
T T T T Discrete Random Variable Example 离散随机变量例 事件: 抛2个硬币.数是正面的个数 值概率 01/4 = .25 12/4 = .50 21/4 = .25
Discrete Probability Distribution 离散概率分布 • 列出所有可能的 [ Xi, f (Xi) ] • Xi = 随机变量的值 (结果) • P(Xi) = 取这个值的概率 • 相互排斥 (没有重叠) • 穷举性 (没有漏下) • 0 f(xi) 1 • f(xi) = 1
Discrete Random Variable Measures 离散随机变量的度量 数学期望(Expected Value) 或平均值度量随机变量的中心位置 E (x ) = = xf (x ) 方差(Variance) 随机变量的取值离均值的变异程度 Var(x ) = 2 = (x - )2f (x )
Important Discrete Probability Distribution 重要的离散概率分布 离散概率分布 Binomial 二项分布 Poisson 泊松分布
贝努里试验 • 有时我们只对试验中某事件A是否出现感兴趣,如果A发生,我们称“成功”,否则称“失败”。像这样只有两种结果的试验称为贝努里试验。设A出现的概率为p,我们独立地重复进行n次贝努里试验,称为n重贝努里试验.
Binomial Probability Distributions 二项分布 • 二项试验的性质 • 试验由一个包括 n次相同的试验的序列组成. • 每次试验有两个结果, 成功和失败. • 成功的概率为 p, 每次试验都相同. • 试验都是独立的.
Binomial Probability Distributions 二项分布 二项分布函数 其中 f (x ) = n次试验中成功 x次的概率 n = 试验次数 p = 每次试验中成功的概率
EXCEL函数 • BINOMDIST(number_s, trials, probability_s, cumulative)
Poisson Distribution 泊松分布 • 泊松试验的性质: • 任意两个相等长度的区间发生一次的概率相等. • 任意区间发生或不发生与其他区间发生与否独立.
Poisson Probability Distribution Function 泊松概率分布函数 泊松概率分布函数: 其中 f (x )= 在一个区间发生 x 次的概率 = 在一个区间发生次数的数学期望 e = 2.71828
Excel 函数 • POISSON (x, mean, cumulative)
f(X) X m The Normal Distribution 正态分布 • 钟形 • 对称 • 均值,中位数,众数相等 • 随机变量无限取值
The Mathematical Model 数学模型 f(X) = 随机变量X的分布密度函数 p = 3.14159; e = 2.71828 s = 总体标准方差 X = 随机变量取值 (-∞< X < +∞) m = 总体均值
Many Normal Distributions 许多正态分布 变动参数 s和 m, 我们得到许多不同的正态分布
.0478 .02 Z .00 .01 .0000 0.0 .0040 .0080 .0398 .0438 .0478 0.1 0.2 .0793 .0832 .0871 Z = 0.12 0.3 .0179 .0217 .0255 Probabilities The Standardized Normal Distribution 标准正态分布 标准正态分布表 m = 0 and s = 1
标准正态分布 正态分布 = 10 s s = 1 Z m 6.2 = 5 m = 0 .12 Z X Standardizing Example 标准化例
正态分布 标准正态分布 s = 10 s = 1 .1664 .0832 .0832 Z 2.9 5 7.1 X -.21 0 .21 Example:P(2.9 < X < 7.1) = .1664 举例计算P(2.9 < X < 7.1)
标准正态分布表 .01 s = 1 Z .00 0.2 .1217 0.0 .0040 .0000 .0080 0.1 .0398 .0438 .0478 0.2 .0793 .0832 .0871 m = 0 .31 Z .1179 .1255 .1217 0.3 Finding Z Values for Known Probabilities 已知概率找Z值
正态分布 标准正态分布 s = 10 s = 1 .1217 .1217 ? m = 0 .31 Z m = 5 X X 8.1 = m + Zs = 5 + (0.31)(10) = Finding X Values for Known Probabilities 已知概率找X值
EXCEL的正态分布函数 • 1.正态分布函数 • 2.绘制正态分布图形
1.正态分布函数 • (1)正态分布函数。 • (2)标准正态分布函数。 • (3)正态分布函数的反函数。 • (4)标准正态分布函数的反函数。
2.绘制正态分布图形 • (1)建立正态分布基本数据。 • (2)绘制正态分布图形。
数据填充 编辑/填充/序列 “序列”对话框
正态分布图绘制结果 返回本节
-lx l = 0.5 P ( arrival time < X 1 - e ) = f(X) l = 2.0 X Exponential Distributions 指数分布 e = 2.71828 l = 到达的均值 X = 连续随机变量
The Uniform Probability Distribution 均匀分布 • 随机变量在一个区间内均匀分布,对应的概率与区间的长度成正比例 • 均匀分别密度函数 f (x) = 1/(b - a) for a<x<b = 0 elsewhere • 数学期望 E(x) = (a + b)/2 • 方差Var(x) = (b - a)2/12