400 likes | 544 Views
第十二章 统计决策. 重点:了解统计决策的基本概念和类型,掌握统计决策的基本步骤,明确决策准则的确定方法,学会运用决策树进行决策。 难点:决策树及贝叶斯决策。 所需课时: 4 课时. 第十二章 统计决策. 重点:了解统计决策的基本概念和类型,掌握统计决策的基本步骤,明确决策准则的确定方法,学会运用决策树进行决策。 难点:决策树及贝叶斯决策。 所需课时: 4 课时. 本章主要内容. 第一节 统计决策的基本概念 第二节 完全不确定型决策 第三节 一般风险型决策 第四节 贝叶斯决策. 第一节 统计决策的基本概念.
E N D
第十二章 统计决策 重点:了解统计决策的基本概念和类型,掌握统计决策的基本步骤,明确决策准则的确定方法,学会运用决策树进行决策。 难点:决策树及贝叶斯决策。 所需课时:4课时
第十二章 统计决策 • 重点:了解统计决策的基本概念和类型,掌握统计决策的基本步骤,明确决策准则的确定方法,学会运用决策树进行决策。 • 难点:决策树及贝叶斯决策。 • 所需课时:4课时
本章主要内容 • 第一节 统计决策的基本概念 • 第二节 完全不确定型决策 • 第三节 一般风险型决策 • 第四节 贝叶斯决策
第一节 统计决策的基本概念 • 一、什么是统计决策 • 二、统计决策的种类 • 三、统计决策的基本步骤 • 四、收益矩阵表
一、什么是统计决策 • 狭义的统计决策方法是一种研究非对抗型和非确定型决策问题的科学的定量分析方法。 • 基本特点: • (1)研究的是非对抗性决策问题; • (2)研究的是不确定型决策问题; • (3)是一种定量决策。
二、统计决策的种类 • (一)按决策问题所处的条件分为确定型决策和不确定型决策 • (二)按决策过程是否运用到数学模型分为定性决策和定量决策 • (三)按决策目标的数量分为单目标决策和多目标决策 • (四)按决策整体构成分为单阶段决策和多阶段决策
三、统计决策的基本步骤 • (一)确定决策目标: 决策目标是在一定条件制约下,决策者希望达到的结果。反映决策目标的变量,称为目标变量。 • (二)拟定备选方案: 备选方案是决策者可以调控的因素,备选方案中所调控的变量称为行动变量。所有备选方案的集合称为行动空间。 • (三)列出自然状态:自然状态是指实施行动方案时,可能面临的客观条件。所有可能出现的状态的集合称为状态空间,而相应的各种状态可能出现的概率的集合称为状态空间的概率分布。 • (四)选择“最佳”或“满意”的方案 • (五)实施方案
四、矩阵收益表 • 收益矩阵表由自然状态、决策方案和收益值三个要素构成,是将各种备选方案在不同状态下的结果以及产生有关结果的可能性用矩阵的形式列示出来的表格。
第二节 完全不确定型决策 • 一、完全不确定型决策的准则 • 二、各种准则的特点和适用场合
一、完全不确定型决策的准则 • (一)最大的最大收益值准则 • 在决策时,先选出各种状态下每个方案的最大收益值,然后再从中选择最大者,并以其相对应的方案作为所要选择的方案。 • (二)最大的最小收益值准则 • 在决策时,先选出各种状态下每个方案的最小收益值,然后再从中选择最大者,并以其相对应的方案作为所要选择的方案。
【例12-2】 在例12-1中,试根据最大的最大收益值准则和最大的最小收益值准则进行决策。 • 解:(1)例12-1中,方案A1在各种状态下的最大收益为160万元,方案A2在各种状态下的最大收益为210万元,方案A3在各种状态下的最大收益为110,根据最大的最大收益值准则,应选择方案A2。 • (2)例12-1中,方案A1在各种状态下的最小收益为-36万元,方案A2在各种状态下的最小收益为-23万元,方案A3在各种状态下的最小收益为-15,根据最大的最小收益值准则,应选择方案A3。
(三)最小的最大后悔值准则 • 后悔值是由于决策失误而造成的最大可能的收益值与实际收益值之差。方案ai在状态θj下的后悔值,可按下式计算: • rij= max Q (ai,θj) -qij • 式中,max Q (ai,θj)是在第j 种状态下,正确决策有可能得到的最大收益,qij是收益矩阵的元素。显而易见,rij≥0 。 • 最小的最大后悔值准则主张:应在求出后悔矩阵的基础上,先选出各种状态下每个方案的最大后悔值,然后再从中选择最小者,并以其相对应的方案作为所要选择的方案。
【例12-3】 在例12-1中, 试求出后悔矩阵并根据最小的最大后悔值准则进行决策。 • 解:(1)首先由损益矩阵确定各种状态下的最大收益: • Max(P1)=-15 Max(P2)=98 Max(P1)=162 Max(P1)=210 • (2)用每列的最大收益值减去该状态下各种方案的收益值,即得到后悔值,如表12-3所示。 表12-3 开发新产品的后悔矩阵表 单位:万元 (3)从三个最大后悔值中选择最小,即为34,对应的方案A2即为最优方案。
(四)折衷准则 • 该准则主张根据经验和判断确定一个乐观系数α(0≤α≤1),以α和1-α分别作为最大收益值和最小收益值的权数,计算各方案的期望收益值E(Q(ai)) • E(Q(ai)) =α{ qij} +(1-α) {qij} • 并以期望收益值最大的方案作为所要选择的方案。 • 【例12-4】假设例12-1中,有关市场状态的概率不知,根据经验判断的乐观系数为0.6,试根据折衷准则进行决策。 • 解: 将有关数据代入(12.6)式,可得: • E(A1) = 0.6×160 +(1-0.6)(-36)=81.6 • E(A2) = 0.6×210 +(1-0.6)(-23)=116.8 • E(A3) = 0.6×110 +(1-0.6)×(-15)=60 • 因为在可选择的方案中, A2的期望收益值较大,所以根据折衷原则,应选择方案A2。
(五)等可能性准则 • 该准则假定各种状态可能出现的概率相同,在此基础上求各方案收益的期望值,并以期望收益值最大的方案作为所要选择的方案。 • 【例12-5】假设例12-1中,有关市场状态的概率不知,试根据等可能性准则进行决策。 • 解: 将有关数据代入(12.9)式,可得: • E(A1) =1/4(-36+98+131+160)=88.25 • E(A2) =1/4(-23+64+162+210)= 103.25 • E(A3) =1/4(-15+33+73+110)= 50.25 • 因为方案A2的期望收益值最大,所以按等可能性准则,应选择方案A2。
二、各种准则的特点和适用场合 • 最大的最大收益值准则一般只有在客观情况确实很乐观,或者即使决策失误,也完全可以承受损失的场合才采用。 • 最大的最小收益值准适用于对未来的状态非常没有把握,或者难以承受决策失误损失的场合。 • 最小的最大后悔值准则适用于不愿放过较大的获利机会,同时又对可能出现的损失有一定承受力的场合。 • 折衷准则和等可能性准则都是以各种方案的收益的期望值作为选择方案的标准。折衷准则事实上是假定未来可能发生的状态只有两种:即最理想状态和最不理想状态。前者发生的概率是α,后者发生的概率是(1-α)。当α=1时,该准则等价于乐观准则,而当α=0时,该准则等价于悲观准则。
第三节 一般风险型决策 • 一、自然状态概率分布的估计 • 二、风险型决策的准则 • 三、利用决策树进行风险型决策
一、自然状态概率分布的估计 • 客观概率是一般意义上的概率,通常是由自然状态的历史资料推算或按照随机实验的结果计算出来的。 • 主观概率是决策者基于自身的学识和经验作出的对某一事件发生可能性的主观判断。
二、风险型决策的准则 (一)最大可能准则 在最可能状态下,可实现最大收益值的方案为最佳方案。 最大可能准则是将风险条件下的决策问题,简化为确定条件下的决策问题。只有当最可能状态的发生概率明显大于其他状态时,应用该准则才能取得较好的效果。
【例12-6】 某企业在下一年拟生产某种产品,需要确定产品批量,根据预测估计,这种产品市场可能状况的概率:畅销为0.3,一般为0.5,滞销为0.2。产品生产采取大、中、小三种批量的生产方案,其有关数据如表12-5所示。按最大可能性准则方法,该企业应选择何种生产方案。 表12-5 产品批量生产损益矩阵表 单位:万元 解:从表12-5中可以看出,该产品市场可能状况为一般的概率P(一般)=0.5最大,在市场情况为一般的状态下,方案A2获得的收益最大,所以,根据最大可能性准则,选择方案A2。
(二)期望值准则 以各方案收益的期望值的大小为依据,来选择合适的方案。 E(Q(ai))= (i =1,2,---,m)
【例12-6】利用表12-5中的资料,按期望值准则方法,求该企业应选择何种生产方案。 • 解:由表12-5和期望值准则决策计算公式得 • 将各种市场状况综合考虑,方案A2的平均收益最高,即期望值最大,因此选择方案A2。
三、利用决策树进行风险型决策 • 决策树是一种将决策问题模型化的树形图。决策树由决策点、方案枝、机会点、概率枝和结果点组成。利用决策树对方案进行比较和选择,一般采用逆向分析法,即从树形结构的末端的条件结果开始,从后向前逐步分析。 • 决策树比较适用于求解复杂的多阶段决策问题。
剪枝 方案枝 决策点 概率枝 状态结点 决策点 结果点 决策树 • 图12-1 决策树结构图
(1)单阶段决策树法 • 单阶段决策树法的程序可分为:从左到右的建树过程和从右到左的计算过程两个阶段。 • 【例12-7】试利用例12-6中给出的某企业产品批量生产的收益矩阵表资料,根据决策树法选择最佳的生产方案。 • 解:根据表12-5中的资料,求得各种方案的期望值,如表12-6所示。 表12-5 产品不同批量生产方案期望值表 单位:万元
根据表中的有关数据和计算的期望值绘制的决策树图如图12-2所示。由决策树图可以看出,中批量生产A2的效益期望值最大(168万元)。所以,应该采取中批量生产A2这个行动方案。根据表中的有关数据和计算的期望值绘制的决策树图如图12-2所示。由决策树图可以看出,中批量生产A2的效益期望值最大(168万元)。所以,应该采取中批量生产A2这个行动方案。 图12-2 产品生产方案单阶段决策树图
(2)多阶段决策树法 某高新技术集团企业拟生产某种新产品,该企业有两个方案可供选择,方案一是建设大厂,需投资3200万元,建成后,若销路好,可得利润1200万元,若销路差,则亏损400万元;另一个方案是建设小厂,需投资2000万元,如销路好,每年可得利润600万元,销路差,每年可得利润500万元。两个工厂的使用期限都是10年。根据市场预测,这种产品在今后10年内销路好的概率是0.7,销路差的概率为0.3,该集团企业计划先建小厂,试销3年,若销路好再投资1000万元,加以扩建。扩建后可使用7年,后7年中每年盈利增至970万元,应如何决策。
解:这个问题属于多级决策问题,可以分为前三年和后7年两个阶段考虑各种情况下的损益值,相应的决策树如下图所示。解:这个问题属于多级决策问题,可以分为前三年和后7年两个阶段考虑各种情况下的损益值,相应的决策树如下图所示。 图12-3 产品生产方案多阶段决策树图
计算决策点2的期望值 • 在决策点2处有两个方案分枝,即③、④,一个是扩建,另一个是不扩建。由于这个决策点2是从状态点②中的“销路好”概率分枝延伸出来的,所以不论扩建也好,不扩建也好,它们的前提条件都是“销路好”,故状态点③、④的概率都是1.0。这时③、④状态点的期望值为: • 状态点③:1.0×970×7-1000=5790(万元) • 状态点④:1.00×600×7=4200(万元) • 比较点③与点④,可剪去点④,留下点③。即点③代表决策点2的期望值。
状态点②的期望值计算 • 前三年建小厂销路好时的期望值为0.7×600×3,后七年扩建后的期望值为0.7×5790,七年后若不扩建,销路差时的期望值为0.3×500×10。再考虑收回建小厂的投资,则 • 状态点②的期望值 • (0.7×600×3十0.7×5790十0.3×500×10)-2000 • =4813(万元) • 状态点①的期望值 • (0.7×1200×10十0.3×(-400)×10)-3200=4000(万元) • 对比点①与点②的期望值可以知道,应采取的决策是先建小厂,试销三年后,如果销路好时再扩建。
第四节 贝叶斯决策 • 一、什么是贝叶斯决策 • 二、贝叶斯公式与后验概率的估计 • 三、先验分析与后验分析 • 四、完全信息价值与补充信息价值 • 五、后验预分析
一、什么是贝叶斯决策 • 贝叶斯决策,是利用补充信息根据贝叶斯公式来估计后验概率,并在此基础上对备选方案进行评价的一种决策方法。 • 贝叶斯公式与后验概率的估计 • 设某种状态θj的先验概率为P(θj),通过调查获得的补充信息为ek ,θj给定时ek的条件概率为,则在给定信息ek的条件下,θj的条件概率即后验概率可用以下公式计算:
二、先验分析与后验分析 • 先验分析是利用先验概率进行决策,而后验分析是利用后验概率作为选择与判断合适方案的依据。一般来说,只要补充信息是准确的,则后验分析的结论更为可靠。 • 先验概率指根据历史资料或主观判断所确定的,没有经过试验证实的概率。 • 后验概率是指通过调查或其它方式获取新的附加信息,利用贝叶斯公式对先验概率进行修正,而后得到的概率。
三、完全信息价值与补充信息价值 • 完全信息,是指在对某一问题进行决策时,对于所有可能出现的状态都可以提供完全确切的情报。完全信息的价值,可以由掌握完全信息前后,所采取的不同行动方案的收益值的差额来表示。用收益值差额的期望值来综合反映完全信息的价值。
其计算公式如下: • 上式中,EVPI是完全信息价值的期望值,表示各方案在状态θj下的最大收益值,表示先验分析中的最佳方案在状态θj下的收益值。EVPI越大表明通过收集补充信息使决策效益提高的余地越大。同时,它也代表了为取得该项情报可付出的代价的上限。
补充信息ek的价值VAI的计算公式如下: • VAI(ek)= 先验EVPI- 后验EVPI(ek) • 上式中,先验EVPI是根据状态的先验概率计算的完全信息价值的期望值,后验EVPI(ek)是在了解补充信息ek后,利用根据该信息修正的后验概率计算的完全信息价值的期望值。
VAI(ek)的取值与ek有关。为了综合反映补充信息的价值,还需要计算补充信息价值的期望值VAI(ek)的取值与ek有关。为了综合反映补充信息的价值,还需要计算补充信息价值的期望值 • EVAI = E[VAI(ek)] • = • = E[VAI(ek)] • =
上式中,P(ek)是ek出现的概率。 • P(ek)= ; • EVAI是判断收集补充信息是否有利的标准。在收集补充信息之前,应将EVAI与收集补充信息的费用加以比较,只有当收集补充信息的费用小于EVAI时,平均来看,收集补充信息才有利可图。
四、后验预分析 • 在正式进行补充信息的调查之前,需要先估算完全信息价值的期望值和补充信息价值的期望值,将其与收集补充信息所需的费用和收益相对比,就是否值得进一步收集补充信息的问题作出判断,并选择最佳的收集补充信息的方案。这一环节被称为后验预分析。