580 likes | 753 Views
决 策 论. (Decision Making Theory). 2011 年秋季 机械与运载工程学院. 本讲内容. 基本概念 不确定型决策 风险决策. 决策科学是在研究决策活动基本规律的基础上,总结出一套进行决策必须遵循的原则、规则、程序、方法和技术。 研究决策的问题包括:决策的基本原理、决策的程序、决策的信息、决策的方法(定量与定性的方法)、决策的风险、决策中的人因素、决策的思维方式、决策的组织、决策的实施等。 涉及社会学、决策心理学、决策行为学、决策的量化方法和评价、决策支持系统和决策自动化等多学科和多领域的综合应用。. 基 本 概 念. 决策要素.
E N D
决 策 论 (Decision Making Theory) 2011年秋季 机械与运载工程学院
本讲内容 • 基本概念 • 不确定型决策 • 风险决策
决策科学是在研究决策活动基本规律的基础上,总结出一套进行决策必须遵循的原则、规则、程序、方法和技术。决策科学是在研究决策活动基本规律的基础上,总结出一套进行决策必须遵循的原则、规则、程序、方法和技术。 • 研究决策的问题包括:决策的基本原理、决策的程序、决策的信息、决策的方法(定量与定性的方法)、决策的风险、决策中的人因素、决策的思维方式、决策的组织、决策的实施等。 • 涉及社会学、决策心理学、决策行为学、决策的量化方法和评价、决策支持系统和决策自动化等多学科和多领域的综合应用。
决策要素 • 基本要素: • 决策者:决策的主体,一个人或团体; • 决策:两个以上可供选择的行动方案,记为Si; • 状态(事件):决策实施后可能遇到的自然状况,记做Ej; • 状态概率:对各状态发生可能性大小的主观估计,记为pj; • 结局(损益):当决策Si实施后遇到的状态Ej所产生的效益(利润)或损失(成本),记为aij,用损益表表示;
决策矩阵: • 根据决策矩阵中元素所示的含义不同,可称为收益矩阵、损失矩阵、风险矩阵、后悔值矩阵等。
例1:某厂需要对明年的生产投资做出决策:是增加设备投资还是维持现状。该厂产品明年在市场上的销售情况可能有3种:销量大、销量中、销量小。若增加设备投资遇到各种情况后的收益(万元)分别为80、20、-5;若维持现状遇到各种情况后的收益(万元)分别为40、7、1。请用决策分析的术语描述该问题。例1:某厂需要对明年的生产投资做出决策:是增加设备投资还是维持现状。该厂产品明年在市场上的销售情况可能有3种:销量大、销量中、销量小。若增加设备投资遇到各种情况后的收益(万元)分别为80、20、-5;若维持现状遇到各种情况后的收益(万元)分别为40、7、1。请用决策分析的术语描述该问题。
解:设决策S1:增加设备投资, S2:维持现状; 状态E1:销量大;E2:销量中; E3:销量小; 损益表
决策问题的分类 按性质的重要性分类: • 战略决策:涉及某组织发展和生存有关的全局性、长远问题的决策:如新产品开发方向; • 策略决策:为了完成战略决策所规定的目的而进行的决策,如工艺方案和设备的选择; • 执行决策:根据决策的要求对执行行为方案的选择,如生产中产品合格标准的选择。
按决策的结构分类: • 程序决策:有章可循,一般可重复; • 非程序决策:无章可循,一次性决策,凭主观经验; 按决策过程的连续性分类: • 单项决策:是指整个决策过程只作一次决策就得到结果; • 序贯决策:指整个决策过程由一系列决策组成;
决策问题的分类 按决策环境分类: • 确定型:状态只有一种(如规划问题); • 不确定型:状态不只一种;又可分为完全不确定型(状态概率未知)和风险型(状态概率可知)。 按定量和定性分类: • 定量决策:描述决策对象的指标都可以量化;
决策过程 • 预决策阶段:指当要决策的问题摆在决策者面前时,决策者能立即想到各种可能方案,收集信息,从开始时比较客观、无倾向性至以后逐渐变得主管和有倾向。 • 决策阶段:包括分部决策和最终决策两个阶段。分部阶段包括对决策处境作方向性的调整,如排除劣解,重新考虑已放弃的方案,增加和去掉些评价准则,决策者按主观倾向重新评估各方案,并保留倾向的少数方案,以便进行最终决策。 • 决策后阶段:当进行了最终决策,这时主要考虑的问题是决策后看法不一致。决策者倾向于解释和强调已选方案的优点,证明已选方案的优点和正确性。对决策实施进行了解。
不确定型的决策是指决策者对环境情况一无所知。决策者根据自己的主观倾向进行决策,由决策者的主观态度不同基本可分为四种准则:悲观主义准则、乐观主义准则、等可能性准则最小机会准则。
例2:设某工厂是按批生产某产品并按批销售,每件产品的成本为30元,批发价格为每件35元。若每月生产的产品当月销售不完,则每件损失1元。工厂每投产一批是10件,最大月生产能力是40件,决策者可选择的生产方案为0、10、20、30、40五种。假设决策者对其产品的需求情况一无所知,试问这时决策者如何决策?例2:设某工厂是按批生产某产品并按批销售,每件产品的成本为30元,批发价格为每件35元。若每月生产的产品当月销售不完,则每件损失1元。工厂每投产一批是10件,最大月生产能力是40件,决策者可选择的生产方案为0、10、20、30、40五种。假设决策者对其产品的需求情况一无所知,试问这时决策者如何决策? 风险决策
解:设决策策略集合{Si},i=1,2,3,4,5 状态(事件)集合{Ej},j=1,2,3,4,5 每个“策略-事件”都可以计算出相应的收益值或损失值,记作aij 收益矩阵(决策矩阵)
悲观主义(max min)决策准则 • 悲观主义决策准则亦称为保守主义决策准则。当决策者面临各种事情发生概率不清时,决策者考虑可能由于决策错误而造成重大经济损失。较谨慎考虑分析各种最坏的可能结果,从中选择最好者,以它对应的策略为决策策略,用符号表示为max min决策准则。
根据max min决策准则有: max(0,-10,-20,-30,-40)=0 对应的策略为S1,即为决策者应选的策略,表示“什么也不生产”,对应实际中表示先看看,再做决策。 Sk*→max min(aij) max
乐观主义(max max)决策准则 • 乐观主义(max max)决策准则的决策者对待风险的态度与悲观主义者不同,对待情况不明的策略问题时,绝不放弃任何一个可获得最好结果的机会,以争取好中之好的乐观态度来选择他的决策策略。
根据max max决策准则有: max(0,50,100,150,200)=200 对应的策略为S5: Sk*→max max(aij) i j
等可能性(Laplace)准则 • 当决策者面临某事件集合,在没有什么确切理由说明这一事件比那一事件有更多发生机会时,只能认为各事件发生的机会是均等的。即每一事件发生的概率都是1/事件数。决策者计算各策略的收益期望值,然后从中选择期望值最大者。
P=1/5,期望值: max{E(Si)}=max(0,38,64,78,80)=80 对应的策略为S5: Sk*→max {E(Si) i
最小机会损失准则 • 最小机会损失决策准则亦称为最小遗憾值决策准则或Savage决策准则。首先将收益矩阵中各元素变换为每一“策略-事件”对的机会损失值(遗憾值,后悔值)。其含义为:当某一事件发生后,由于决策者没有选用收益最大的策略,而形成的损失值。若发生k事件,各策略的收益为aik,i=1,2,┄,5,其中最大者为 ,各策略的机会损失值为:
从最大机会损失值中选取最小者,应对的策略为决策策略:从最大机会损失值中选取最小者,应对的策略为决策策略: 在分析产品废品率时,应用本决策准则比较方便。 min
折中主义准则 • 当用min max决策准则或max max决策准则来处理问题时,有的决策者认为这样太极端了。于是提出把这两种决策准则给予综合,令a为乐观系数,且0≤a≤1,并用下式表示: 其中aimax,aimin分别表示第i个策略可能得到的最大和最小收益值。
设a=1/3 决策准则选: max(0,10,20,30,40)=40→S5
课堂练习: • P436:10,11,12,13,17,18
风险决策是指决策者对客观情况不甚了解,但对将发生各事情的概率是已知的。 • 先验分析——利用先验信息进行终端决策; • 预验分析——后验分析的预分析。 • 后验分析——利用后验信息进行终端决策;
先验分析 • 先验概率:在随机事件发生之前,根据经验,对其发生概率做出的评估,称为随机事件的先验概率,包括统计概率和主观概率。
问题的一般提法 如例2中各事件出现的概率如下表所示,求最优的决策S*: 问题: 怎样构造解法?
最大期望收益决策准则(EMV) • EMV– Expected Monetary Value 步骤:求每个决策 Si的期望利润E(Si); -最大期望利润 maxE (Si)对应的决策即S*。 EMV决策准则适用于一次决策多次重复进行生产的情况,是平均意义下的最大收益。 max
最小机会损失决策准则(EOL) • EOL– Expected Opportunity Loss 步骤:由利润表导出机会损失表,其中策略Si对应事件Ej损失值为 其中第i策略的机会损失为: 从这些期望损失中选取最小者,对应的策略是S*:
练习 • 用EOL准则求上例。
预验分析 • 在补充新信息之前,先对补充信息是否合算作出初步分析,从而决定是否补充新信息。 • 信息的价值在于它能提高决策的最大期望收益值,但是如果为获得信息所花费的费用超过它所能提高的期望收益值,这种补充信息是不合算的。所有信息中最好、最理想的信息自然是完全可靠、准确的信息,即这种信息预报某自然状态出现,则在实际中必定出现这自然状态,这种信息称为完全信息。
全情报的价值(EVPI) 在风险决策中,除了状态(事件)概率以外,还希望获取关于状态的更多信息,统称为补充信息。而获取信息都要付出一定代价,为了权衡是否值得付出一定代价去获取补充信息,必须事先评估信息的价值。这可分为全信息与不全信息两类。 • 全情报:能够完全准确地预报未来发生状态的信息。 • 全情报的价值:由此信息所多获得的价值。 • 全情报的价值EVPI:事先未得全信息,不知其预报发生哪一状态,只能评估其期望价值。(Expected Value of Perfect Information)
当后果指标为收益时:EVPI=EPPI-EMV* 其中,EPPI是全情报条件下的收益期望值,EMV*是没有全情报时的最大收益期望值 如例2的 EPPI=0.1×0+0.2×50+0.4×100+0.2×150+0.1×200=100 EMV*=84 则: EVPI=100-84=16 既然EVPI 反映了完全情报的价值,而完全信息是可获信息的最高水准,因此,EVPI在决策分析中提供了为获取附加信息而值得付费的上限。一般地,EVPI= min EOL(Ej)。 问题:EVPI说明了什么?
课堂练习 例3 商店现需对某种货物下周的进货数量做出决策。设这种货物进货成本为每件800 元,售价为每件1000 元,但一周内如不能售出则变质报废。已知市场对这种货物的一周需求量的概率分布如表所示: 因此进货数量也决定由25、26、27、28(件)四种可能中做出决策。 (1)列出本问题的损益表,由最大期望收益准则确定最优决策; (2)列出机会损失表,由最小期望机会损失准则确定最优决策; (3)求本问题的EVPI。
课堂练习 例4:某轻工企业利用剩余生产能力生产一种季节性新产品,自产自销。产品成本每盒50 元,售价每盒80 元。如果当日未售出将半价(40 元)出售。现估计出该产品今年的市场需求量及它们出现的概率如表: 该企业拟订今年该产品日产量的备选方案为100 盒、110 盒、120 盒、130 盒。试根据最大期望收益准则确定适当的日产量,并求出企业为调查市场信息所值得付费的上限。
决策树 决策树是研究序列决策的有力工具,由决策点、事件点及结构构成的树形结构图。 回顾:什么是树? ——无圈的连通图。 决策树的结点与分枝 -决策结点 □ ,由此出发的分枝称决策分枝; -状态结点 ○ ,由此出发的分枝称机会(概率)分枝; -后果结点 △ ,后标结局(损益)值。 决策准则:最大期望值
例5某厂需要对明年的生产投资做出决策:是增加设备投资还是维持现状。该厂产品明年在市场上的销售情况可能有3 种:销量大、销量中、销量小。并知状态概率为0.2,0.5,0.3。若增加设备投资遇到各种情况后的收益(万元)分别为80、20、-5;若维持现状遇到各种情况后的收益(万元)分别为40、7、1。试用决策树做出决策使收入的期望值为最大。
求解思路: • 用决策术语描述上述问题 • 列出收益表 • 画出决策树 状态:θ1销售大;θ2销售中;θ3销量少 决策:d1增加设备;d2维持;
课堂练习 • P435:15.6;15.9
后验分析 • 后验分析:根据获得的新信息,应用贝叶斯公式,得到修正概率即后验概率,在此基础上作出决策,并计算出补充信息的价值。 • 比较: 先验分析:用先验概率P (Ei ) 作期望值进行决策; 后验分析:用后验概率P (Ei|E′k) 作期望值进行决策;
问题提出 • 当已知收益矩阵和事件Bi的概率P(Bi),又获得信息得知事件A会发生,并且Bi已发生条件下事件A的概率为P(A│Bi),求最佳决策。 • 则可运用贝叶斯定理计算出在事件A发生条件下事件Bi的后验概率P(Bi│A),再以P(Bi│A)作为期望进行决策。
问题提出 例6:A公司拥有某地石油开采权,可自行钻探开采,为此需花费30万美元;也可租让该地开采权给B公司,无论有油与否,都能稳得10万元租金,若有油还可再额外追加10万美元。据以往统计,在相似地理区钻探的井中,有7口油井和16口干井,每口油井的收益大约都是130万美元。则A公司应如何决策? 现有一个地质勘探队,能对该地区进行一次地震试验,从而探明其地下构成是封闭结构或开放结构。据地质学可知,有油地区多半为封闭结构,无油地区多半为开放结构。另据以往统计,该地质勘探队把有油地区勘测为封闭结构的概率为0.8,把无油地区勘测为开放结构的概率为0.6。已知地震试验费为5万美元,则A公司是否进行这项试验?
后验概率 • 贝叶斯公式 • 上述贝叶斯公式也可以用表格表示为:
后验分析最大期望收益 • 根据已计算出得补充信息预报各状态出现的概率P(xi)(i=1,2,┄,s),可计算出后验分析中最大期望收益值 • 显然,补充信息后期望收益值增加了 EVSI=EMV*(后)-EMV*(先) • EVSI称为补充信息的价值,也称为抽样信息期望价值 • 由此,可将补充信息的价值EVSI与获得信息付出的代价进行对比,从而作出正确的决策。
按贝叶斯定理进行风险决策的基本步骤是: 1:列出在已知项目B条件下项目A的发生概率,即将P(A│B)转换为 P(B│A); 2:绘制树型图; 3:求各状态结点的期望收益值,并将结果填入树型图; 4:根据对树型图的分析,进行项目风险决策