1 / 57

决 策 论

决 策 论. (Decision Making Theory). 2011 年秋季 机械与运载工程学院. 本讲内容. 基本概念 不确定型决策 风险决策. 决策科学是在研究决策活动基本规律的基础上,总结出一套进行决策必须遵循的原则、规则、程序、方法和技术。 研究决策的问题包括:决策的基本原理、决策的程序、决策的信息、决策的方法(定量与定性的方法)、决策的风险、决策中的人因素、决策的思维方式、决策的组织、决策的实施等。 涉及社会学、决策心理学、决策行为学、决策的量化方法和评价、决策支持系统和决策自动化等多学科和多领域的综合应用。. 基 本 概 念. 决策要素.

Download Presentation

决 策 论

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 决 策 论 (Decision Making Theory) 2011年秋季 机械与运载工程学院

  2. 本讲内容 • 基本概念 • 不确定型决策 • 风险决策

  3. 决策科学是在研究决策活动基本规律的基础上,总结出一套进行决策必须遵循的原则、规则、程序、方法和技术。决策科学是在研究决策活动基本规律的基础上,总结出一套进行决策必须遵循的原则、规则、程序、方法和技术。 • 研究决策的问题包括:决策的基本原理、决策的程序、决策的信息、决策的方法(定量与定性的方法)、决策的风险、决策中的人因素、决策的思维方式、决策的组织、决策的实施等。 • 涉及社会学、决策心理学、决策行为学、决策的量化方法和评价、决策支持系统和决策自动化等多学科和多领域的综合应用。

  4. 基 本 概 念

  5. 决策要素 • 基本要素: • 决策者:决策的主体,一个人或团体; • 决策:两个以上可供选择的行动方案,记为Si; • 状态(事件):决策实施后可能遇到的自然状况,记做Ej; • 状态概率:对各状态发生可能性大小的主观估计,记为pj; • 结局(损益):当决策Si实施后遇到的状态Ej所产生的效益(利润)或损失(成本),记为aij,用损益表表示;

  6. 决策矩阵: • 根据决策矩阵中元素所示的含义不同,可称为收益矩阵、损失矩阵、风险矩阵、后悔值矩阵等。

  7. 例1:某厂需要对明年的生产投资做出决策:是增加设备投资还是维持现状。该厂产品明年在市场上的销售情况可能有3种:销量大、销量中、销量小。若增加设备投资遇到各种情况后的收益(万元)分别为80、20、-5;若维持现状遇到各种情况后的收益(万元)分别为40、7、1。请用决策分析的术语描述该问题。例1:某厂需要对明年的生产投资做出决策:是增加设备投资还是维持现状。该厂产品明年在市场上的销售情况可能有3种:销量大、销量中、销量小。若增加设备投资遇到各种情况后的收益(万元)分别为80、20、-5;若维持现状遇到各种情况后的收益(万元)分别为40、7、1。请用决策分析的术语描述该问题。

  8. 解:设决策S1:增加设备投资, S2:维持现状; 状态E1:销量大;E2:销量中; E3:销量小; 损益表

  9. 决策问题的分类 按性质的重要性分类: • 战略决策:涉及某组织发展和生存有关的全局性、长远问题的决策:如新产品开发方向; • 策略决策:为了完成战略决策所规定的目的而进行的决策,如工艺方案和设备的选择; • 执行决策:根据决策的要求对执行行为方案的选择,如生产中产品合格标准的选择。

  10. 按决策的结构分类: • 程序决策:有章可循,一般可重复; • 非程序决策:无章可循,一次性决策,凭主观经验; 按决策过程的连续性分类: • 单项决策:是指整个决策过程只作一次决策就得到结果; • 序贯决策:指整个决策过程由一系列决策组成;

  11. 决策问题的分类 按决策环境分类: • 确定型:状态只有一种(如规划问题); • 不确定型:状态不只一种;又可分为完全不确定型(状态概率未知)和风险型(状态概率可知)。 按定量和定性分类: • 定量决策:描述决策对象的指标都可以量化;

  12. 决策过程 • 预决策阶段:指当要决策的问题摆在决策者面前时,决策者能立即想到各种可能方案,收集信息,从开始时比较客观、无倾向性至以后逐渐变得主管和有倾向。 • 决策阶段:包括分部决策和最终决策两个阶段。分部阶段包括对决策处境作方向性的调整,如排除劣解,重新考虑已放弃的方案,增加和去掉些评价准则,决策者按主观倾向重新评估各方案,并保留倾向的少数方案,以便进行最终决策。 • 决策后阶段:当进行了最终决策,这时主要考虑的问题是决策后看法不一致。决策者倾向于解释和强调已选方案的优点,证明已选方案的优点和正确性。对决策实施进行了解。

  13. 不 确 定 型 的 决 策

  14. 不确定型的决策是指决策者对环境情况一无所知。决策者根据自己的主观倾向进行决策,由决策者的主观态度不同基本可分为四种准则:悲观主义准则、乐观主义准则、等可能性准则最小机会准则。

  15. 例2:设某工厂是按批生产某产品并按批销售,每件产品的成本为30元,批发价格为每件35元。若每月生产的产品当月销售不完,则每件损失1元。工厂每投产一批是10件,最大月生产能力是40件,决策者可选择的生产方案为0、10、20、30、40五种。假设决策者对其产品的需求情况一无所知,试问这时决策者如何决策?例2:设某工厂是按批生产某产品并按批销售,每件产品的成本为30元,批发价格为每件35元。若每月生产的产品当月销售不完,则每件损失1元。工厂每投产一批是10件,最大月生产能力是40件,决策者可选择的生产方案为0、10、20、30、40五种。假设决策者对其产品的需求情况一无所知,试问这时决策者如何决策? 风险决策

  16. 解:设决策策略集合{Si},i=1,2,3,4,5 状态(事件)集合{Ej},j=1,2,3,4,5 每个“策略-事件”都可以计算出相应的收益值或损失值,记作aij 收益矩阵(决策矩阵)

  17. 悲观主义(max min)决策准则 • 悲观主义决策准则亦称为保守主义决策准则。当决策者面临各种事情发生概率不清时,决策者考虑可能由于决策错误而造成重大经济损失。较谨慎考虑分析各种最坏的可能结果,从中选择最好者,以它对应的策略为决策策略,用符号表示为max min决策准则。

  18. 根据max min决策准则有: max(0,-10,-20,-30,-40)=0 对应的策略为S1,即为决策者应选的策略,表示“什么也不生产”,对应实际中表示先看看,再做决策。 Sk*→max min(aij) max

  19. 乐观主义(max max)决策准则 • 乐观主义(max max)决策准则的决策者对待风险的态度与悲观主义者不同,对待情况不明的策略问题时,绝不放弃任何一个可获得最好结果的机会,以争取好中之好的乐观态度来选择他的决策策略。

  20. 根据max max决策准则有: max(0,50,100,150,200)=200 对应的策略为S5: Sk*→max max(aij) i j

  21. 等可能性(Laplace)准则 • 当决策者面临某事件集合,在没有什么确切理由说明这一事件比那一事件有更多发生机会时,只能认为各事件发生的机会是均等的。即每一事件发生的概率都是1/事件数。决策者计算各策略的收益期望值,然后从中选择期望值最大者。

  22. P=1/5,期望值: max{E(Si)}=max(0,38,64,78,80)=80 对应的策略为S5: Sk*→max {E(Si) i

  23. 最小机会损失准则 • 最小机会损失决策准则亦称为最小遗憾值决策准则或Savage决策准则。首先将收益矩阵中各元素变换为每一“策略-事件”对的机会损失值(遗憾值,后悔值)。其含义为:当某一事件发生后,由于决策者没有选用收益最大的策略,而形成的损失值。若发生k事件,各策略的收益为aik,i=1,2,┄,5,其中最大者为 ,各策略的机会损失值为:

  24. 从最大机会损失值中选取最小者,应对的策略为决策策略:从最大机会损失值中选取最小者,应对的策略为决策策略: 在分析产品废品率时,应用本决策准则比较方便。 min

  25. 折中主义准则 • 当用min max决策准则或max max决策准则来处理问题时,有的决策者认为这样太极端了。于是提出把这两种决策准则给予综合,令a为乐观系数,且0≤a≤1,并用下式表示: 其中aimax,aimin分别表示第i个策略可能得到的最大和最小收益值。

  26. 设a=1/3 决策准则选: max(0,10,20,30,40)=40→S5

  27. 课堂练习: • P436:10,11,12,13,17,18

  28. 风 险 决 策

  29. 风险决策是指决策者对客观情况不甚了解,但对将发生各事情的概率是已知的。 • 先验分析——利用先验信息进行终端决策; • 预验分析——后验分析的预分析。 • 后验分析——利用后验信息进行终端决策;

  30. 先验分析 • 先验概率:在随机事件发生之前,根据经验,对其发生概率做出的评估,称为随机事件的先验概率,包括统计概率和主观概率。

  31. 问题的一般提法 如例2中各事件出现的概率如下表所示,求最优的决策S*: 问题: 怎样构造解法?

  32. 最大期望收益决策准则(EMV) • EMV– Expected Monetary Value 步骤:求每个决策 Si的期望利润E(Si); -最大期望利润 maxE (Si)对应的决策即S*。 EMV决策准则适用于一次决策多次重复进行生产的情况,是平均意义下的最大收益。 max

  33. 最小机会损失决策准则(EOL) • EOL– Expected Opportunity Loss 步骤:由利润表导出机会损失表,其中策略Si对应事件Ej损失值为 其中第i策略的机会损失为: 从这些期望损失中选取最小者,对应的策略是S*:

  34. 练习 • 用EOL准则求上例。

  35. 预验分析 • 在补充新信息之前,先对补充信息是否合算作出初步分析,从而决定是否补充新信息。 • 信息的价值在于它能提高决策的最大期望收益值,但是如果为获得信息所花费的费用超过它所能提高的期望收益值,这种补充信息是不合算的。所有信息中最好、最理想的信息自然是完全可靠、准确的信息,即这种信息预报某自然状态出现,则在实际中必定出现这自然状态,这种信息称为完全信息。

  36. 全情报的价值(EVPI) 在风险决策中,除了状态(事件)概率以外,还希望获取关于状态的更多信息,统称为补充信息。而获取信息都要付出一定代价,为了权衡是否值得付出一定代价去获取补充信息,必须事先评估信息的价值。这可分为全信息与不全信息两类。 • 全情报:能够完全准确地预报未来发生状态的信息。 • 全情报的价值:由此信息所多获得的价值。 • 全情报的价值EVPI:事先未得全信息,不知其预报发生哪一状态,只能评估其期望价值。(Expected Value of Perfect Information)

  37. 当后果指标为收益时:EVPI=EPPI-EMV* 其中,EPPI是全情报条件下的收益期望值,EMV*是没有全情报时的最大收益期望值 如例2的 EPPI=0.1×0+0.2×50+0.4×100+0.2×150+0.1×200=100 EMV*=84 则: EVPI=100-84=16 既然EVPI 反映了完全情报的价值,而完全信息是可获信息的最高水准,因此,EVPI在决策分析中提供了为获取附加信息而值得付费的上限。一般地,EVPI= min EOL(Ej)。 问题:EVPI说明了什么?

  38. 课堂练习 例3 商店现需对某种货物下周的进货数量做出决策。设这种货物进货成本为每件800 元,售价为每件1000 元,但一周内如不能售出则变质报废。已知市场对这种货物的一周需求量的概率分布如表所示: 因此进货数量也决定由25、26、27、28(件)四种可能中做出决策。 (1)列出本问题的损益表,由最大期望收益准则确定最优决策; (2)列出机会损失表,由最小期望机会损失准则确定最优决策; (3)求本问题的EVPI。

  39. 课堂练习 例4:某轻工企业利用剩余生产能力生产一种季节性新产品,自产自销。产品成本每盒50 元,售价每盒80 元。如果当日未售出将半价(40 元)出售。现估计出该产品今年的市场需求量及它们出现的概率如表: 该企业拟订今年该产品日产量的备选方案为100 盒、110 盒、120 盒、130 盒。试根据最大期望收益准则确定适当的日产量,并求出企业为调查市场信息所值得付费的上限。

  40. 决策树 决策树是研究序列决策的有力工具,由决策点、事件点及结构构成的树形结构图。 回顾:什么是树? ——无圈的连通图。 决策树的结点与分枝 -决策结点 □ ,由此出发的分枝称决策分枝; -状态结点 ○ ,由此出发的分枝称机会(概率)分枝; -后果结点 △ ,后标结局(损益)值。 决策准则:最大期望值

  41. 例5某厂需要对明年的生产投资做出决策:是增加设备投资还是维持现状。该厂产品明年在市场上的销售情况可能有3 种:销量大、销量中、销量小。并知状态概率为0.2,0.5,0.3。若增加设备投资遇到各种情况后的收益(万元)分别为80、20、-5;若维持现状遇到各种情况后的收益(万元)分别为40、7、1。试用决策树做出决策使收入的期望值为最大。

  42. 求解思路: • 用决策术语描述上述问题 • 列出收益表 • 画出决策树 状态:θ1销售大;θ2销售中;θ3销量少 决策:d1增加设备;d2维持;

  43. 课堂练习 • P435:15.6;15.9

  44. 后验分析 • 后验分析:根据获得的新信息,应用贝叶斯公式,得到修正概率即后验概率,在此基础上作出决策,并计算出补充信息的价值。 • 比较: 先验分析:用先验概率P (Ei ) 作期望值进行决策; 后验分析:用后验概率P (Ei|E′k) 作期望值进行决策;

  45. 问题提出 • 当已知收益矩阵和事件Bi的概率P(Bi),又获得信息得知事件A会发生,并且Bi已发生条件下事件A的概率为P(A│Bi),求最佳决策。 • 则可运用贝叶斯定理计算出在事件A发生条件下事件Bi的后验概率P(Bi│A),再以P(Bi│A)作为期望进行决策。

  46. 问题提出 例6:A公司拥有某地石油开采权,可自行钻探开采,为此需花费30万美元;也可租让该地开采权给B公司,无论有油与否,都能稳得10万元租金,若有油还可再额外追加10万美元。据以往统计,在相似地理区钻探的井中,有7口油井和16口干井,每口油井的收益大约都是130万美元。则A公司应如何决策? 现有一个地质勘探队,能对该地区进行一次地震试验,从而探明其地下构成是封闭结构或开放结构。据地质学可知,有油地区多半为封闭结构,无油地区多半为开放结构。另据以往统计,该地质勘探队把有油地区勘测为封闭结构的概率为0.8,把无油地区勘测为开放结构的概率为0.6。已知地震试验费为5万美元,则A公司是否进行这项试验?

  47. 后验概率 • 贝叶斯公式 • 上述贝叶斯公式也可以用表格表示为:

  48. 后验分析最大期望收益 • 根据已计算出得补充信息预报各状态出现的概率P(xi)(i=1,2,┄,s),可计算出后验分析中最大期望收益值 • 显然,补充信息后期望收益值增加了 EVSI=EMV*(后)-EMV*(先) • EVSI称为补充信息的价值,也称为抽样信息期望价值 • 由此,可将补充信息的价值EVSI与获得信息付出的代价进行对比,从而作出正确的决策。

  49. 按贝叶斯定理进行风险决策的基本步骤是: 1:列出在已知项目B条件下项目A的发生概率,即将P(A│B)转换为 P(B│A); 2:绘制树型图; 3:求各状态结点的期望收益值,并将结果填入树型图; 4:根据对树型图的分析,进行项目风险决策

More Related