1 / 28

第三节 矩阵对策

第三节 矩阵对策. §3.1 矩阵对策的数学模型. §3.2 矩阵对策的纯策略纳什均衡. §3.3 混合策略矩阵对策. §3.4 矩阵对策纳什均衡存在定理. §3.5 优超及矩阵对策的求解. 第三节 矩阵对策. 矩阵对策的研究可追朔到冯 . 诺依曼和摩根斯坦。矩阵对策是二人的零和对策。零和对策,是指在对策中,一方的收益必定是另一方的损失,某些对策方的赢肯定是来源于其他对策方的输 , 如“齐王赛马”。零和对策各对策之间的利益总是相对立 , 为了在对策中占据上风,不能让对手猜出自己将选择的策略。. 第三节 矩阵对策. §3.1 矩阵对策的数学模型

elwyn
Download Presentation

第三节 矩阵对策

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 第三节 矩阵对策 §3.1 矩阵对策的数学模型 §3.2 矩阵对策的纯策略纳什均衡 §3.3 混合策略矩阵对策 §3.4 矩阵对策纳什均衡存在定理 §3.5 优超及矩阵对策的求解

  2. 第三节 矩阵对策 矩阵对策的研究可追朔到冯.诺依曼和摩根斯坦。矩阵对策是二人的零和对策。零和对策,是指在对策中,一方的收益必定是另一方的损失,某些对策方的赢肯定是来源于其他对策方的输,如“齐王赛马”。零和对策各对策之间的利益总是相对立,为了在对策中占据上风,不能让对手猜出自己将选择的策略。

  3. 第三节 矩阵对策 §3.1 矩阵对策的数学模型 设Ⅰ、Ⅱ表示两个局中人,并设局中人Ⅰ有 个纯策略 ,局中人Ⅱ有 个纯策略 ,局中人Ⅰ、Ⅱ的策略集分别为: ={ } ={ } 局中人Ⅰ、Ⅱ所构成的策略组合共有 个,记局中人Ⅰ在策略( )下的得益为 ,则Ⅰ在每个策略的赢得可用一个矩阵表示

  4. 第三节 矩阵对策 称 为局中人Ⅰ的赢得矩阵(或为Ⅱ的支付矩阵),由于对策为零和的,故局中人Ⅱ的赢得矩阵为- 。 (8.3.1) 记 (8.3.2) 这就是矩阵对策的基本表示 。

  5. 第三节 矩阵对策 例8.3.1石头、剪子、布对策的矩阵表示 策略1代表出石头,策略2、3依次代表出剪子、布。 = §3.2 矩阵对策的纯策略纳什均衡 例8.3.2 给出下面的矩阵对策 ,其中 ={ } , ={ },判断并求纯策略纳什均衡。

  6. 第三节 矩阵对策 矩阵为 = 双方都考虑到不能去冒风险,对方会设法使它方得到最小收入,所以自己应当从最坏的情形入手,去争取最好的结果 。对局中人I来说,各方案中最坏的结果:A中每一行的最小数分别是:一8,2,一10,一3。其中最好的的结果又是2。于是,局中人I出 参加对策,至少可以保证收入不会少于2;同样道理,

  7. 第三节 矩阵对策 • 对局中人Ⅱ来说,各方案最坏的结果中最好的结果(输得最小)是2。于是,局人Ⅱ出 参与对策,那么它最多输2,局势( , )能使双方同时满意。 定义8.3.1 在矩阵对策 中,式中 = { }, ={ }, = 。 若等式 = = (8.3.3) 成立,记 ,称此为对策 的值。

  8. 第三节 矩阵对策 称使(8.3.3)成立策略组合( )为该对策的纯策略纳什均衡。 一般地来说,下面不等式是成立的 (8.3.4) 当两者相等时,矩阵对策有纯策略纳什均衡。例8.3.3设矩阵对策 , 如下所示,求其纳什均衡。

  9. 第三节 矩阵对策 = 可以看出,局中人Ⅰ选择方案 、局中人Ⅱ选择 或 是最优纯策略。从例8.3.3看出, 中元素 、 在该行是最小的、而在该列又是最大的 。 定理8.3.1矩阵对策 在纯策略定义下有纳什均衡的充要条件是:存在策略组合

  10. 第三节 矩阵对策 使得对一切 均有 • (8.3.5 )定义8.3.2 设 为一个定义在 及 上的实值函数,如果存在 ,使得对一切 和 ,有 • (8.3.6) • 则称 为函数 的一个鞍点 。 矩阵对策的最优解有下列性质:

  11. 第三节 矩阵对策 (1)(无差别性) 如( )与( )是对策的两个解,则 (2)(可交换性) 如( )与( )是对策的两个解,则( )与( )也为最优解。 §3.3 混合策略矩阵对策 定义8.3.3 设有矩阵对策 ,其中 ={ }, ={ }, = 。 记

  12. 第三节 矩阵对策 = = 称 和 分别为局中人I、Ⅱ的混合策略集; 和 ,称( )为局中人I、Ⅱ的混合局势,局中人I的赢得函数记为 • = = (8.3.7) • 这样得到的新对策记为 = ,称为对策 的混合扩充。

  13. 第三节 矩阵对策 • 纯策略是混合策略的特例,局中人以纯策略 等价于第 分量取1其余取0。 定义8.3.4 设 = 为 的混合扩充,如果: = (8.3.9) 记其值为 ,则称 为对策 的值,称使(8.3.9)式成立的混合局势( )为 在混合策略意义下的解(或简称解), 和 分别称为局中人I和II的最优混合策略 (或称最优策略)。

  14. 第三节 矩阵对策 定理8.3.2 矩阵对策 在混合策略意义下的有解的充要条件是:存在 和 使( )为 的一个鞍点。即 (8.3.10) 其中 是任意的。 例8.3.4 考虑矩阵对策 ,其中 = 纯策略意义下解不存在,混合策略意义下的解

  15. 第三节 矩阵对策 设 局中人I的赢得期望 = = -8( + 取 , ,有 = = 则 和 分别为局中人的最优策略 .

  16. 第三节 矩阵对策 局中人I采用纯策略 而局中人II采用混合策略 ,相应赢得记为 , 有 = (8.3.11) 类似的,II采用纯策略时 局中人1采用混合策略 ,相应赢得记为 ,于是 = = = (8.3.12) 定理8.3.3 设 , ,则( )是对策的纳什均衡的充要条件是 对 ,有 (8.3.13)

  17. 第三节 矩阵对策 下面是定理8.3.3的等价形式。 定理8.3.4设 , ,则( )是对策 的纳什均衡的充要条件是:存在实数 ,使得 , 为下列不等式组的解 (I) (8.3.16) (II) (8.3.17)

  18. 第三节 矩阵对策 此处不证明的介绍矩阵对策的基本定理: 定理8.3.5 任一矩阵对策 ,一定存在混合意义下的解。 下面是矩阵对策及其纳什均衡的若干性质. 定理8.3.6 设( )是矩阵对策 的纳什均衡, ,则 (1)若 >0, 则 = . (2)若 >0, 则 = .

  19. 第三节 矩阵对策 (3)若 < , 则 =0 . (4)若 > ,则 =0. 如果记矩阵对策 的解集为 ,则下面是 关于阵对策解集的主要结果: 定理8.3.7 设两矩阵对策  与 , , ,为任意常数.则 (1) . (2) =

  20. 第三节 矩阵对策 定理8.3.8 设两矩阵对策  与 , 为一常数.则 (1) . (2) = . 定理8.3.9设 为矩阵对策,且 ,则(1) (2) =  式中 与 分别为局中人I、Ⅱ的最优策略集.

  21. 第三节 矩阵对策 §3.5 优超及矩阵对策的求解 定义8.3.5设有矩阵对策 ,其中 ={ }, ={ }, = 。 若 对 有 则称局中人I的纯策略 优于纯策略 ;同样地,若对 有 则称局中人Ⅱ的纯策略 优于纯策略 。定理8.3.10 设有矩阵对策 ,其中 ={ } , ={ }, = 。

  22. 第三节 矩阵对策 如果纯策略 被 中任一所优超,则可由 导出一个新矩阵对策: ,式中 ={ }, , , , 。于是有 (1) (2) 中局中人Ⅱ的最优策略与其在 中的最优策略相同。 (3)当 是 中局中人I的最优策略,则 为其在中的最优解。

  23. 第三节 矩阵对策 矩阵对策的求解方法: 1.优超原则法 例8.3.5矩阵对策的赢得矩阵如下,求其纳什均衡 = 局中人I的策略 被 优超,将矩阵的第一行划 去 ;局中人Ⅱ的策略 被 优超,划去第一列; 又因为得到的3阶矩阵的元素满足第一列大于

  24. 1 3 2 图8.3.1 第三节 矩阵对策 或等于1/2倍的2、3列之和,划去第一列,又将 第一行划去得2 2矩阵 ,即求最优解 。 2. 和 矩阵对策的图解法

  25. 第三节 矩阵对策 上面以 矩阵对策为例说明其图解法,此处 = 。 3.线形方程组法 根据前面定理可将其转为以下方程组: 与 方程组非负解 ,则便得到一个纳什均衡 ( ) ;有负分量时,可视具体情况,

  26. 第三节 矩阵对策 将某些等式变为不等式,继续直至求出其解。 例8.3.6 求解 “齐王赛马”的纳什均衡。 解:齐王的赢得矩阵为 = 由于无鞍点,对齐王和田忌来说不存在最优纯策 略。解方程组得: ; , 。 最优混合策略为双方都以1/6的概率选取每个 纯策略,总的结局应该是:齐王有5/6的机会赢 田忌,赢得的期望值是1千金。还有开局前应对

  27. 第三节 矩阵对策 自己开局前均应对自己的策略(实际上实施的纯 策略)加以保密 。 4.线性规划解法 对矩阵对策来说,其求解可构造出一组互为对偶的线性规划问题,而这组对偶规划都有可行解,可借助线性规划方法求解。 (1) 与(2)

  28. 第三节 矩阵对策 其中 = 就是对策的值 。 例8.3.7利用线性规划方法求解得益阵 的矩阵对策的纳什均衡。 解之 (0.36,0.49,0.15) (0.37,0.35,0.28) 3.39

More Related