290 likes | 500 Views
第三节 矩阵对策. §3.1 矩阵对策的数学模型. §3.2 矩阵对策的纯策略纳什均衡. §3.3 混合策略矩阵对策. §3.4 矩阵对策纳什均衡存在定理. §3.5 优超及矩阵对策的求解. 第三节 矩阵对策. 矩阵对策的研究可追朔到冯 . 诺依曼和摩根斯坦。矩阵对策是二人的零和对策。零和对策,是指在对策中,一方的收益必定是另一方的损失,某些对策方的赢肯定是来源于其他对策方的输 , 如“齐王赛马”。零和对策各对策之间的利益总是相对立 , 为了在对策中占据上风,不能让对手猜出自己将选择的策略。. 第三节 矩阵对策. §3.1 矩阵对策的数学模型
E N D
第三节 矩阵对策 §3.1 矩阵对策的数学模型 §3.2 矩阵对策的纯策略纳什均衡 §3.3 混合策略矩阵对策 §3.4 矩阵对策纳什均衡存在定理 §3.5 优超及矩阵对策的求解
第三节 矩阵对策 矩阵对策的研究可追朔到冯.诺依曼和摩根斯坦。矩阵对策是二人的零和对策。零和对策,是指在对策中,一方的收益必定是另一方的损失,某些对策方的赢肯定是来源于其他对策方的输,如“齐王赛马”。零和对策各对策之间的利益总是相对立,为了在对策中占据上风,不能让对手猜出自己将选择的策略。
第三节 矩阵对策 §3.1 矩阵对策的数学模型 设Ⅰ、Ⅱ表示两个局中人,并设局中人Ⅰ有 个纯策略 ,局中人Ⅱ有 个纯策略 ,局中人Ⅰ、Ⅱ的策略集分别为: ={ } ={ } 局中人Ⅰ、Ⅱ所构成的策略组合共有 个,记局中人Ⅰ在策略( )下的得益为 ,则Ⅰ在每个策略的赢得可用一个矩阵表示
第三节 矩阵对策 称 为局中人Ⅰ的赢得矩阵(或为Ⅱ的支付矩阵),由于对策为零和的,故局中人Ⅱ的赢得矩阵为- 。 (8.3.1) 记 (8.3.2) 这就是矩阵对策的基本表示 。
第三节 矩阵对策 例8.3.1石头、剪子、布对策的矩阵表示 策略1代表出石头,策略2、3依次代表出剪子、布。 = §3.2 矩阵对策的纯策略纳什均衡 例8.3.2 给出下面的矩阵对策 ,其中 ={ } , ={ },判断并求纯策略纳什均衡。
第三节 矩阵对策 矩阵为 = 双方都考虑到不能去冒风险,对方会设法使它方得到最小收入,所以自己应当从最坏的情形入手,去争取最好的结果 。对局中人I来说,各方案中最坏的结果:A中每一行的最小数分别是:一8,2,一10,一3。其中最好的的结果又是2。于是,局中人I出 参加对策,至少可以保证收入不会少于2;同样道理,
第三节 矩阵对策 • 对局中人Ⅱ来说,各方案最坏的结果中最好的结果(输得最小)是2。于是,局人Ⅱ出 参与对策,那么它最多输2,局势( , )能使双方同时满意。 定义8.3.1 在矩阵对策 中,式中 = { }, ={ }, = 。 若等式 = = (8.3.3) 成立,记 ,称此为对策 的值。
第三节 矩阵对策 称使(8.3.3)成立策略组合( )为该对策的纯策略纳什均衡。 一般地来说,下面不等式是成立的 (8.3.4) 当两者相等时,矩阵对策有纯策略纳什均衡。例8.3.3设矩阵对策 , 如下所示,求其纳什均衡。
第三节 矩阵对策 = 可以看出,局中人Ⅰ选择方案 、局中人Ⅱ选择 或 是最优纯策略。从例8.3.3看出, 中元素 、 在该行是最小的、而在该列又是最大的 。 定理8.3.1矩阵对策 在纯策略定义下有纳什均衡的充要条件是:存在策略组合
第三节 矩阵对策 使得对一切 均有 • (8.3.5 )定义8.3.2 设 为一个定义在 及 上的实值函数,如果存在 ,使得对一切 和 ,有 • (8.3.6) • 则称 为函数 的一个鞍点 。 矩阵对策的最优解有下列性质:
第三节 矩阵对策 (1)(无差别性) 如( )与( )是对策的两个解,则 (2)(可交换性) 如( )与( )是对策的两个解,则( )与( )也为最优解。 §3.3 混合策略矩阵对策 定义8.3.3 设有矩阵对策 ,其中 ={ }, ={ }, = 。 记
第三节 矩阵对策 = = 称 和 分别为局中人I、Ⅱ的混合策略集; 和 ,称( )为局中人I、Ⅱ的混合局势,局中人I的赢得函数记为 • = = (8.3.7) • 这样得到的新对策记为 = ,称为对策 的混合扩充。
第三节 矩阵对策 • 纯策略是混合策略的特例,局中人以纯策略 等价于第 分量取1其余取0。 定义8.3.4 设 = 为 的混合扩充,如果: = (8.3.9) 记其值为 ,则称 为对策 的值,称使(8.3.9)式成立的混合局势( )为 在混合策略意义下的解(或简称解), 和 分别称为局中人I和II的最优混合策略 (或称最优策略)。
第三节 矩阵对策 定理8.3.2 矩阵对策 在混合策略意义下的有解的充要条件是:存在 和 使( )为 的一个鞍点。即 (8.3.10) 其中 是任意的。 例8.3.4 考虑矩阵对策 ,其中 = 纯策略意义下解不存在,混合策略意义下的解
第三节 矩阵对策 设 局中人I的赢得期望 = = -8( + 取 , ,有 = = 则 和 分别为局中人的最优策略 .
第三节 矩阵对策 局中人I采用纯策略 而局中人II采用混合策略 ,相应赢得记为 , 有 = (8.3.11) 类似的,II采用纯策略时 局中人1采用混合策略 ,相应赢得记为 ,于是 = = = (8.3.12) 定理8.3.3 设 , ,则( )是对策的纳什均衡的充要条件是 对 ,有 (8.3.13)
第三节 矩阵对策 下面是定理8.3.3的等价形式。 定理8.3.4设 , ,则( )是对策 的纳什均衡的充要条件是:存在实数 ,使得 , 为下列不等式组的解 (I) (8.3.16) (II) (8.3.17)
第三节 矩阵对策 此处不证明的介绍矩阵对策的基本定理: 定理8.3.5 任一矩阵对策 ,一定存在混合意义下的解。 下面是矩阵对策及其纳什均衡的若干性质. 定理8.3.6 设( )是矩阵对策 的纳什均衡, ,则 (1)若 >0, 则 = . (2)若 >0, 则 = .
第三节 矩阵对策 (3)若 < , 则 =0 . (4)若 > ,则 =0. 如果记矩阵对策 的解集为 ,则下面是 关于阵对策解集的主要结果: 定理8.3.7 设两矩阵对策 与 , , ,为任意常数.则 (1) . (2) =
第三节 矩阵对策 定理8.3.8 设两矩阵对策 与 , 为一常数.则 (1) . (2) = . 定理8.3.9设 为矩阵对策,且 ,则(1) (2) = 式中 与 分别为局中人I、Ⅱ的最优策略集.
第三节 矩阵对策 §3.5 优超及矩阵对策的求解 定义8.3.5设有矩阵对策 ,其中 ={ }, ={ }, = 。 若 对 有 则称局中人I的纯策略 优于纯策略 ;同样地,若对 有 则称局中人Ⅱ的纯策略 优于纯策略 。定理8.3.10 设有矩阵对策 ,其中 ={ } , ={ }, = 。
第三节 矩阵对策 如果纯策略 被 中任一所优超,则可由 导出一个新矩阵对策: ,式中 ={ }, , , , 。于是有 (1) (2) 中局中人Ⅱ的最优策略与其在 中的最优策略相同。 (3)当 是 中局中人I的最优策略,则 为其在中的最优解。
第三节 矩阵对策 矩阵对策的求解方法: 1.优超原则法 例8.3.5矩阵对策的赢得矩阵如下,求其纳什均衡 = 局中人I的策略 被 优超,将矩阵的第一行划 去 ;局中人Ⅱ的策略 被 优超,划去第一列; 又因为得到的3阶矩阵的元素满足第一列大于
1 3 2 图8.3.1 第三节 矩阵对策 或等于1/2倍的2、3列之和,划去第一列,又将 第一行划去得2 2矩阵 ,即求最优解 。 2. 和 矩阵对策的图解法
第三节 矩阵对策 上面以 矩阵对策为例说明其图解法,此处 = 。 3.线形方程组法 根据前面定理可将其转为以下方程组: 与 方程组非负解 ,则便得到一个纳什均衡 ( ) ;有负分量时,可视具体情况,
第三节 矩阵对策 将某些等式变为不等式,继续直至求出其解。 例8.3.6 求解 “齐王赛马”的纳什均衡。 解:齐王的赢得矩阵为 = 由于无鞍点,对齐王和田忌来说不存在最优纯策 略。解方程组得: ; , 。 最优混合策略为双方都以1/6的概率选取每个 纯策略,总的结局应该是:齐王有5/6的机会赢 田忌,赢得的期望值是1千金。还有开局前应对
第三节 矩阵对策 自己开局前均应对自己的策略(实际上实施的纯 策略)加以保密 。 4.线性规划解法 对矩阵对策来说,其求解可构造出一组互为对偶的线性规划问题,而这组对偶规划都有可行解,可借助线性规划方法求解。 (1) 与(2)
第三节 矩阵对策 其中 = 就是对策的值 。 例8.3.7利用线性规划方法求解得益阵 的矩阵对策的纳什均衡。 解之 (0.36,0.49,0.15) (0.37,0.35,0.28) 3.39