900 likes | 1.19k Views
Ch1. 完全信息静态博弈 - 纳什均衡. 南京理工大学经管院应用经济系 劉琦 njust326@yahoo.com.cn. 主要内容. 2.1 基本概念 2.2 优势策略 2.3 纳什均衡 2.4 计算纳什均衡 2.5 纳什均衡应用举例. 2.1 基本概念. 完全信息静态博弈 有两层含义: 1. 完全信息的 2. 静态的. 例如: 1.guess coin 2.prisoners’dilemma 3.boxed pigs 4.Chicken game 5. 石头剪子布的博弈 6. 田忌赛马 7 . 无限策略博弈 ( 古诺博弈 ).
E N D
Ch1.完全信息静态博弈-纳什均衡 南京理工大学经管院应用经济系 劉琦 njust326@yahoo.com.cn 南京理工大学经管院应用经济系 劉琦
主要内容 2.1基本概念 2.2优势策略 2.3纳什均衡 2.4计算纳什均衡 2.5纳什均衡应用举例 南京理工大学经管院应用经济系 劉琦
2.1基本概念 • 完全信息静态博弈 • 有两层含义: • 1.完全信息的 • 2.静态的 • 例如: 1.guess coin 2.prisoners’dilemma 3.boxed pigs 4.Chicken game 5.石头剪子布的博弈 6.田忌赛马 7 .无限策略博弈(古诺博弈) 南京理工大学经管院应用经济系 劉琦
完全信息与不完全信息 • 完全信息博弈: 各博弈方都完全了解所有博弈方各种情况下的支付 • 不完全信息博弈 至少部分博弈方不完全了解其他博弈方支付情况的博弈 南京理工大学经管院应用经济系 劉琦
完美信息与不完美信息 • 完美信息博弈 每个轮到行为的博弈方对博弈的进程完全了解的博弈 • 不完美信息博弈 至少某些博弈方在轮到行动时不完全了解此前全部博弈的进程的博弈 例如: 南京理工大学经管院应用经济系 劉琦
静态博弈与动态博弈 静态博弈是指: 所有博弈方同时或可看作同时选择策略的博弈 —田忌赛马、猜硬币、古诺模型 动态博弈是指: 各博弈方的选择和行动又先后次序且后选择、后行动的博弈方在自己选择、行动之前可以看到其他博弈方的选择和行动 —弈棋、市场进入、领导—追随型市场结构 南京理工大学经管院应用经济系 劉琦
Case2.prisoners’dilemma 囚犯2 • 博弈方:囚犯1、2 • 可选策略:坦白与不坦白 • 几乎同时决策 • 所得利益:若两人同时坦白各判5年; • 若一个坦白一个不坦白,坦白放人,不坦白被判8年; • 若两人同时不坦白各被判1年。 不坦白 坦白 不坦白 坦白 囚犯1 南京理工大学经管院应用经济系 劉琦
完美博弈 N 大 小 A A 开发 不开 开发 不开 B B B B (4,4) (8,0)(0,8)(0,0)(-3,-3)(1,0)(0,1)(0,0) 南京理工大学经管院应用经济系 劉琦
不完美博弈 N 大 小 A A 开发 不开 开发 不开 B B B B 开发 不开 开发 不开 开发 不开 开发 不开 (4,4) (8,0)(0,8)(0,0)(-3,-3)(1,0)(0,1) (0,0) 南京理工大学经管院应用经济系 劉琦
2.2优势策略 又称占优策略,或者上策. 即不管其它博弈方选择什么策略,一博弈方的某个策略给他带来的支付始终高于其它的策略,至少不低于其他策略的策略. 占优均衡:一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,必然是该博弈比较稳定的结果 例如:囚徒困境博弈 南京理工大学经管院应用经济系 劉琦
囚犯2 8 囚犯1 8 5 -5 例如 优势策略均衡 南京理工大学经管院应用经济系 劉琦
定义 南京理工大学经管院应用经济系 劉琦
重要的概念就是优势策略均衡 南京理工大学经管院应用经济系 劉琦
从数学上讲,就是: 南京理工大学经管院应用经济系 劉琦
符号说明 南京理工大学经管院应用经济系 劉琦
对于许多从未接触过博弈的人来说 --囚徒困境看起来既荒谬又不现实 南京理工大学经管院应用经济系 劉琦
特别注意的是 • 并不是所有的博弈均衡都是占优均衡 例如,智猪博弈 南京理工大学经管院应用经济系 劉琦
2.3纳什均衡 • 个案 • 多重纳什均衡 • 纯策略纳什均衡 • 随机策略的纳什均衡 • 强、弱纳什均衡 南京理工大学经管院应用经济系 劉琦
纳什均衡的定义 南京理工大学经管院应用经济系 劉琦
其中 南京理工大学经管院应用经济系 劉琦
纳什均衡的一致预测性质 一致预测:如果所有博弈方都预测一个特定博弈结果会出现,所有博弈方都不会利用该预测或者这种预测能力选择与预测结果不一致的策略,即没有哪个博弈方有偏离这个预测结果的愿望,因此预测结果会成为博弈的最终结果 • 只有纳什均衡才具有一致预测的性质 • 一致预测性是纳什均衡的本质属性 • 一致预测并不意味着一定能准确预测,因为有多重均衡,预测不一致的可能 南京理工大学经管院应用经济系 劉琦
Case.boxed pigs 小猪 求解这个博弈问题: 1.下划线法 2.重复剔除严格劣策略 纳什均衡:(按,等待) 按 等待 大猪 按 等待 这个博弈有优势策略均衡? 南京理工大学经管院应用经济系 劉琦
Case.建模者困境 南京理工大学经管院应用经济系 劉琦
困境之所在 • 从这个博弈均衡上看,有两个: • 一个是(坦白,坦白),毫无疑问这是一个重复剔除的优势策略均衡,是一个强纳什均衡。 • 而另一个则是(抵赖,抵赖),这是一个弱的纳什均衡。 • 虽说(抵赖,抵赖)是一个弱纳什均衡,但它的结果却是具有PARETO优势的。 • 因此如果这个博弈是序贯博弈,而建模者又将秩序弄错,那么这个结果也会变得更为可取。 • 这里的关键是给预测均衡带来难度。 南京理工大学经管院应用经济系 劉琦
建模者困境提示了研究人员面临的一个难题-----当存在两个均衡时如何预测?建模者困境提示了研究人员面临的一个难题-----当存在两个均衡时如何预测? • 建模者 • 要么在博弈规则中增加更多细节; • 要么诉诸于均衡精练方法 • 均衡精练:即在基本的均衡定义中增加条件,直到只有一个策略组合符合均衡定义为止 • 建模者也可以就以PARETO条件作为唯一判断标准,这样唯一的均衡只有(抵赖,抵赖)。 南京理工大学经管院应用经济系 劉琦
三 Case.性别战 南京理工大学经管院应用经济系 劉琦
参与人如何知道选择哪一个均衡? • 性别战中不存在重复剔除优势策略均衡; • 这有两个均衡; • 纳什均衡强调参与人的信念是正确且一致 • 如果两个事先不通气,可能会出现误会对方 • 在不通气的情况下,两个均衡中有一个会出现吗? • 重复博弈 • 即,在不通气的情况下,两个当事人每天重复一次这样的博弈,最后会达成信念一致的 南京理工大学经管院应用经济系 劉琦
帕累托有效 • 博弈的一个结果是帕累托有效(Pareto efficient),当且仅当不存在另一个能使所有参与人的状况更好的结果。 • 囚徒困境可以说是一个存在帕累托改善(或者说无效均衡)的例子。 南京理工大学经管院应用经济系 劉琦
聚点理论 南京理工大学经管院应用经济系 劉琦
参与人事前沟通 • 这是能够使参与人能够聚焦于某一均衡的途径 -------事前沟通 例如,在性别战之前,当事人1对当事人2说:我从明天在拳击场门口见面,那么我们可以很好地预期他们会实现(拳击,拳击)的均衡。 当然,这种局前沟通可以作为模型的一个部分。 南京理工大学经管院应用经济系 劉琦
NE的哲学思想 • 纳什均衡是博弈的结局,它指博弈中每个局中人均不能因单方面改变自己的策略选择而获益。 • 纳什均衡是一个僵局:给定别人不动的情况下,没有人有兴趣动。 • 纳什均衡可以理解为一种具有自我强制力的协议,即这种协议没有外加力量保证实施却使每个参与者都自愿遵守,原因就在背叛协议无利可图。 南京理工大学经管院应用经济系 劉琦
“当事人会自觉遵守这个协议”,等于说这个协议构成一个NE:即给定别人遵守协议的情况下,没有人有积极性偏离这个协议规定的自己的行动准则“当事人会自觉遵守这个协议”,等于说这个协议构成一个NE:即给定别人遵守协议的情况下,没有人有积极性偏离这个协议规定的自己的行动准则 • 如果一个协议不构成NE,它就不可能自动实施,因为至少有一个参与人会违背这个协议,不满足NE要求,这个协议是没有意义,这就是NE的哲学思想。 南京理工大学经管院应用经济系 劉琦
NE的正式定义 • G={S1,…Sn;u1…un}是个n人博弈, 策略组合s*=(s1*,…,si*,…,sn*)是一个NE, 如果对每一个i,si*是给定其他参与人选择 s-i*=(s1*,…s-1*,si+1*,…sn*)的情况下第i个参与人的最优策略,即: ui(si*,s-i*) ≥ ui(si,s-i*) si∈Si,对所有的i 则s*=(s1*,…,si*,…,sn*)是NE。 这是一个弱纳什均衡(weakly NE)定义。 南京理工大学经管院应用经济系 劉琦
NE有强弱之分 • Strict or strong NE,如果给定其他参与人的策略,每一个参与人的最优选择是唯一的,就是说, s*=(s1*,…,si*,…,sn*)是一个strict NE, 当只当对于所有的i,si’ ≠ si*, ui(si*,s-i*) > ui(si’,s-i*) 则s*=(s1*,…,si*,…,sn*)是一个Strict NE。 南京理工大学经管院应用经济系 劉琦
2.4计算纳什均衡 • 划线法-有限策略博弈的解法 • 反应函数-无限策略博弈的解法 • 重复剔除严格劣策略 或严格下策反复消去法 • 混合策略 南京理工大学经管院应用经济系 劉琦
下列博弈问题的解 • 如果以划线法解上述博弈问题,则发现: • 猜硬币——无解 • 囚徒的困境——有唯一稳定的解 • 智猪博弈——有一个解 • 斗鸡博弈——有两个解但不唯一 • 石头剪子布的博弈——无稳定解 • 齐威王与田忌赛马——无稳定解 南京理工大学经管院应用经济系 劉琦
反应函数法 以Cournot Model为例 • 古诺寡头模型中(需求函数:p=a-Q,其中Q= q1+q2) • 两厂商为博弈方1,2 • 可选择策略: 产量q1、q2 (无限策略型) • 支付函数为: u=pq-cq=(p-c)q • 如果假设a=8,c=2,则有 • u1(q1,q2)=6q1-q1q2-q12 • u2 (q1,q2)=6q2-q1q2 -q22 南京理工大学经管院应用经济系 劉琦