《博弈论及其应用》（汪贤裕）

博弈论及其应用 第4 章协调与谈判《博弈论及其应用》（汪贤裕）

第四章协调与谈判 • 主要内容 • §4.1 协调博弈 • 　§4.2 相关均衡 • 　§4.3 纳什谈判解 • 　§4.4 初始参考点和其它谈判解 • 　§4.5 威胁

§4.1 协调博弈 §4.1.1 多重纳什均衡 §4.1.2 协调博弈

§4.1.1 多重纳什均衡 ※ 多重纳什均衡 ※ 多重纳什均衡的一些选择标准

多重纳什均衡 当一个博弈中存在有不止一个纳什均衡时，称为一个多重纳什均衡博弈问题。两个基本问题： • 一、选择标准 • 二、如何保证局中人的策略选择能保证所选策略能实现纳什均衡

多重纳什均衡的一些选择标准 1.帕累托占优纳什均衡 2. 风险占优纳什均衡 3. 聚点均衡

帕累托占优纳什均衡 定义4.1.1 在博弈中，若均为G的其纳什均衡，若满足则称为博弈G的帕累托占优纳什均衡。例4.1.1 战争与和平博弈纳什均衡：（战争，战争）、（和平，和平）和一个混合策略纳什均衡。帕累托占优纳什均衡: (和平，和平）

风险占优纳什均衡 例4.1.2 价格竞争博弈： • 纳什均衡点：（高价，高价）、（低价，低价）和一个混合策略纳什均衡点。 • 经过比较，（高价，高价）是一个帕累托占优纳什均衡。但是纳什均衡（低价，低价）对商家更有吸引力。

风险占优纳什均衡(续) • 纳什均衡：（高价，高价）和（低价，低价）是两个纯策略纳什均衡点，（高价，高价）是帕累托占优纳什均衡。但此时商家一定会出“低价”策略，而避免出“高价”策略的风险。在这个博弈中，我们称（低价，低价）为该博弈的“风险占优纳什均衡”。 • 风险占优纳什均衡难以给一个准确的定义，它取决于局中人的风险态度，历史情况，外来影响等多种因素，只能具体情况具体分析。

聚点均衡 在多重均衡的博弈中，有一致意向选择的均衡为“聚点均衡”，它取决于该博弈之外的特定环境。夫妻爱好问题纯策略纳什均衡分别是（足球，足球）和（芭蕾，芭蕾）。不存在上述的帕累托占优纳什均衡，也不存在风险占优纳什均衡，其均衡选择依赖于该博弈之外的特定环境。如果丈夫工作劳累，妻子温柔体贴，他们会选择（足球，足球）；如果该周末正好是妻子的生日，他们会选择（芭蕾，芭蕾）

例4.1.3 约会博弈 现有两个人约定第二天就一项重要事宜进行商讨，但未给出具体时间。一旦约会成功，两人都会有收益，约会不能见面会误事，收益为负效应。假设第一人在时刻到达，而第二个人在时刻到达。显然当时，是纳什均衡点，这种纳什均衡点有无穷多个。在多重均衡的博弈中，聚点均衡只能具体问题具体分析

§4.1.2 协调博弈 ※ 多重均衡的博弈的两个难题 ※ 协调博弈的分类 ※ 纯粹协调博弈的特征 ※ 博弈论专家对实现协调有一些共同的看法

多重均衡的博弈的两个难题 • 第一个难题当理性的局中人面临着多种策略可以达到均衡时，如何使所有局中人在策略选择上实现纳什均衡的一致性，即使每个局中人的选择结果而组成的策略组合是一个纳什均衡。 • 第二个难题在多重均衡中，存在有社会最优的帕累托占优纳什均衡，如何使所有的局中人选择策略，使得组成的策略组合是一个帕累托占优纳什均衡。

协调博弈的分类 • 协调博弈的分类:纯粹协调博弈和非纯粹协调博弈 • 纯粹协调博弈：局中人对不同的均衡有相同的偏好。（例4.1.2） • 非纯粹协调博弈：局中人对不同的均衡有不同的偏好。（夫妻爱好博弈）

纯粹协调博弈的特征 例4.1.4 Cooper的协调博弈设有两个局中人A和B，两人从事同一种生产。局中人努力的情况为。假设人均消费量为　每个人的得益为　得益矩阵：（1，1）是风险占优均衡，（2，2）是帕累托占优纳什均衡。

纯粹协调博弈的特征 • 策略的互补性：有一个局中人选择了帕累托占优纳什均衡中的策略，能增加另一方选择帕累托占优纳什均衡中策略的边际收益。这种具有正反馈的特征称之为策略的互补性。 • 对纯粹协调博弈，（下面简称协调博弈）的研究大多采用实验博弈的方法进行

纯粹协调博弈的特征 • CG（Cooperation Game）的得益矩阵： • 纯策略纳什均衡{1，1}和{2，2}，其中{1，1}是风险占优均衡，{2，2}是帕累托占优纳什均衡库珀（Cooper）实验选择了11个人，每人均与其余人进行上述得益矩阵下的两次博弈，其博弈顺序不是公共的知识。若每次博弈完后，则按上面得益矩阵计分。当实验全部结束后，参与人按所得的分数进行奖励。

纯粹协调博弈的特征 • 实验结果表明，自然协调成功的情况不存在——风险占优在该博弈中的指导作用要好于帕累托占优。 • 类似的2人协调博弈实验:取所取得局中人的得益函数为其中:　为局中人的策略，取值为自然数序列这些实验都与库珀对CG-2×2的博弈实验有类似结论

纯粹协调博弈的特征 例4.1.6 CG-3×3协调博弈：CG的意义同例4.5，3×3是指一个2人3策略的非合作博弈。得益矩阵： • 库珀通过改变参数x和y的取值，实验局中人对这些参数的理解和对均衡的影响。三个最典型的实验：情形1：（x，y）=（1000，0）情形2：（x，y）=（700，1000） • 这两种情况下，策略组合{1，1}和{2，2}都是纯策略纳什均衡，且{1，1}是风险占优均衡，{2，2}是帕累托占优纳什均衡。

纯粹协调博弈的特征 实验的结果：（1）博弈的结果基本上都是纳什均衡；（2）在情形1中，多数结果是{1，1}风险占优均衡；在情形2中，多数结果是{2，2}帕累托占优纳什均衡。 • 情形3：（x，y）=（700，650）。 {3，3}仍然是次优的策略组合。对策略{3}，局中人的最优反应是策略{1}。但实验结果表现为均衡{2，2}结果。库珀得到“没有出现完全和这些结果一致的解释”。这里的“这些结果”是指上面提出的，寻求次优策略的最优反映导致了均衡结果的选择。

博弈论专家对实现协调有一些共同的看法 1. 博弈前的交流。假定在博弈前，局中人可以向对方传递信息，但这一信息并不约束局中人在博弈中对策略的选择。这类博弈通常称为廉价商议（cheap talk）博弈。

博弈论专家对实现协调有一些共同的看法 2. 外部建议 • 假设在博弈前，存在一个局中人之外的建议者，他对局中人的策略选择给出建议。范·海克（Van Huyck）等人对下面三个博弈进行了外部建议的实验。（a）（b）　　　　（c） • 表4.17（a）：收到外部建议之前—40%在纯策略纳什均衡上协调成功给出外部建议时—协调成功的概率是95%

博弈论专家对实现协调有一些共同的看法 表4.1.7（b）：1未收到外部建议之前—98%的博弈实验结果是纳什均衡（1，1） 2外部建议选取均衡{3，3}时 —17%的局中人接受了建议 3外部建议选取{2，2}时—有75%的局中人接受了建议结果表明——当建议不符合局中人利益时，局中人并不接受建议表4.1.7（c）：1未收到外部建议之前—70%的博弈实验结果是纳什均衡（2，2） 2外部建议者给出一个{1，1}均衡（或{3，3}均衡）建议时—实验博弈的结果与建议相符的只有16% 结果表明——若外部建议不是帕累托占优纳什均衡时，建议无效

博弈论专家对实现协调有一些共同的看法 3. 外部选择：假定在协调博弈之前增加一个对博弈之外的选择，再进行协调博弈，会增加协调成功的可能性。 • 库珀对CG-2×2协调博弈（即例4.1.5）实验—— 77%的博弈结果是{2，2}帕累托占优纳什均衡，只有2%的博弈结果是{1，1}风险占优均衡。 • 范·海克对CG-2×2协调博弈进行了实验—— 几乎所有的结果都是{2，2}帕累托占优纳什均衡。

§4.2 相关均衡 ※ 相关均衡 ※ 事前沟通的两个例子 ※ 相关均衡是一种机制设计的思想

相关均衡 纳什均衡的异议：纳什均衡没有考虑均衡的效率（静态博弈的纳什均衡中）例如，在例4.1.6，CG-3×3协调博弈中，无论（x，y）取什么样的数对， {1，1}和{2，2}都是纯策略纳什均衡点，而博弈中效率最高的结果（600，600）是策略组合{3，3}的结果。如何实现效率最高的策略组合？相关均衡

事前沟通的两个例子 1 夫妻爱好博弈—— 纯策略纳什均衡：（足球，足球）和（芭蕾，芭蕾）。静态博弈中——策略选择结果未必是纳什均衡。一个约定抛一硬币，若正面向上，在博弈中，双方都选择{足球}策略；若反面向上，在博弈中，双方都选择{芭蕾}策略。根据博弈前双方的约定，保证了博弈的结果是一个纯策略纳什均衡。

事前沟通的两个例子 2 广告博弈设有两个商家出售同一种商品。为了促进商品的销售，可以进行广告宣传，但做广告需要成本。假设两个商家都做广告，肯定双方都有收益；都不做广告，则双方都无收益；若有一个商家做广告，而另一家不做，则做广告的商家独自承担成本，但另一个商家则坐享广告带来的好处。两商家分别是1和2，策略集都是 {做广告，不做广告}，收益情况如右图纳什均衡：　{做广告，不做广告}，{不做广告，做广告}和。前两个是纯策略纳什均衡。混合策略纳什均衡的结果是

事前沟通的两个例子 博弈的约定：约定1 ：抛一枚硬币，若正面向上，采用（做广告，不做广告）策略组合；若反面向上，采用（不做广告，做广告）策略组合。由于抛硬币时出现正面和反面的概率都是一样的，则每个商家得到的期望收益为：约定2：选择一个博弈的局外人，按下面三步确立每个商家的策略选择：

事前沟通的两个例子 　第一步，局外人在{A,B,C}中随机地任取一个字母，然后进入下一步；第二步，若局外人选取是A则通知商家1，不通知商家2；，若局外人选取是B，则通知商家2，不通知商家1；若局外人选取是C则两个商家都不通知，然后进入第三步；第三步，若商家1得到通知，则选择{不做广告}，否则选择{做广告}，若商家2得到通知，则选择{不做广告}，否则选择{做广告}。约定的结果：（1）局外人选取A，则有策略组合{不做广告，做广告}，导致一个纳什均衡的出现；（2）局外人选取B，则有策略组合{做广告，不做广告}，导致一个纳什均衡的出现；（3）局外人选取C，则有策略组合{做广告，做广告}，导致一个次优策略组合出现；

事前沟通的两个例子 由第一步的选取是等可能的，则选取A，B和C的概率分别是，因而商家的期望收益为：。广告博弈中的博弈前约定满足下面两个要求： 1. 约定是公平合理的，双方都愿意接受； 2. 在约定的要求下，没有人愿意单独的违背约定，否则可能导致自己得益的损失。上面两个条件的约定实际上是博弈中局中人策略选择的理性规定，称之为博弈的相关均衡。

事前沟通的两个例子 例4.2.1中两种约定的比较—— 1 根据博弈的得益结构情况看：第一种约定比第二种约定的结果要好些 2 将得益结构作如下变化：约定2要比约定1好。（提示：）

相关均衡是一种机制设计的思想 博弈的相关均衡的确立是一种机制设计的思想，这种机制设计满足纳什均衡的思想，这种机制设计必须使博弈的局中人对博弈有足够的理解和相互的信任，因为约定是没有法律效力的。适用于相关均衡的博弈分析必须是局中人的收益情况是对称的，这才能保证约定的公平合理。

§4.3 纳什谈判解 ※ 纳什谈判解的实质 ※ 二人谈判问题 ※ 谈判过程 ※ 纳什公理体系 ※ 纳什谈判解的定义 ※ 纳什谈判解的三个定理 ※ 三个定理的说明 ※ 例题4.3.1 ※ 例题4.3.2

纳什谈判解的实质 1 纳什谈判解又称为纳什讨价还价解 2 纳什谈判解(1950,纳什)——从非合作博弈向合作博弈的演变这里的合作博弈具有非线性的可转移支付。如何使局中人能得到的收益达到公平合理，纳什给出了纳什公理体系，并推导出纳什解的结果。

二人谈判问题 设有一个二人有限策略的完全信息静态博弈，即双矩阵博弈。局中人1取混合策略，局中人2取混合策略集，局中人1和2的支付矩阵分别是A和B，即。当局中人1取策略局中人2取策略　时，局中人1和2的得益分别为: 　记两人所得为，并考虑到可用抽彩方式决定两人的收益，且抽彩结果是线性的，则两个局中人的得益是中一个有界闭凸子集，记并称为结果集或可达集。即任何表示两个局中人可以共同行动，分别获得收益。一般地讲，在可达集的帕累托边界上，一个局中人得到的多一些，另一个局中人得到的就少一些。那么一个局中人能同意让对方得到多少呢？给对方少一些所得，对方是否会接受呢？这构成了两个局中人的谈判问题。

谈判过程 初始参考点，设为（共同知识）　　　　　　　　　　　（4.3.1）（4.3.2）显然由（4.3.1）和（4.3.2）式确立的是可以达到博弈结果集的，即。局中人注意到往往是的一个内点，他们想以为谈判的初始点，在中寻找比更高的收益，并且是双方都能接受的，记为，并称为纳什谈判解。则谈判过程可以抽象地记为：　　　　　　　　　　　　　　　　　（4.3.3）

纳什公理体系 公理1（个体合理性）；公理2（可行性）；公理3（帕累托最优性）若，且，则公理4（无关方案的独立性）若，则公理5（线性变换的无关性）若，且，则。公理6（对称性）如果对任意，都有，　　　　　　　　若，则

纳什谈判解的定义 定义4.3.1满足上述纳什公理体系下的称为纳什谈判解（Nash bargaining solution）。

纳什谈判解的三个定理 定理4.3.1若是有界的闭凸集，为谈判初始点。若有满足，则下面的规划有唯一的最优解：　　　　　　　　　　　　　　　　　（4.3.4）定理4.3.2若是定理4.3.1条件下的最优解，令函数（4.3.5）则有。定理4.3.3设2人谈判问题的结果集为凸集，是初始参考点，则存在唯一满足公理1到公理6的函数。证明过程：定理4.3.1见定理4.3.2见定理4.3.3 见

定理4.3.1的证明 • 最优解的存在性。由于显然是有界的闭集，因此连续函数在此集合上必有最优值和最优解。 • 最优解的唯一性。反证法。设有和都是最优解且　，不妨假定　设　　　　　　　　　　　　　由于是凸集，。于是　显然，。这与和都是最大值点矛盾。故的最大值点是惟一的。

定理4.3.2的证明 采用反证法。设存在有，使得。令（4.3.6）因为是凸集，因此。此时（4.3.7）由假设，有（4.3.8）在（4.3.7）式中当，最后一项可以忽略。并由（4.3.8）式有。（4.3.9）但是这与是的最大值点矛盾。故　有

定理4.3.3的证明 令是定理3.4.1所得的最优解。下面证明满足公理1到公理6。显然，满足公理1和2。又因为如果　且，那么。因此，它满足公理3。它同时满足公理4，这是因为如果它是在上的最大值点，它一定也是　上的最大值点。令　，。此时（4.3.10）因此，当是的最大值点时，亦是的最大值点。所以满足公理5。最后，它也满足公理6。因为，如果是对称的，并且，我们易知：，而　　是　　　唯一的最大值点，因此，也就是说。

定理4.3.3的证明（续） 验证满足　　　纳什公理体系的解的唯一性—— 　　　　　如上定理4.3.1所得的最优解，考虑如下集合（4.3.11）因为　　　　为定理4.3.1的最优解，由定理4.3.2，。考虑从到的一个线性变换：（4.3.12）由于　，即也即：由定理4.3.1假设可知，，从而　　于是，

定理4.3.3的证明（续） 此时，由（4.3.12）式有　。又因为是对称的，根据公理6可知，讨价还价解一定在　线上。根据公理3 ，它即为点　　　　根据上述线性变换的反变换，由公理5可知，一定是　的解。因为，根据公理4，也是　　　　　　的解。而这个问题的最优解是唯一的，所以是　　　唯一最优解。当定理4.3.1的条件不成立时，有两种情况：　　在第一种情况里，取。此时从公理1至公理3可以看出不存在其它的解，且满足从公理1到公理6也只有这样的唯一解。在第二种情况里，取。此时从公理1至公理3可以看出不存在其它的解，且满足从公理1到公理6也只有这样的唯一解。

三个定理的说明 定理4.3.3表明，满足纳什公理体系的谈判解是存在的，并且由定理4.3.1可知，它即是函数在中求最大值时的最优解。满足纳什公理体系（公理1—公理6）的纳什谈判解也简称为谈判解，有的教材也称为纳什解。对定理4.3.2进行分析：根据该定理，对有。若取等号，即有：（4.3.13）上式右端是一个常数，因此上式是上的一条直线，对于任意中的点都在该直线的左下方。

三个定理的说明 当结果集的边界是光滑的，该直线是的切线，且切点在点。再从（4.3.13）式看，该直线的斜率为：而连接和直线斜率为，正好是上式的相反数同时，反映了在谈判过程中，两个局中人可以接受的效用转换率。当两个局中人在谈判中的效用转换率为1：1时，（）问题变得更简单。例如，两人谈判问题的结果集在直线的左下方。

三个定理的说明 若初始参考点为，则纳什谈判解为　根据公理3，讨价还价问题的解一定在　的子集上。因为是凸的，因此是这些的点：不存在一个，使得并且。我们称为帕累托最优边界。图4.3.3 图4.3.4

三个定理的说明 定理4.3.2给出了初始参考点和纳什谈判解点之间特殊的关系。初始参考点与纳什谈判解的连线的斜率与过该谈判点的的支撑线的斜率互为相反数。如果的帕累托最优边界是光滑的，那么这条支撑线其实就是过谈判点的切线。如图4.3.3所示，若T是初始参考点，P是纳什谈判解，则TP的斜率与过P点的切线的斜率互为相反数。在TP上任意一点U作为初始谈判点，其纳什谈判解仍是P点。

三个定理的说明 对于双矩阵博弈来说，是一个封闭的有限的多边形，其帕累托最优边界为折线ABCD，如图4.3.4所示。若的斜率等于BC斜率的相反数，则对上任一点U，作为初始谈判点，那么它们的纳什谈判解都是。对于像过C点在上，左右“切线”的斜率不相等的点，则若初始谈判点在（斜率等于过C点在上左“切线”的斜率的相反数）上，在（斜率等于过C点在上右“切线”的斜率的相反数）上或在它们与所围的区域之内，对应的纳什谈判解仍是C点。

《博弈论及其应用》 （汪贤裕）