当前位置：搜档网 › 博弈论练习题标准答案

博弈论练习题标准答案

博弈论练习题2答案

————————————————————————————————作者：————————————————————————————————日期：

111111111111111111

博弈论练习题（四）

一、什么是子博弈精炼纳什均衡？

答：将纳什均衡中包含的不可置信的威胁策略剔除出去。它要求参与者的决策在任何时点上都是最优的。由于剔除了不可置信的威胁，在许多情况下，精炼纳什均衡也就缩小了纳什均衡的个数。只有当参与人的策略在每一个子博弈中都构成纳什均衡叫做精炼纳什均衡。或者说，组成精炼纳什均衡的策略必须在每一个子博弈中都是最优的。

二、参与人的理性问题对动态博弈分析的影响是否比静态博弈的影响更大？为什么？

答：正确，博弈论要求个体具有始终追求自身利益最大化的理性意识和理性能力的“自我”

个体理性，这是静态博弈的范畴。除此之外，还要求相关的参与者具有层次较高的“交互理性”，要求不同个体之间在理性和行为方面具有一种“默契”。即，人们的自身利益的最大化不仅取决于自己的选择，还取决于与之相关的其他人的选择与行为，那么为了实现自己的最大利益，个体的理性决策就必须考虑他人的理性选择与行为。作为博弈论的基础，交互理性是其基本的理性要求。博弈论还要求有关博弈的结构、各个博弈参与者的得益函数以及各个博弈参与者的理性等“知识”是所有博弈参与者之间的“共同知识”。也就是，每个博弈参与者不仅要首先明确自己和其他参与者所有可选的策略，还需知晓各种情况下自己最终的收益或其概率分布，并且每个博弈参与者都知道各个参与者掌握这些信息；更为重要的是，每个博弈参与者都知道所有参与者都是理性的，都知道其他博弈参与者知道所有参与者都是理性的，都知道其他博弈参与者知道其他博弈参与者知道所有博弈参与者都是理性的------。理性的共同知识假设是非合作博弈理论的一个非常重要和关键的假设，是实现交互理性和理性主义的纳什均衡的基本前提，这些，都是动态博弈的范畴。因此说，参与者理性问题对动态博弈的分析影响更大。

三、纳什均衡和精炼纳什均衡存在哪些问题？

答：纳什均衡存在的问题：

(1)不是所有博弈都存在纳什均衡如纯策略就不存在混合策略则一定会存在纳什均衡，它是通过概率来计算纳什均衡，在这种均衡下，给定其他参与人的策略选择概率，每个参与人都可以为自己确定选择每一种策略的最优概率。

(2)在论及纳什均衡时，我们假设参与人是完全理性的，而且是假定参与人之间不允许达成任何协议的非合作博弈的均衡解。而现实并非如此。

精炼纳什均衡存在的问题：有限重复博弈的子博弈精炼纳什均衡有如下定理∶令G是阶段博弈，G（T）是重复T次的重复博弈。那么，如果G有唯一的纳什均衡，重复博弈G（T）的唯一子博弈精炼纳什均衡结果是阶段博弈G的纳什均衡重复T次。这个定理成立的条件是单阶段纳什均衡的“唯一性” ，若纳什均衡不是唯一的，上述定理的结论就不一定成立。

四、有限次重复博弈和无限次重复博弈有什么区别？这些区别对我们有什么启发？

答：有限次重复博弈与无限次重复博弈都属于动态博弈，对于有限次博弈，收益是每次收益的简单相加，可以采取子博弈纳什均衡的方法求解，即逆推法；但无限次博弈却不能采取；此外，有限次博弈中博弈的双方都还是关注的是自己短期的利益，而无限次博弈中博弈的双方可能针对某项事情达成协议，达到共谋，为共同的利益而选择自己的行动，达到整体的最优，供应链契约即类似。

五、有限次重复博弈的精炼纳什均衡的最后一次重复必定是第一阶段博弈的一个纳什均衡？答：

博弈重复次数有限，意味着存在所有参与人都可以预测到的“最后一次”。在最后的阶段博弈中，如果某一参与人选择了自己的占优战略，给其他参与人造成损失，则其他参与人不可能报复。所有的参与人都明白这一点，因而在最后一次阶段博弈中都会选择占优战略，换句话说，在给定最后阶段所有参与人都会选择占优战略的前提下，所有的参与人在倒数第二阶段的博弈中也都会选择占优战略。由此从最后的阶段开始，逐个阶段进行推理，可以得出以下结论：在阶段博弈有唯一的纳什均衡时，有限次重复博弈的唯一子博弈精炼纳什均衡结果，是阶段博弈的纳什均衡重复。这就是说，每个阶段博弈出现的都是一次性博弈的均衡结果。

六、无限次重复博弈均衡解的得益一定会优于原博弈均衡解的得益吗？

答：不一定。例如：无限次重复博弈的古诺博弈，此博弈是相同博弈重复无限次，当冷酷战略是整个博弈的纳什均衡时，当然也就是每个阶段的纳什均衡。此时，无限次重复古诺博弈的冷酷战略已意味着是两厂商在两种战略间进行选择的囚徒困境博弈，一是选择生产垄断产量的一半Q/2，另一是选择生产背叛产量时，冷酷战略是无限次重复古诺博弈的一个子博弈精炼纳什均衡。贴现因子较大说明未来的利益较大，对两厂商都有较大的吸引力，一般情况下，两厂商不会为了短期利益而背叛对方而失去较大的长远利益，即两厂商都有坚持冷酷战略的积极性。而当时，意味着冷酷战略不再是一个子博弈精炼纳什均衡。贴现因子较小说明未来的利益对两厂商都不具有吸引力，选择背叛才是两厂商的最优选择。这种条件下，博弈无限次重复也不能提高一次性博弈的得益。

七、触发战略所构成的均衡都是子博弈精炼纳什均衡吗？

答：“触发战略”是这样一种战略∶首先试探合作，如果对方合作，则给予奖励；如果对方不合作，则给以惩罚。在原博弈有多个纳什均衡的条件下，在重复博弈时，通过触发战略提高了双方的收益。首先，在第二次博弈时意味着该博弈结束，而均衡结果是原博弈的纳什均衡，双方都没有偏离的意愿；其次，第一次选的策略虽不是原博弈的纳什均衡，如果某一方偏离会增加收益，但这样会遭到对方第二次选另外的策略的惩罚而损失收益，使总得益减少。预见到这一点，只顾眼前不顾长远的偏离是得不偿失的事，因此双方会坚持选使总收益最大的策略。所以，触发战略构成的均衡都是子博弈精炼纳什均衡。

八、什么是冷酷战略？什么是针锋相对战略？什么是最小最大战略？

答：冷酷战略也称为触发战略，这种战略做法是∶

1、参与人在博弈开始时均选择合作；

2、只要对方一直选择合作，则继续合作下去，但当某一时刻对方选择了不合作，则一直永远选择不合作来惩罚对方的背叛行为。

针锋相对战略：参与人在博弈开始时选择合作；在时期t选择对方在时期t-1期所采用的战略，即如果对方在t-1期背叛（不合作），则自己在t期也选择背叛。

最小最大战略：最小最大战略是指当违规者不采取合作行为而对他进行惩罚时，违规者可能得到的最严厉的制裁的战略（相应的，违规者为了减少惩罚对自己的影响，而使自己得益最大的战略。

练习题（五）

一、若你正在考虑收购一家公司的一万股股票，卖方的开价是2元/股。根据经营情况的好

坏，该公司股票的价值对你来说有1元/股和5元/股两种可能，但只有卖方知道经营的

真实情况，你只知经营好、坏的概率各为0.5。如果公司经营不好时，卖方做到使你无

法识别真实情况的“包装”费为5万元，你是否会按卖方的价格买下这些股票？如果

“包装”费仅为0.5万元，你会如何选择？

答：当卖方使买房无法识别真实情况的包装费为5万元时，买方的股票价值期望值为

E=0.5 ×﹙1-5﹚+0 .5×5=0.5元/股

在这种情况下，无法接受卖方给出的价格

当卖方的包装费为0.5万元时，买方的股票价值期望值为

E=0.5 ×﹙1-0.5﹚+0 .5×5=2.75元/股

在这种情况下，接受卖方给出的价格

二、现实生活中常常是既有部分卖假冒伪劣产品的厂商会打出“质量三包”、“假一罚十”等

旗号，也有一些卖假冒伪劣产品的厂商声明“售出商品概不退换”。问这两类厂商有什

么不同，他们各自战略的根据是什么？

答：第一类厂商实行战略的根据是：“最大最小战略”，根据无限次重复博弈中的子博弈精炼

纳什均衡实际上是参与人相互合作的结果，要使合作成功，其战略中必须要有惩罚措施。所

谓最小最大战略是指当违规者不采取合作行为而对他进行惩罚时，违规者可能得到的最严厉

的制裁的战略。

第二类厂商采取战略的根据是：“冷酷战略”，任何为了短期利益的背叛行为的所得对长

期利益而言都是微不足道的，且会遭到对方一直背叛的冷酷打击，故参与人有积极性为自己

建立一个乐于合作的声誉，同时也有积极性惩罚对方的背叛行为。

三、在有两个投标者的暗标拍卖中，投标者的估价独立分布于[0，1]且两人的估价相同，则

贝叶斯纳什均衡是什么？博弈的结果是什么？如果两投标者知道他们的估价是相同的，

结果会发生什么变化？

解：两个人投标人为i ，j,投标者i 的支付如下：

最终解得，拍卖的对称贝叶斯均衡战略为∶

同理可得，对投标人j 也可得到相同的结论

即，在只有两个投标人时，这个博弈的贝叶斯均衡是，每个投标人的出价是其实际价值的一

半。

如果两个投标者知道他们的估价相同，即信息是完全的，买者之间的竞争将使卖者得到买者

价值的全部。

四、“说实话”的直接机制能保证博弈方都按他们的真实类型行为并获得理想的结果。

答：“说实话的直接机制”。即如果所设计的直接机制能使得各投标人讲真话，也就是声

明自己的真实类型（如对商品的真实价值）是贝叶斯纳什均衡，则称这样的直接机制为

?????<=->-=j i j i i i j i i i i j i i s s s s s s s s s s u ,0,2/)(),(θθθ；2/*i i s θ=2/*

j j s θ=

“说实话的直接机制”。也称为“激励—相容”或“鼓励—响应”机制。如果代理人从讲真话

中得到稍高的效用，则讲真话变为强均衡。事实上，如果讲真话的效用足够强，则代理

问题以及与之相联系的成本将会消失，能保证博弈方都按他们的真实类型行为并获得理

想的结果。

五、静态贝叶斯博弈中之所以博弈方需要针对自己的所有可能类型设定行为选择，是因为能

够迷惑其他博弈方，从而可以获得对自己更有利的均衡。

答：正确。不完全信息静态博弈的静态贝叶斯纳什均衡实际上是这样一种类型依从型战略组

合∶给定自己的类型和别人类型的概率分布情况下，每个参与人最大化自己的期望效

用。博弈方需要针对自己的所有可能类型设定行为选择，是因为能够迷惑其他博弈方，

从而可以获得对自己更有利的均衡

六、什么是贝叶斯纳什均衡？

答：n 人不完全信息静态博弈：的纯战战略贝叶斯纳什均衡是一个类型依存战略组合，其中每个参与人i 在给定自己的类型

和其他参与人类型依存战略，的情况下最大化自己的期望效用函数，换言之，战略组合是一个贝叶斯纳什均衡，如果对于所有的i ，有

，贝叶斯纳什均衡实际上是这样一种类型依从型战略组合∶给定自己的类型和别人类型的概率分布情况下，每个参与人最大化自

己的期望效用。

七、拍卖（招标）有哪几种常用的方式？

答：（1）最高价格密封出价拍卖（一级密封价格拍卖）

（2）次高价格密封出价拍卖（维克瑞拍卖）

（3）双方叫价拍卖

（4）最高价格公开出价拍卖（英国式拍卖）

（5）降价式拍卖（荷兰式拍卖）

八、机制设计的基本原理是什么？什么是“直接机制”与“显示原理”？

答：机制设计的基本原理是：选择一个博弈规则，最大化自己的期望效用函数。

直接机制：所谓直接机制，就是指代理人（这里的买者）的战略空间（拍卖中买者

的报价）等同于类型空间（拍卖中买者的价值）。其意义是只要代理人声明他们对

拍卖商品的价值，并不需要他们报出标价，委托人（卖方）会根据预先确定的运作

机制（包括一个随机选择过程）来确定中标者和中标价格。

显示原理：显示原理∶对每个导致可能说谎（即

的机制，其代理人的得益为（），存在着一个机制，代理人的得益为（）使其对于每个（讲

真话）的代理人得到相同的结果，这时，代理人将没有说谎话的积极性。

练习题（六）

一、假如某商品的确切价值是100，这只有卖方知道，你作为买方只知道该商品的价值标准

分布于[80，110]上。假设因为是积压品或需要回茏资金，因此卖方对该商品的主观价

}

,,;,,;,,;,,{1111n n n n u u p p A A G ΛΛΛΛθθ=i θ)

(*i i a --θi u )}(,),({*1*1*n n a a a θθΛ=),(i i i A a θ∈},

);(,{)(max arg )(**i i i i i i i i i a i i a a u p a i ----∑

∈θθθθθθ)i i S θ≠i u i q i s *i u i q i s i θ

值评价是在客观价值上打7折，这一点你也知道。如果交易价格由卖方提出，你只能选择是否接受，问该博弈中卖方和买方（你）的合理战略是什么？

答：

二、假如在一个经济案件中，原告清楚上法庭自己是否会赢，而且这是原被告的共同知识，

而被告不清楚谁会赢，只知道原告赢的可能性是1/3。再假设原告赢时的净利益为3，被告的净利益为-4；原告败诉时的净利益为-1，被告的净利益为0。如果原告在起诉之前可以先要求被告赔偿M=1或M=2和解，被告接受就不上法庭，拒绝则上法庭。用扩展形表示该博弈，并找出该博弈的均衡。

答：

三、什么是精炼贝叶斯均衡？

答：精炼贝叶斯均衡是所有参与人战略和信念的一种结合。它满足如下条件：第一，在给定每个参与人有关其他参与人类型的信念的条件下，该参与人的战略选择是最优的。第二，每个参与人关于其他参与人所属类型的信念，但是使用贝叶斯法则从所观察到的行为中获得的。

四、什么是混同均衡与分离均衡？有什么作用？

答：混同均衡：是指在这种均衡中，不同类型的参与人i选择相同的行动，这时，其他参与人无法从观察到的行动中得到的信息来识别参与人i的类型，也就无法对先验概率进行修正。

分离均衡：就是指在这种均衡中，不同类型的参与人i以概率1选择不同的行动，也就是说，没有不同类型的选择同一种行动。行动的信息准确地反映其类型，这样，其他参与人就可以从观察到的行动中得到的信息来识别参与人i的类型，也就可以据此信息对先验概率进行修正。

五、精炼贝叶斯均衡再精炼的方法有哪些？

答：用于精炼贝叶斯均衡的再精炼方法有：

（1）泽尔滕在1975年提出的“颤抖手均衡”

(2) 克瑞普斯（Kreps）和威尔逊（Wilson）在1982年提出的“序贯均衡”

(3) 梅耶森（Myerson）在1978年提出的“恰当均衡”

(4) 考尔伯格（Kohlberg）和默顿（Merten）在1986年提出的“稳定均衡”

六、假设你是一家证券公司的人事经理，需要为公司招聘10名操盘手。若用博弈论和信息经济学的思想和原理考虑，你的招聘计划中应包括哪些要点？

答：招聘博弈模型：局中人：招聘方与应聘者。

策略选择：应聘者有两种策略，欺骗或不欺骗；招聘方也有两种策略，相信或不相信应聘者。

：

要从两方面采取措施，防范和规避招聘风险：

1、设法使应聘者采取诚信的态度。

（1）降低应聘者欺骗成功的概率，使其不再有侥幸心理。比如采用申请表、笔试、绩效模拟和测验、工作抽样、面谈、专门的测评中心、履历调查、体格检查等多种手段进行甄选。

（2）增大应聘者欺骗行为的成本。例如，可以建立行业人才库，输入求职方的诚信档案，凡是行骗的求职方便会有相应的档案记录，增大其以后再求职的难度；在签订的劳动协议中注明，凡是有欺骗行为，均要赔偿招聘方的损失。

2、建立规范科学的招聘系统

针对应聘者和招聘方的博弈情况，自行设计了企业的招聘系统，以不断的完善企业的招聘工作，使其更加科学化规范化。

博弈论期末习题

《博弈论》期末习题专业：经济学学号：2 ；姓名：王兆丽一、试写出掷硬币博弈的局中人及其策略与得益函数，并写出双变量得益矩阵。答：局中人：盖硬币者和猜硬币者。策略：有正面和反面两种可选择策略，若猜对，猜者得１盖者－１.否则猜者－１盖者１.由于每一方都不会让对方在选择之前知道自己的决策，所以可以看做是同时做决策的。双变量得益矩阵；猜硬币方二、试举生活中的一例，说明囚徒困境是如何产生的？并试分析可能走出囚徒困境的途径。答：例子：中国移动和中国联通之间的价格战。产生原因：囚徒困境是在个体之间存在行为和利益相互制约的博弈结构中，以个体理性和个体选择为基础的分散决策方式，无法有效地协调各方面的利益，并实现整体、个体利益共同的最优。简单的说，囚徒困境问题都是个体理性与集体理性的矛盾引起的。可能走出的囚徒困境途径：(1)惩罚。如果政府对实行价格战以获利的企业实行惩罚，那么就会制止这种现象发生。（2）忠诚文化。有时候，建立一种相互忠诚的文化也可以帮助走出囚徒困境。在很多组织中，团体产生所面临的囚徒困境问题的轻重程度是不同的，这种差异的根本来源就是各个组织有自己的文化。（3）长期关系和重复博弈。建立长期关系使得囚徒困境博弈可以多次重复，如果这个“多次”足够长，那么人们就有可能为了长远的将来利益而牺牲眼前的一笔横财，合作也是可以达成的。

三、用逆向归纳法求解下面的博弈的子博弈完美纳什均衡。答：1、该博弈共包括四个子博弈：（1）从博弈方1选择R 以后博弈方2的第二阶段选择开始的三阶段动态博弈；（2）从博弈方2第二阶段选择R 以后博弈方1 的开始选择的两个阶段动态博弈；（3）第三阶段博弈方1选择A 以后博弈方2 的单人博弈；（4）第三阶段博弈方1选择B 以后博弈方2的单人博弈 2、根据逆推归纳法先讨论博弈方2在第四阶段的选择。由于选择C 、D 个中任何一个的得益都相同，因此在这阶段随意选择一个都可以。倒退回第三阶段，博弈方1选择ＡＢ中任何一个都可以。再推回第二阶段，博弈方２选择Ｌ将得到３选择Ｒ得到２，因此选择Ｌ；最后回到第一阶段，博弈方１选择Ｌ得到２选择Ｒ得到３,。所以该博弈的子博弈完美纳什均衡为：博弈方１第一阶段选择Ｒ，博弈方２第二阶段选择Ｌ，即（３,１）是该博弈的完美纳什均衡。四、两个寡头企业进行价格竞争博弈，企业1的利润函数是 q c aq p ++--=21)(π，企业2的利润函数是p b q +--=22)(π，其中p 是企业1 的价格，q 是企业2的价格。求： 1．两个企业同时决策的纯战略纳什均衡；两个企业同时定价。根据两个企业的得益函数，很容易导出它们各自的反应函数：απ1 /αp = -2(p-aq+c)=0 ____ p=aq-c απ2/αq = -2(q-b)=0 ______ q=b

博弈论经典案例分析

博弈论经典案例分析囚徒困境案例：警察把甲乙分开关押，并在提审时分别告之，如果你坦白而他不坦白，那么你将只判0年，他将被判8年；如果你不坦白而他坦白，那么你判8年，他判0年；如果你们两人都坦白了，各判5年；如果你们两人都不坦白了，各判1年。分析：每个博弈方选择自己的策略时，虽然无法知道另一方的实际选择，但他却不能忽视另一方的选择对他自己的得益的影响，因此他应该考虑到另一方有两种可能的选择，并分别考虑自己相应的最佳策略。对囚徒A 来说，囚徒B 有坦白和不坦白两种可能的选择，假设囚徒B 的选择是不坦白，则对囚徒A 来说，不坦白得益为-1，坦白得益为0，他应该选择坦白；假设囚徒B 选择的是坦白，则囚徒A 不坦白得益为-8，坦白得益为-5，他还是该选择坦白。因此，在此博弈中，无论囚徒B 采取何种策略囚徒A 的选择只有一种，即坦白，因为在另一方两种可能的情况下，坦白给自己带来的得益都是较大的。同样的道理，囚徒B 的唯一的选择也是坦白。所以最可能的结局：该博弈的最终结果是两博弈方同选择坦白策略。其支付矩阵如下：性格大战案例：一对恋人准备在周末晚上一起出去，男的喜欢看足球，但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。分析：可以看出，分开将使他们两人得不到任何满足，只要在一起，不管是看时装表演还是看足球，两人都会得到一定的满足。但看足球将使男的得到更大的满足，看时装表演则使女的得到更大的满足。在这样的一个对局中，男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择，一旦对方选定了某一项活动，另一个人选择同样的活动就是最好的策略。因此，如果男的已经买好了足球的门票，女的当然就不再反对；反之，如果女的已经买好了时装表演票，男的也就会与她一起看时装表演。 1，1 8， 0 不坦白 0，8 5，5 坦白嫌疑犯乙不坦白坦白嫌疑犯甲 1，2 -1， -1 时装 0，0 2，1 足球男时装足球女

《经济博弈论》期末考试复习

《经济博弈论》期末考试复习资料第一章导论 1.博弈的概念：博弈即一些个人、队组或其他组织，面对一定的环境条件，在一定的规则下，同时或先后，一次或多次，从各自允许选择的行为或策略中进行选择并加以实施，并从中各自取得相应结果的过程。它包括四个要素：参与者，策略，次序和得益。 2.一个博弈的构成要素：博弈模型有下列要素：(1)博弈方。即博弈中决策并承但结果的参与者．包括个人或组织等：(2)策略。即博弈方决策、选择的内容，包括行为取舍、经济活动水平或多种行为的特定组合等。各博弈方的策略选择范围称策略空间。每个博弈方各选一个策略构成一个策略组合。(3)进行博弈的次序：次序不同一般就是不同的博弈，即使博弈的其他方面都相同。(4)得益。各策略组合对应的各博弈方获得的数值结果，可以是经济利益，也可以是非经济利益折算的效用等。 3.合作博弈和非合作博弈的区别：合作博弈：允许存在有约束力协议的博弈；非合作博弈：不允许存在有约束力协议的博弈。主要区别:人们的行为互相作用时，当事人能否达成一个具有约束力的协议。假设博弈方是两个寡头企业，如果他们之间达成一个协议，联合最大化垄断利润，并且各自按这个协议生产，就是合作博弈。如果达不成协议，或不遵守协议，每个企业都只选择自己的最优产品（价格），则是非合作博弈。合作博弈：团体理性（效率高，公正，公平）非合作博弈：个人理性，个人最优决策（可能有效率，可能无效率） 4.完全理性和有限理性: 完全理性：有完美的分析判断能力和不会犯选择行为的错误。有限理性：博弈方的判断选择能力有缺陷。区分两者的重要性在于如果决策者是有限理性的，那么他们的策略行为和博弈结果通常与在博弈方有完全理想假设的基础上的预测有很大差距，以完全理性为基础的博弈分析可能会失效。所以不能简单地假设各博弈方都完全理性。 5.个体理性和集体理性：个体理性：以个体利益最大为目标；集体理性：追求集体利益最大化。第一章课后题：2、4、5 2.设定一个博弈模型必须确定哪几个方面? 设定一个博弈必须确定的方面包括:(1)博弈方，即博弈中进行决策并承担结果的参与者;(2)策略(空间)，即博弈方选择的内容，可以是方向、取舍选择，也可以是连续的数量水平等;(3)得益或得益函数，即博弈方行为、策略选择的相应后果、结果，必须是数量或者能够折算成数量;(4)博弈次序，即博弈方行为、选择的先后次序或者重复次数等;(5)信息结构，即博弈方相互对其他博弈方行为或最终利益

博弈论基础作业及答案【最新资料】

博弈论基础作业一、名词解释纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识见PPT 二、问答题 1.举出囚徒困境和智猪博弈的现实例子并进行分析。囚徒困境的例子：军备竞赛；中小学生减负；几个大企业之间的争相杀价等等；以中小学生减负为例：在当前的高考制度下，给定其他学校对学生进行减负，一个学校最好不减负，因为这样做，可以带来比其他学校更高的升学率。给定其他学校不减负，这个学校的最佳应对也是不减负。否则自己的升学率就比其他学校低。因此，不论其他学校如何选择，这个学校的最佳选择都是不减负。每个学校都这样想，所以每个学校的最佳选择都是不减负，因此学生的负担越来越重。请用同样的方法分析其他例子。智猪博弈的例子：大企业开发新产品；小企业模仿；股市中，大户搜集分析信息，散户跟随大户的操作策略以股市为例：给定散户搜集资料进行分析，大户的最佳选择是跟随。而给定散户跟随，大户的最佳选择是自己搜集资料进行分析。但是不论大户是选择分析还是跟随，散户的最佳选择都是跟随。因此如果大户和散户是聪明的，并且大户知道散户也是聪明的，那么大户就会预见到散户会跟随，而给定散户跟随，大户只有自己分析。请用同样的方法分析其他例子。 2.请用博弈论来说明“破釜沉舟”和“穷寇勿追”的道理。破釜沉舟是一个承诺行动。目的是要断绝自己的退路，让自己无路可退，让自己决一死战变得可以置信。也就是说与敌人对决时，只有决一死战，这样才可以取得胜利。否则，如果不破釜沉舟，那么遇到困难时，就很有可能退却，也就无法取得胜利。穷寇勿追就是要给对方一个退路，由于有退路，对方就不会殊死抵抗。否则，对方退无可退，只有坚决抵抗一条路，因而必然决一死战。自己也会付出更大的代价。

博弈论各章节课后习题答案 (4)

第四章谈判与协调 1.帕累托占优均衡和纳什均衡的关系是什么? 纳什均衡的基本思想是：每一个局中人选择一个策略，由所有局中人的策略构成了一个策略组合；在其它局中人选定策略不变的情况下，若某一个局中人单独地违背自己已选的策略，那么他的收益只会下降（或收益不会增加）。这样的策略组合构成一个均衡局势，并命名为纳什均衡。纳什均衡有纯策略的纳什均衡和混合策略的纳什均衡。一个博弈中有不止一个纳什均衡时，就构成一个多重纳什均衡问题。在多重纳什均衡下给出一些选择标准就得到一些特定的纳什均衡。其中帕累托占有纳什均衡是根据这样的选择标准选择的均衡。在博弈中，若均为G 的其纳什均衡，若满足[,{},{}]i i G N S P =12,,,m s s s ????0 i s ?，0()()i i i j P s P s ?? >1,2,,,1,2,,i n j m ==??则称为博弈G 的帕累托占优纳什均衡。可见帕累托占有纳什均衡是纳什均衡中收益最大 0i s ? 的一种均衡。 2.分别找出具有下列性质的2人博弈的例子。 (1)不存在纯策略纳什均衡； (2)至少有两个纳什均衡，并且其中之一是帕累托占优均衡。（1 ）不存在纯策略的纳什均衡：该博弈不存在纯策略的纳什均衡（2）该博弈有三个纳什均衡：（战争，战争）、（和平，和平）和一个混合策略纳什均衡。很显然，（和平，和平）是一个帕累托占优纳什均衡。 2525((,),(,77773.假设在某一产品市场上有两个寡头垄断企业，它们的成本函数分别为： TC 1=0.1q +20q 1+100000TC 2=0.4q +32q 2+20000 2122这两个企业生产一同质产品，其市场需求函数为：Q=4000-10p 。试分别基于古诺模型和纳什谈判模型求解两企业的利润。解：由和400010Q p =?12 Q q q =+得124000.1() p q q =?+战争和平国家 1战争-5，-58，-10和平-10，810，10

博弈论经典案例与分析

案例：一对恋人准备在周末晚上一起出去，男的喜欢看足球，但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。分析：可以看出，分开将使他们两人得不到任何满足，只要在一起，不管是看时装表演还是看足球，两人都会得到一定的满足。但看足球将使男的得到更大的满足，看时装表演则使女的得到更大的满足。在这样的一个对局中，男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择，一旦对方选定了某一项活动，另一个人选择同样的活动就是最好的策略。因此，如果男的已经买好了足球的门票，女的当然就不再反对；反之，如果女的已经买好了时装表演票，男的也就会与她一起看时装表演。价格战案例：假设市场中仅有A 、B 两家企业，每家企业可采取的定价策略都是10元或15元，我们可以得出得益矩阵如下：分析：无论对企业A 还是企业B 来说，低价都是他们的占优战略。从表可见，企业A 的占优战略是10元，因为无论B 采取什么战略，企业A 都能获取比定价15元更多的利润。如果企业B 定价10元，企业A 定价10元能够获利80万元，而定价15元只能获得30万元；如果企业B 定价15元，企业A 定价10元可获利170万元，而定价15元却只能获利120万元。同样地，企业B 的占优战略也是定价10元的策略。企业B 男

博弈期末考试总结

博弈与决策答案一、名词解释（每小题2分，共16分） 1、博弈博弈是指一些个人、团队或其他组织，面对一定的环境条件，在一定的规则约束下，依靠掌握的信息，同时或先后，一次或多次，从各自允许选择的行为或策略中进行选择并加以施，并从中各自取得相应结果或收益的过程， 2、占优战略均衡占优战略均衡是指在博弈中，如果所有参与人都有占优策略存在，博弈将在所有参与人的优策略的基础上达到均衡． 3、重复博弈重复博弈是指同一个博弈在相同的环境、规则下反复多次执行的博弈问题， 4、序列博弈序列博弈是指对局者选择策略有时问先后的顺序，某些对局者可能率先采取行动．序列博也是一种动态博弈． 5、动态博弈动态博弈是指在博弈中，参与人的行动有先后顺序且后行动者能够观察到先行动者所选择的行动． 6、占优战略均衡--占优战略均衡是指在博弈中，如果所有参与人都有占优策略存在，博弈将在所有参与人的占优策略的基础上达到均衡． 7、完全信息---完全信息是指在博弈过程中，每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息． 8、得益得益是参与人在博弈结束后从博弈中获得的效用，一般是所有参与人的策略或行动的函数，这是每个参与人最关心的东西． 9，博弈论：博弈论就是系统的研究各种各样的博弈问题，寻求各博弈方合理选择策略的情况下博弈的解，并对这些解进行讨论分析的理论。 10，纳什战略均衡：纳什战略均衡指在均衡中，每个博弈参与人都确信，在给定其他参与人选择的策略的情况下，该参与人选择了最优策略以回应对手的策略。 11，静态博弈：静态博弈是指在博弈中，参与人同时选择或非同时选择但后行动者并不知道先行动者采取了什么具体行动。二、、简答题（每小题6分，共24分） 1、占优战略均衡和纳什均衡的联系与区别如下： 1)每一个占优战略均衡都是纳什均衡，而每一个纳什均衡却未必是占优战略均衡； 2)用重复剔除严格劣战略方法，保留下的唯一的重复剔除的占优均衡，就是纳什均衡． 3)纳什均衡，不会被重复剔除严格劣战略方法剔除掉（但弱劣战略剔除，可能会剔除纳什衡）： 4)经重复剔除严格劣战略之后，有不唯一的多个哉略组合保留，其中有的战略组合不一定纳什均衡．即重复剔除严格劣战略方法，无法确保将所有非纳什均衡战略剔除，没有被剔的战略组合不一定是纳什均衡． 5)没有占优战略均衡的博弈，不能用重复剔除严格劣战略方法求解的博弈，可以有纳什均衡2，博弈的构成要素有哪些？并对其进行说明。 2、博弈一般由以下几个要素组成，包括：参与人、行动、信息，策略、得益、结果、均衡等．

博弈论经典模型全解析

博弈论经典模型全解析（入门级） 1. 囚徒困境这是博弈论中最最经典的案例了——囚徒困境，非常耐人寻味。“囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事，结果被警察发现抓了起来，分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下，两个囚犯都可以做出自己的选择：或者供出他的同伙(即与警察合作，从而背叛他的同伙)，或者保持沉默(也就是与他的同伙合作，而不是与警察合作)。这两个囚犯都知道，如果他俩都能保持沉默的话，就都会被释放，因为只要他们拒不承认，警方无法给他们定罪。但警方也明白这一点，所以他们就给了这两个囚犯一点儿刺激：如果他们中的一个人背叛，即告发他的同伙，那么他就可以被无罪释放，同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决，并且为了加重惩罚，还要对他施以罚款，作为对告发者的奖赏。当然，如果这两个囚犯互相背叛的话，两个人都会被按照最重的罪来判决，谁也不会得到奖赏。那么，这两个囚犯该怎么办呢？是选择互相合作还是互相背叛？从表面上看，他们应该互相合作，保持沉默，因为这样他们俩都能得到最好的结果：自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子，他马上意识到，他根本无法相信他的同伙不

会向警方提供对他不利的证据，然后带着一笔丰厚的奖赏出狱而去，让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到，他的同伙也不是傻子，也会这样来设想他。所以A犯的结论是，唯一理性的选择就是背叛同伙，把一切都告诉警方，因为如果他的同伙笨得只会保持沉默，那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了，那么，A犯反正也得服刑，起码他不必在这之上再被罚款。所以其结果就是，这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应：坐牢。企业在信息化过程中需要与咨询企业、软件供应商打交道的。在与这些企业打交道的过程中，我们不可避免地也会遇到类似的两难境地，这个时候需要相互之间有足够的了解与信任，没有起码的信任做基础，切不可贸然合作。在对对方有了足够的信任之后，诚意也是必不可少的，如果没有诚意或者太过贪婪，就可能闹到双方都没有好处的糟糕情况，造成企业之间的双输。 2. 智猪博弈在博弈论（Game Theory）经济学中，“智猪博弈”是一个着名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽，另一头安装着控制猪食供应的按钮，按一下按钮会有10个单位的猪食进槽，但是谁按按钮就会首先付出2个单位的成本，若大猪先到槽边，大小猪吃到食物的收益比是9∶1；同时到槽边，收益比是

博弈论试题及答案

诚信考试沉着应考杜绝违纪《博弈论》试卷课堂周四（7/8）院系专业万方电气系通信工程学号余数 0 姓名

河南理工大学2010–2011学年第1学期《博弈论》课程期末考试试卷开课学院：经济管理学院，考试形式：开卷，允许带___________入场考试时间：2010年12月25日－12月25日, 所需时间：周考生姓名：学号：专业：题序一二三四五六七八总分得分评卷人 1、第一题：（10分）（1）举一个你所经历情侣博弈的情形，在实际博弈中你采取什么行动让自己收益最大；答：作为一个男生，我想很多机会都是把握在自己手中的，情侣博弈有二个“纳什均衡”，一次博弈的结局究竟落到哪一个“纳什均衡”，关键就是要看遇事时自己如何去选择了。例如：周末和女朋友去逛商场，应该客观地按照需求去采购，在了解女朋友的爱好的前提下，想办法引导她去看性价比最高的商品，并给予一定建议。遇到她特别喜欢的衣服或饰物，只要价格合理，又能满足生活需要，在对方征求意见时应该支持购买并给予肯定答复；当遇到不合理的购买选择时，应简明扼要地说出其不适之处，并建议对方到其它她喜欢的物品处，挑选令其满意的商品。购物中间一旦遇到对方生气或者发火，可以宽容地对待对方，以显示出自己的城府，若对方为无理取闹，应该坦诚地向对方说明情况，让对方明白自己在为她考虑，说明都说清楚了事情也就简化了。另外，在购物结束前，可以给女朋友买些她喜欢的零食，或者一起去对方喜欢的餐饮店，休息的同时也可调节一下情调，让双方都能够感觉到两个人在一起的幸福与甜蜜。总结一下，在这场情侣博弈中，要想让自己获得最大收益，必须努力做到认真、善意、宽容、强硬、简单明了各种措施相结合。 2、第二题：（20分）请举例说明下列说法是否正确，构造博弈模型具体说明，阐述原因。（1）判断分析“先下手为强” 答：“先下手为强”并不满足所有的情形。博弈中，在有多个"纳什均衡"的情况下,常常是先动手的一方会占一些优势，这和课例中“囚徒困境”情形类似，有一个最佳策略，古代的很多例子也证明了此点，如：诸葛亮先下手为强，占据荆州要势；日本先下手为强，偷袭美国的珍珠港，不然就不会有第二次世界大战；三国曹操先下手为强，迎接汉献帝，后挟天子以令诸侯等。要指出的是，“动态博弈”中也是有很多后动优势的情形，一般是在方案已经制定，自身实力比较弱，需要选择决策的时候，主动放弃先发权利，变先动劣势为后动优势。如：三人参加选举，支持率分别为15%，35%，50%，这个时候，如果15%者先采取行动，可能会立刻被强敌灭掉，所以他必须保存实力，保持低调，不介入强者的争斗，由另两位先动手，争取灭掉一方后均分失败者的支持率，虽然这样扔处于劣势，但比最初情况要好很多。所以，在面对选择

张维迎《博弈论与信息经济学》部分答案

张维迎《博弈论与信息经济学》部分习题答案如果图片不显示，用打印预览就可以了。 P127 第一题：领悟精神就可以了，而且每本书上都有这些例题，不找了。第二题： UMD 为参与人1的战略，LMR 为参与人2的战略。前面的数字代表参与人1的得益，后面的代表参与人2的得益。参与人2的R 战略严格优于M 战略，剔除参与人2的M 战略，参与人1的U 战略优于M 战略，剔除参与人1的M 战略，参与人1的U 战略优于D 战略，剔除参与人1的D 战略，参与人2的L 战略优于R 战略，剔除参与人2的R 战略。最后均衡为U ，L （4，3）。这样可能看不清，按照步骤一步步画出图就好多了。第三题：恩爱型厌恶型用划线法解出，恩爱的都活着或者都死，厌恶的或者受罪，死了对方另一个人开心的不得了。第四题：没有人会选择比原来少的钱，战略空间为{原来的钱，比原来多的钱}。支付为{0，原来的钱，比原来多的钱}。纳什均衡为选择原来的钱。要画图自己画画。第五题：n 个企业，其中的一个方程：π1＝q 1（a －（q 1＋q 2＋q 3……q n ）－c ），其他的类似就可以了，然后求导数，结果为每个值都相等，q 1= q 2=……q n =(a-c)/(n+1)。或者先求出2个企业的然后3个企业的推一下就好了。

第六题：在静态的情况下，没有一个企业愿意冒险将定价高于自己的单位成本C ，最终P=C ，利润为0。因为每个参与人都能预测到万一自己的定价高于C ，其他人定价为C 那么自己的利益就是负的（考虑到生产的成本无法回收）。就算两个企业之间有交流也是不可信的，最终将趋于P=C 。现实情况下一般寡头不会进入价格竞争，一定会取得一个P 1=P 2=P 均衡。此时利润不为零，双方将不在进行价格竞争。第七题：设企业的成本相同为C ，企业1的价格为P 1，企业2的价格为P 2。 π1=(P 1-C)(a-P 1+P 2)，π2=(P 2-C)(a-P 2+P 1)。一阶最优：a-2P 1+C+P 2=0，a-2P 2+C+P 1=0。解得：P 1=P 2=a+C ，π1=π2=a 2。第八题：不会！到纳什均衡为(A,A,A),(A,B,A),(B,B,B),(A,C,C),(C,C,C)。第十题：无纯战略纳什均衡，设参与人1为P 1～P 4，参与人2为Q 1～Q 4。得到：-Q 2+Q 4=Q 1-Q 3=Q 2-Q 4=-Q 1+Q 3，推出：Q 1=Q 2=Q 3=Q 4=1/4。同理P 1=P 2=P 3=P 4=1/4。以上述的概率在杆子，老虎，鸡，虫子中选择一个。

博弈论的经典案例与分析

博弈论的经典案例与分析囚徒困境案例：警察把甲乙分开关押，并在提审时分别告之，如果你坦白而他不坦白，那么你将只判0年，他将被判8年；如果你不坦白而他坦白，那么你判8年，他判0年；如果你们两人都坦白了，各判5年；如果你们两人都不坦白了，各判1年。分析：每个博弈方选择自己的策略时，虽然无法知道另一方的实际选择，但他却不能忽视另一方的选择对他自己的得益的影响，因此他应该考虑到另一方有两种可能的选择，并分别考虑自己相应的最佳策略。对囚徒A 来说，囚徒B 有坦白和不坦白两种可能的选择，假设囚徒B 的选择是不坦白，则对囚徒A 来说，不坦白得益为-1，坦白得益为0，他应该选择坦白；假设囚徒B 选择的是坦白，则囚徒A 不坦白得益为-8，坦白得益为-5，他还是该选择坦白。因此，在此博弈中，无论囚徒B 采取何种策略囚徒A 的选择只有一种，即坦白，因为在另一方两种可能的情况下，坦白给自己带来的得益都是较大的。同样的道理，囚徒B 的唯一的选择也是坦白。所以最可能的结局：该博弈的最终结果是两博弈方同选择坦白策略。其支付矩阵如下：性格大战案例：一对恋人准备在周末晚上一起出去，男的喜欢看足球，但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。分析：可以看出，分开将使他们两人得不到任何满足，只要在一起，不管是看时装表演还是看足球，两人都会得到一定的满足。但看足球将使男的得到更大的满足，看时装表演则使女的得到更大的满足。在这样的一个对局中，男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择，一旦对方选定了某一项活动，另一个人选择同样的活动就是最好的策略。因此，如果男的已经买好了足球的门票，女的当然就不再反对；反之，如果女的已经买好了时装表演票，男的也就会与她一起看时装表演。 1，1 8， 0 不坦白 0，8 5，5 坦白嫌疑犯乙不坦白坦白嫌疑犯甲 1，2 -1， -1 时装 0，0 2，1 足球男时装足球女

博弈论经典案例《智猪博弈》

在经济学中，在经济学中，智猪博弈”(PigS ' PayoffS(BoXed PigS) 是一个著名博弈论例子。这个例子讲的是：猪圈里有两头猪，一头大猪，一头小猪。猪圈的一边有个踏板，每踩一下踏板，在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板，另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时，大猪会在小猪跑到食槽之前刚好吃光所有的食物；若是大猪踩动了踏板，则还有机会在小猪吃完落下的食物之前跑到食槽，争吃到另一半残羹。那么，两只猪各会采取什么策略？答案是：小猪将选择搭便车”策略，也就是舒舒服服地等在食槽边；而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。原因何在？因为，小猪踩踏板将一无所获，不踩踏板反而能吃上食物。对小猪而言，无论大猪是否踩动踏板，不踩踏板总是好的选择。反观大猪，已明知小猪是不会去踩动踏板的，自己亲自去踩踏板总比不踩强吧，所以只好亲力亲为了。小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是：每次落下的事物数量和踏板与投食口之间的距离。如果改变一下核心指标，猪圈里还会出现同样的小猪躺着大猪跑”的景象吗？试试看。改变方案一：减量方案。投食仅原来的一半分量。结果是小猪大猪都不去踩踏板了。小猪去踩，大猪将会把食物吃完；大猪去踩，小猪将也会把食物吃完。谁去踩踏板，就意味着为对方贡

献食物，所以谁也不会有踩踏板的动力了。如果目的是想让猪们去多踩踏板，这个游戏规则的设计显然是失败的。改变方案二：增量方案。投食为原来的一倍分量。结果是小猪、大猪都会去踩踏板。谁想吃，谁就会去踩踏板。反正对方不会一次把食物吃完。小猪和大猪相当于生活在物质相对丰富的共产主义”社会，所以竞争意识却不会很强。对于游戏规则的设计者来说，这个规则的成本相当高（每次提供双份的食物）；而且因为竞争不强烈，想让猪们去多踩踏板的效果并不好。改变方案三：减量加移位方案。投食仅原来的一半分量，但同时将投食口移到踏板附近。结果呢，小猪和大猪都在拼命地抢着踩踏板。等待者不得食，而多劳者多得。每次的收获刚好消费宀完。对于游戏设计者，这是一个最好的方案。成本不高，但收获最大。原版的智猪博弈”故事给了竞争中的弱者（小猪）以等待为最佳策略的启发。但是对于社会而言，因为小猪未能参与竞争，小猪搭便车时的社会资源配置的并不是最佳状态。为使资源最有效配置，规则的设计者是不愿看见有人搭便车的，政府如此，公司的老板也是如此。而能否完全杜绝搭便车”现象，就要看游戏规则的核心指标设置是否合适了。

博弈论案例分析

博弈论案例分析一、经济学中的“智猪博弈” (Pigs’payoffs) 故事背景:猪圈里有一头大猪和一头小猪。猪圈的一边有个踏板，每踩一下踏板，在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板，另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时，大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板，则还有机会在小猪吃完落下的食物之前跑到食槽，争吃到另一半残羹。那么，两只猪各会采取什么策略,答案是:小猪将选择“搭便车”策略，也就是舒舒服服地等在食槽边; 而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。原因何在,因为，小猪踩踏板将一无所获，不踩踏板反而能吃上食物。对小猪而言，无论大猪是否踩动踏板，不踩踏板总是好的选择。反观大猪，已明知小猪是不会去踩动踏板的，自己亲自去踩踏板总比不踩强吧，所以只好亲力亲为了。“小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是:每次落下的事物数量和踏板与投食口之间的距离。如果改变一下核心指标，猪圈里还会出现同样的“小猪躺着大猪跑”的景象吗,试试看。改变方案一:减量方案。投食仅原来的一半分量。结果是小猪大猪都不去踩踏板了。小猪去踩，大猪将会把食物吃完;大猪去踩，小猪将也会把食物吃完。谁去踩踏板，就意味着为对方贡献食物，所以谁也不会有踩踏板的动力了。如果目的是想让猪们去多踩踏板，这个游戏规则的设计显然是失败的。改变方案二:增量方案。投食为原来的一倍分量。结果是小猪、大猪都会去踩踏板。谁想吃，谁就会去踩踏板。反正对方不会一次把食物吃完。小猪和大猪相当于生活在物质相对丰富的“共产主义”社会，所以竞争意识却不会很强。对于游戏规则的设计者来说，这个规则的成相当高(每次提供双份的食物) ;而且因为竞争不强烈，想让猪们去多踩踏板的

博弈论第4章答案

R R M 4.1.a 标准式 1↖2 L ’ R ’ 4，1 0，0 3，0 0，1 2，2 2，2 纯战略纳什均衡：( L, L ’ ) ( R, R ’ ) 子博弈精炼纳什均衡：( L, L ’ ) ( R, R ’ ) 精炼贝叶斯纳什均衡：( L, L ’ ) 4.1.b 标准式 1↖2 L ’ M ’ R ’ 1, 3 1, 2 4, 0 4, 0 0, 2 3, 3 2, 4 2, 4 2, 4 纯战略纳什均衡：( R, M ’ ) 子博弈精炼纳什均衡：( R, M ’ ) 精炼贝叶斯均衡: 没有 4.2 标准式 1↖2 L ’ R ’ 2，2 2，2 3，0 0，1 0，1 3，0 六种纯战略组合，每种组合中都至少有一方存在偏离的动机，因此不存在纯战略纳什均衡，因此也就不存在纯战略精炼贝叶斯均衡。求混合战略精炼贝叶斯均衡：设参与者1选择L 、M 、R 的概率分别为1,2,12(1)p p p p ?? 参与者2选择L ’和R ’的概率分别为,(1)q q ? 在给定参与者1的战略下，参与者2选择L ’和R ’的收益无差异，则： 1212 120*1*1*0*p p p p p p +=+?= 给定参与者2的战略，参与者1选择L 、M 、R 的收益无差异，则： 121212 12[3*0*(1)][0*3*(1)]2*(1) 41:**,*112 p q q p q q p p p p p p q +?=+?=??=== =又联立得所以 L L M L L M L R L

4.3答案（见4.5） 4.4 表示方法第一个括号，逗号左边为type 1发送者信号，逗号右边为type 1发送者信号；第二个括号，逗号左边为接收到L 信号的反应，逗号右边为接收到R 信号的反应； P 为信号接收者对type 1发送L 的推断，q 为信号接收者对type 1发送R 的推断（a ） [(,),(,),1/2] [(,),(,),1/2] [(,),((1),),1/2][(,),(,),1,0] R R u u p R R d u p R R d u u p L R u d p q αα><+?=== （b ） [(,),(,),1/2,2/3] [(,),(,),1,0][(,),(,),0,1] L L u u p q L R d u p q R L u d p q =<==== 中文版习题4.5答案（a ） [(,),(,),1/3,1/2]R R u d p q >= （b ） 12121212[(,,),(,),1/3,1/2] [(,,),(,),1/2,0] L L L u u p p q q L L R u d p p q q ==+<==+=

“博弈论”习题及参考答案

《博弈论》习题一、单项选择题 1.博弈论中，局中人从一个博弈中得到的结果常被称为（）。 A. 效用 B. 支付 C. 决策 D. 利润 2.博弈中通常包括下面的内容，除了（）。 A.局中人 B.占优战略均衡 C.策略 D.支付 3.在具有占优战略均衡的囚徒困境博弈中（）。 A.只有一个囚徒会坦白 B.两个囚徒都没有坦白 C.两个囚徒都会坦白 D.任何坦白都被法庭否决了 4.在多次重复的双头博弈中，每一个博弈者努力（）。 A.使行业的总利润达到最大 B.使另一个博弈者的利润最小 C.使其市场份额最大 D.使其利润最大 5.一个博弈中，直接决定局中人支付的因素是（）。 A. 策略组合 B. 策略 C. 信息 D. 行动 6.对博弈中的每一个博弈者而言，无论对手作何选择，其总是拥有惟一最佳行为，此时的博弈具有（）。 A.囚徒困境式的均衡 B.一报还一报的均衡 C.占优策略均衡 D.激发战略均衡 7.如果另一个博弈者在前一期合作，博弈者就在现期合作；但如果另一个博弈者在前一期违约，博弈者在现期也违约的策略称为（）。 A.一报还一报的策略 B.激发策略 C.双头策略 D.主导企业策略 8.在囚徒困境的博弈中，合作策略会导致（）。 A.博弈双方都获胜 B.博弈双方都失败

C.使得先采取行动者获胜 D.使得后采取行动者获胜 9.在什么时候，囚徒困境式博弈均衡最可能实现（）。 A. 当一个垄断竞争行业是由一个主导企业控制时 B.当一个寡头行业面对的是重复博弈时 C.当一个垄断行业被迫重复地与一个寡头行业博弈时 D. 当一个寡头行业进行一次博弈时 10.一个企业采取的行为与另一个企业在前一阶段采取的行为一致，这种策略是一种（）。 A.主导策略 B.激发策略 C.一报还一报策略 D.主导策略 11.关于策略式博弈，正确的说法是（）。 A. 策略式博弈无法刻划动态博弈 B. 策略式博弈无法表明行动顺序 C. 策略式博弈更容易求解 D. 策略式博弈就是一个支付矩阵 12.下列关于策略的叙述哪个是错误的（）： A. 策略是局中人选择的一套行动计划； B. 参与博弈的每一个局中人都有若干个策略； C. 一个局中人在原博弈中的策略和在子博弈中的策略是相同的； D. 策略与行动是两个不同的概念，策略是行动的规则，而不是行动本身。 13. 囚徒困境说明（）： A. 双方都独立依照自己的利益行事，则双方不能得到最好的结果； B. 如果没有某种约束，局中人也可在（抵赖，抵赖）的基础上达到均衡； C. 双方都依照自己的利益行事，结果一方赢，一方输； D、每个局中人在做决策时，不需考虑对手的反应 14. 一个博弈中，直接决定局中人损益的因素是（）： A. 策略组合 B. 策略 C. 信息 D. 行动 15. 动态博弈参与者在关于博弈过程的信息方面是（） A 不对称的 B 对称的 C 不确定的 D 无序的

博弈论三大经典案例

经典的囚徒困境 1950年，由就职于兰德公司的梅里尔·弗拉德（Merrill Flood）和梅尔文·德雷希尔（Melvin Dresher）拟定出相关困境的理论，后来由顾问阿尔伯特·塔克（Albert Tucker）以囚徒方式阐述，并命名为“囚徒困境”。经典的囚徒困境如下：警方逮捕甲、乙两名嫌疑犯，但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯，分别和二人见面，并向双方提供以下相同的选择： ?若一人认罪并作证检举对方（相关术语称“背叛”对方），而对方保持沉默，此人将即时获释，沉默者将判监10年。 ?若二人都保持沉默（相关术语称互相“合作”），则二人同样判监半年。 ?若二人都互相检举（互相“背叛”），则二人同样判监2年。用表格概述如下：甲沉默（合作）甲认罪（背叛）乙沉默（合作）二人同服刑半年甲即时获释；乙服刑10年乙认罪（背叛）甲服刑10年；乙即时获释二人同服刑2年如同博弈论的其他例证，囚徒困境假定每个参与者（即“囚徒”）都是利己的，即都寻求最大自身利益，而不关心另一参与者的利益。参与者某一策略所得利益，如果在任何情况下都比其他策略要低的话，此策略称为“严格劣势”，理性的参与者绝不会选择。另外，没有任何其他力量干预个人决策，参与者可完全按照自己意愿选择策略。囚徒到底应该选择哪一项策略，才能将自己个人的刑期缩至最短？两名囚徒由于隔绝监禁，并不知道对方选择；而即使他们能交谈，还是未必能够尽信对方不会反口。就个人的理性选择而言，检举背叛对方所得刑期，总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择： ?若对方沉默、背叛会让我获释，所以会选择背叛。 ?若对方背叛指控我，我也要指控对方才能得到较低的刑期，所以也是会选择背叛。二人面对的情况一样，所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此，这场博弈中唯一可能达到的纳什均衡，就是双方参与者都背叛对方，结果二人同样服刑2年。这场博弈的纳什均衡，显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言，如果两个参与者都合作保持沉默，两人都只会被判刑半年，总体利益更高，结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设，二人均为理性的个人，且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛，结果二人判决均比合作为高，总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了：非零和博弈中，帕累托最优和纳什均衡是相冲突的。由囚徒困境可以写出类似的员工困境：一名经理，数名员工; 前提，经理比较苛刻; 如果所有员工都听从经理吩咐，则奖金等待遇一样，不过所有人都超负荷工作如果某人不听从吩咐，其他人听从吩咐，则此人下岗。其他人继续工作如果所有人都不听从经理吩咐，则经理下岗但是，由于员工之间信息是不透明的，而且，都担心别人听话自己不听话而下岗，所以，大家只能继续繁重的工作. 囚徒困境是博弈论的非零和博弈中具代表性的例子，反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质，但现实中的价格竞争、环境保护等方面，也会频繁出现类似情况。

博弈论基础作业及答案

博弈论基础作业及答案 Company number：【0089WT-8898YT-W8CCB-BUUT-202108】

博弈论试题

杭州师范大学2010-2011学年第二学期通识课程期末考试《博弈论与企业管理》试卷一、单项选择题（本大题共12题，每题3分，共36分） 1. 下列关于优势策略均衡和纳什均衡的描述正确的是（） A 优势策略均衡肯定是纳什均衡； B 纳什均衡都是优势策略均衡； C 纳什均衡是特殊的优势策略均衡； D 以上三种情况都有可能 2. 以下关于承诺的描述不准确的是（） A 承诺使威胁可置信； B 承诺往往对自己构成约束； C 承诺往往不需要成本； D 承诺往往会给自己带来成本，但最终结果使自己有利 3. 对于以下报酬矩阵，哪个命题是正确的（） A 甲和乙都有占优策略； B 只有甲有占优策略； C 只有乙有占优策略； D 两人都没有占优策略 4. 对于如下报酬矩阵，乙的占优策略是（） A 上； B 中； C 左； D 右

5. 对于题4的报酬矩阵，以下哪个是纳什均衡（） A （上，左）；B （上，右）；C （下，右）；D （上，中） 6. 对于题4的报酬矩阵，如果乙先走一步，并且知道甲再作决策时已经知道乙的决策，那么，乙将采取（） A 左；B 中； C 右；D 上 7. 交易双方信息不对称，比如买房不知道卖方的一些情况，是由于（） A 卖方故意隐瞒自己的一些情况； B 买方自身的认识能力有限； C 买方掌握完全信息的成本太高； D 以上三种情况都有可能 8. 面对不对称信息，下列哪一项不能为消费者减少信息不对称（） A 品牌；B 低价格 C 产品保证 D 长期质量保证书 9. 下列哪一项不是高质量的信号（） A 产品保证； B 延长的质量保单； C 暂时的经营场所； D 被认可的品牌 10.在二手市场上，（） A 买主知道商品的质量，而卖主不知道； B 买主不知道商品的质量，而卖主知道； C 卖主和买主都知道商品的质量是低的； D 卖主和买主都不知道商品的质量是低的 11.一个有效的激励机制必须能够（） A 使代理人参与工作的净收益不低于不工作也能得到的收益； B 使代理人让委托人满意的努力水平也是给代理人带来最大净收益的努力水平； C 尽可能地减少或消除代理人的目标函数与委托人的目标函数之间的冲突； D 以上都是 12.在信息不对称的劳动力市场，效率最低的激励机制是（） A 固定工资；B 效率工资；C 利润分享； D 提成二、简答题（本大题共6题，第1、2、3题每题4分，第4、5、6题每题6分，共30分） 1.一个博弈如果出现两败俱伤的结果，这样的博弈一定是非合作的零和博弈吗 2.两个罪犯只打算合伙犯罪一次，所以被捕后出现了囚徒困境的情况。如果这两个罪犯准备合伙犯罪30次，那么在开始的犯罪活动中如果被捕，还会出现囚徒困境吗 3.请举例分析说明在什么条件下博弈者采取威胁对方的策略可以奏效。 4.某博弈的报酬矩阵如下：（1）如果（上，左）是优势策略均衡，那么a ，b ，c ，d 应满足什么条件（2）如果（上，左）是纳什均衡，那么，又应该满足什么条件（3）如果（上，左）是优势策略均衡，那么，它是否必定是纳什均衡为什么