搜档网
当前位置:搜档网 › 博弈论基础作业及答案

博弈论基础作业及答案

博弈论基础作业及答案
博弈论基础作业及答案

博弈论基础作业

一、名词解释

纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡

贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识

见PPT

二、问答题

1.举出囚徒困境和智猪博弈的现实例子并进行分析。

囚徒困境的例子:军备竞赛;中小学生减负;几个大企业之间的争相杀价等等;

以中小学生减负为例:在当前的高考制度下,给定其他学校对学生进行减负,一个学校最好不减负,因为这样做,可以带来比其他学校更高的升学率。给定其他学校不减负,这个学校的最佳应对也是不减负。否则自己的升学率就比其他学校低。因此,不论其他学校如何选择,这个学校的最佳选择都是不减负。每个学校都这样想,所以每个学校的最佳选择都是不减负,因此学生的负担越来越重。

请用同样的方法分析其他例子。

智猪博弈的例子:大企业开发新产品;小企业模仿;股市中,大户搜集分析信息,散户跟随大户的操作策略

以股市为例:给定散户搜集资料进行分析,大户的最佳选择是跟随。而给定散户跟随,大户的最佳选择是自己搜集资料进行分析。但是不论大户是选择分析还是跟随,散户的最佳选择都是跟随。因此如果大户和散户是聪明的,并且大户知道散户也是聪明的,那么大户就会预见到散户会跟随,而给定散户跟随,大户只有自己分析。

请用同样的方法分析其他例子。

2.请用博弈论来说明“破釜沉舟”和“穷寇勿追”的道理。

破釜沉舟是一个承诺行动。目的是要断绝自己的退路,让自己无路可退,让自己决一死战变得可以置信。也就是说与敌人对决时,只有决一死战,这样才可以取得胜利。否则,如果不破釜沉舟,那么遇到困难时,就很有可能退却,也就无法取得胜利。穷寇勿追就是要给对方一个退路,由于有退路,对方就不会殊死抵抗。否则,对方退无可退,只有坚决抵抗一条路,因而必然决一死战。自己也会付出更大的代价。

3.当求职者向企业声明自己能力强时,企业未必相信。但如果求职者拿出自己的各种获奖证书时,却能在一定程度上传递自己能力强的信息。这是为什么?

由于口头声明几乎没有成本,因此即便是能力差的求职者也会向企业声明自己能力强。当然能力强的人也会声明自己的能力强。也就是说不同类型的求职者为了赢得职位会做出同样的声明。这样口头声明就不能有效的传递信息,因此企业不会轻易相信。而求职者拿出获奖证书就成了一个信号博弈。由于获得证书是要付出代价的,但代价却引人而异。能力强的个人可以相对轻易获得证书,而能力弱的个人却很难获得证书,以至于能力弱的人认为化巨大的代价获得证书,从而获得企业的职位是不划算的,因此干脆就不要获奖证书。因此获奖证书就成为个人能力的信号。

4.五个海盗抢得100颗钻石,他们为分赃发生了争议,最后达成协议,由抓阄确定出分赃顺序,然后按照民主程序进行分赃。首先由1号海盗提出分赃方案,五人共同举手表决。若赞成的占一半以上(不包括一半的情况),就按1号提出的方案分赃,否则1号将被扔到海里喂鲨鱼。接着由2号提出方案, 四人共同举手表决。若赞成的占一半以上(不包括一半的情况),就按2号提出的方案分赃,否则2号将被扔到海里喂鲨鱼,依此类推。如果你是1号海盗,你该提什么样的方案?说明理由。

假设(1)五个强盗都很聪明,而且大家知道大家很聪明,大家知道大家知道大家很聪明,如此等等。

(2)每个海盗都很贪婪,希望获得尽可能多的钻石,但是又不想为了钻石丢掉性命。

(3)给定一个方案,只有该方案大于他的备选方案所获的钻石时,海盗才选择赞成。

第一个海盗的提议应该是:五个海盗分别获得的钻石数目为97,0,1,0,2,或者97,0,1,2,0。

具体理由自己思考,方法是倒推法。

三、计算题

1.试计算表1中的战略式博弈的重复剔除劣战略均衡。

表1 一个战略式表述博弈

B

A U M

D

对B 而言,战略M 严格劣于R ;(因为1<4, 1<6,0<8),因此剔除B 的战略M ;构成新的博弈如下

B

A U M

D

在新的博弈中,

对于A 而言,战略U 严格劣于D(因为1<3,2<7),因此剔除A 的战略U ,构成新的博弈如下:

B

A

M D

对于新的博弈中,已经没有严格的劣战略,因此没有严格的劣战略可以剔除。所以该博弈不是重复剔除严格劣战略可解的。

但是存在弱劣战略。对于B 而言,战略L 弱劣于R (因为6=6,1<8),因此剔除B 的弱劣战略L ,构成新的博弈如下:

B

A

M

D 在新的博弈中,对于A 而言,战略(因为2<7),因此剔除A 的战略M ,构成新的博弈如下:

B

A

D

因此,重复剔除(弱)劣战略均衡为(D ,R )

(ps: 如果同学们用划线的方法求纳什均衡,就可以发现纯战略nash 均衡有两个:(M,L )和(D,R )但采用剔除弱劣战略的方法,把其中一个纳什均衡剔除掉了)

2. 试给出下述战略式表述博弈的所有纳什均衡。

2

1

U

D 给定1选择U ,2给定1选择D ,2的最佳选择是L (因为4>2),在相应位置划线 给定2选择L ,1的最佳选择是D (理由自己写),在相应位置划线 给定2选择R ,1的最佳选择是U (理由自己写),在相应位置划线 找两个数字下都划线的,显然有两个纯战略纳什均衡:),(R U 和),(L D 据Wilson 的奇数定理,可能有一个混合战略均衡。 设1选U 的概率为θ,那么选D 的概率为θ-1 设2选L 的概率为γ,那么选R 的概率为γ-1,

如果存在混合战略,那么2选战略L 和R 的期望收益应该应该相等,因此应有)1(23)1(42θθθθ-+==-+=R L U U

?=θ 自己求解 (2分) 同样,1选战略U 和D 的期望收益应该应该相等

)1(14)1(32γγγγ-+==-+=D U U U ?=γ 得混合均衡:?

3.市场里有两个企业1和2。每个企业的成本都为0。市场的逆需求函数为P=16-Q 。其中P 是市场价格,Q 为市场总产量。

(1)求古诺(Cournot )均衡产量和利润。

(2)求斯坦克尔伯格(Stackelberg )均衡产量和利润。

(1)设两个企业的产量分别为1q ,2q ,有21q q Q +=,因此利润函数分别为:

21211121116)16(q q q q q q q --=--=π

212

22221216)16(q q q q q q q --=--=π

利润最大化的一阶条件分别为:

0216211

1

=--=??q q q π 0216122

2

=--=??q q q π 因此企业1和企业2的反应函数分别为:

2162

1q q -=

2

161

2q q -=

联立,得到?21==q q 。自己求解

(2)设企业1先行,企业2跟进。两个企业的产量分别为1q ,2q ,因此利润函数分别为:

21211121116)16(q q q q q q q --=--=π

21222221216)16(q q q q q q q --=--=π

由逆向归纳法,在第二阶段,企业2在已知企业1的产量的情况下,最优化自己的产量,从而得到企业2的反应函数:

0216122

2

=--=??q q q π 因此企业2的反应函数为:2

161

2q q -=

在第一阶段,企业1考虑到企业2的反应,从而自己的利润函数为:

)2

16(

1616)16(1

1211212111211q q q q q q q q q q q ---=--=--=π (2分) 要使企业1的利润最大,应满足一阶条件:

01

1

=??q π 得到?1=q 。

所以?2=q 。

(PS: 古诺模型是完全信息静态博弈,求的是纳什均衡;斯坦伯格模型是完全信息动态博弈,求的是子博弈精炼纳什均衡)

4.(1)试给出图1中的完全信息动态博弈的子博弈精炼均衡和均衡结果。

(2)倘若2告诉1:2的战略是),,(j i c ,问此时1的最优战略是什么?(3)在(2)中,1和2的战略组合构成一个纳什均衡吗?均衡结果是什么?(4)(3)中的纳什均衡不是子博弈精炼的,原因是什么?

答: (1)

由逆向归纳法,子博弈精炼均衡为)],,(),,[(l e c g b ,均衡结果为(4,6)。 (2)若2的战略为),,(j i c ,则1的最优战略为),(f b 。

(3)给定2的战略为),,(j i c ,1的最优战略为),(f b ;反之,给定1的战略

),(f b ,战略),,(j i c 是2的一个最优战略。所以它们构成一个纳什均衡,均衡结

果为(6,3)。

(4)因为2的战略),,(j i c 中含有不可置信的威胁i ,使1在f 和g 之间不敢选g 。当博弈进行到2在l 与i 之间进行选择的时候,2必会选l ,给定如此,1选g 而不是f ,此时2会选e ,这就是子博弈精炼均衡。

5、试解出下述不完美信息动态博弈的精炼贝叶斯均衡。

1 R

(1,2)

当“2”看见“1”未选R 时,设他认为“1”选L 的概率为P , “1”选L '的概率为1-P ,则“2”选l 的期望支付为:

P P P 31)1(14+=-?+

“2”选r 的期望支付为

P P P -=-+?2)1(21

当P P ->+231,即4

1

>

P 时,“2”选l ,而给定“2”选l ,“1”选L 收益为2,选L '的收益为3,选R 的收益为1,因此“1”会选L '。而给定“1”

选L ',“2”认为410<=P (注意:P 是“1”选L 的概率),与4

1

>P 矛盾。故

4

1

>P 不会有均衡;

当P P -≤+231,即41

≤P 时,“2”选r ,给定“2”选r ,“1”选L 收益

为0,选L '的收益为7,选R 的收益为1,因此“1”会选L '。而给定“1”选L ',

“2”认为0=P ,与41

≤P 吻合。于是,得到均衡战略:{}r P L ,0,=',即“1”

在第一阶段选择L ',“2”虽然看不到“1”的选择,但“2”认为“1”选择L 的概率为0,所以“2”在第二阶段选择r ,这样的战略构成了一个贝叶斯精炼

纳什均衡。均衡结果为(7,2)。

经济学专业的读书报告

酷玩经济学 图书馆里关于经济学的书籍满目琳琅,书架上的经济学丛书甚至多不可耐,翻开一看难免都属于文字生硬类型的,要不就是公式文字或专业术语让人头脑晕厥。但是从中我发现了一本封面设计比较特别的讲解微观经济学的书,叫《酷玩经济学》。这本书的封面就是有几张诙谐的小人图,比如两个海盗剑拔弩张为争夺一箱宝物的图片。这样吸引了对这本书的兴趣,让我感觉到了它的不同之处。完整阅读本书,要说它最大的特点是什么,我想那应该就是“通俗易懂、诙谐风趣”吧。 本书的作者是放眼全球唯一一个用脱口秀讲经济学的美国经济学家,尤伦·鲍曼(Yoram Bauman),他最大的愿望是通过脱口秀表演向全世界展示最有趣的经济学,所以本书的内容、引喻都是十分有趣而且贴近生活的,让我们在一边学习到经济学的知识的同时一边笑呵呵地联用到身边的生活当中去。本书一直紧扣微观经济学的重要问题进行论述:在什么样的情况下,个体最优化为整体带来好的结果呢?虽说这个问题在微观经济里是一个十分宏大的问题,甚至没有最明确的答案,但是作者为我们分析了个人的追求,还有群体之间的互动,最后就是分析市场的互动,层层加深,既不落窠臼又能创新求精。本书分为三个部分共16章,第一部分,追求最优化的个体;第二部分,策略性互动;第三部分,市场互动。 在正文开篇之前前言之前,有一个“挑战曼昆,鲍曼VS曼尼(经济大师)”部分。十大曼昆原理: 原理一:人们面临权衡; 原理二:某事的成本,就是你为得到它而放弃的东西; 原理三:理性人会从边际的角度思考; 原理四:面对刺激,人们做出响应; 原理五:交易能让所有人更好过; 原理六:大多数时候,市场是组织经济活动的好办法; 原理七:政府有时可以改善市场结果; 原理八:一个国家的生活水平取决于其生产商品和服务的能力 原理九:政府印的钱太多,价格就上涨; 原理十:短期而言,社会要在通货膨胀和失业率之间进行权衡。 这些话都是有专业水准的总结吧,这样的文句需要理解记忆甚至背诵,但是身为第一脱口秀经济达

进化博弈论读书心得

进化博弈论读书报告 汪波 1973年,梅拉德·史密斯和普瑞斯将博弈论的思想引入到生物演化的分析中,二人提出了进化稳定策略(ESS ),随着1978年, Taylor 和Jonker 发现了进化稳定策略和复制动力学之间的关系,标志着进化博弈理论的诞生,因为与复制动力学之间的关系,进化稳定策略也因此成为进化博弈理论最经典的概念。1982年,梅拉德·史密斯出版了《演化与博弈论》,该书揭示动物群体的行为变化的动力学机制,也因此书他被称为进化博弈论之父,1995年,Weibull 著作了《Evolutionary Game Theory 》,2009年初,Sandholm 出版了《Population Game and Evolutionary Dynamics 》专著,这篇读书报告是在看了这三本著作的很少的一部分内容之下,理解其中一些浅显的内容后完成的。 一、进化稳定策略最初的模型 进化博弈理论是将博弈论引入到生物学背景下产生的,当生物的特定表现型的适应度依赖于群体中的频率分布时,进化博弈论就是从这个角度来思考生物演化的问题的一种方法,古典博弈中,参与者根据自利的原则表现出理性行为,但在生物进化的背景下是不合适的,由此,理性原则被群体的动态性和稳定性取代,而自利原则则被达尔文的适应度所取代。在一些重要的假设下,将会得到博弈的一个新形式解:进化稳定策略。它是这样一个策略,如果整个群体的每个成员都采取这个策略,那么在自然选择的作用下,不存在一个具有突变特征的策略能够侵犯这个种群。 最初的简化的模型由梅拉德·史密斯和普瑞斯给出,他和普瑞斯也给出了进化稳定策略的数学式的描述定义,这一模型的本质特征是假设该群体有无限大的规模,繁衍以无性生殖的方式进行,竞争只在两个不存在任何差异的对手间展开即是成对的竞争。生物学中价值是指两个动物为了争夺资源而增加的或者减少的达尔文适应度。故我们用适应度作为最后个体的收益的衡量,假想在这个无限的种群中,有两个策略I 、J ,每一个成员都采取这两个策略之一,且策略的选择是随机的,在有竞争前个体的初始适应度为0w ,再假设整个群体中选择I 的概率为p ,()w I 、()w J 分别表示选择相应策略带来的适应度,而(,)E I J 表示个体选择策略I 而对手选择J 时的收益,其他(,)E I I 等表示类同的意义。 若每一个个体都参与到竞争当中,则有 0()=+(1-p )(,)(,)w I w E I I p E I J + (1-1) 0 ()=+(1-p )(,)(,)w J w E J I p E J J + (1-2) 稳定的策略具有下列性质:整个种群中几乎所有的个体都采取了这个策略,且这些个体的 适应度必将高于竞争对手或者可能出现的突变异种的适应度,否则竞争对手或者产生的突变 异种会侵害整个种群,以致种群的削弱或者毁灭等,这时此策略便不可能是稳定的策略。若 I 是进化稳定策略,则()()w I w J >,且1p ,所以当I J ≠,有 (,)(,)E I I E J I > (1-3) 当(,)(,)E I I E J I =时有 (,)(,)E I J E J J > (1-4) 满足上述条件(1-3)、(1-4)的策略就称为进化稳定策略,而上述的两个条件1-3、1-4也被认为是判别E SS 的标准条件。 上述的策略是在纯策略情形下考虑的,当策略I 是从一个可能策略集合中随机的选择而

博弈论基础作业及答案【最新资料】

博弈论基础作业 一、名词解释 纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡 贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识 见PPT 二、问答题 1.举出囚徒困境和智猪博弈的现实例子并进行分析。 囚徒困境的例子:军备竞赛;中小学生减负;几个大企业之间的争相杀价等等; 以中小学生减负为例:在当前的高考制度下,给定其他学校对学生进行减负,一个学校最好不减负,因为这样做,可以带来比其他学校更高的升学率。给定其他学校不减负,这个学校的最佳应对也是不减负。否则自己的升学率就比其他学校低。因此,不论其他学校如何选择,这个学校的最佳选择都是不减负。每个学校都这样想,所以每个学校的最佳选择都是不减负,因此学生的负担越来越重。 请用同样的方法分析其他例子。 智猪博弈的例子:大企业开发新产品;小企业模仿;股市中,大户搜集分析信息,散户跟随大户的操作策略 以股市为例:给定散户搜集资料进行分析,大户的最佳选择是跟随。而给定散户跟随,大户的最佳选择是自己搜集资料进行分析。但是不论大户是选择分析还是跟随,散户的最佳选择都是跟随。因此如果大户和散户是聪明的,并且大户知道散户也是聪明的,那么大户就会预见到散户会跟随,而给定散户跟随,大户只有自己分析。 请用同样的方法分析其他例子。 2.请用博弈论来说明“破釜沉舟”和“穷寇勿追”的道理。 破釜沉舟是一个承诺行动。目的是要断绝自己的退路,让自己无路可退,让自己决一死战变得可以置信。也就是说与敌人对决时,只有决一死战,这样才可以取得胜利。否则,如果不破釜沉舟,那么遇到困难时,就很有可能退却,也就无法取得胜利。穷寇勿追就是要给对方一个退路,由于有退路,对方就不会殊死抵抗。否则,对方退无可退,只有坚决抵抗一条路,因而必然决一死战。自己也会付出更大的代价。

《经济学原理》读书报告

《经济学原理—微观经济学分册》读书报告 张行 08信管一班 2011-7-31 一、书名:《经济学原理—微观经济学》第五版 二、著者:N·格里高利·曼尼(N·Gregory·Mankiw)(梁小民梁 砾翻译) 三、出版社:北京大学出版社 四、页数:540 五、内容大意: 这本书共分为七篇,二十二章。书本还有下册,只是在图书馆没有借到,索性只能观摩这一本书了。 第一篇:【导言】,可以说是全书的精髓所在。该篇包含了三章,第一章:【经济学的十大原理】;第二章:【像经济学家一样思考】;第三章:【相互相关性与贸易的好处】。其中第一章的十大原理几乎是后边经济学理论的基石。其次是要了解到经济学家是怎么样看待问题的。 第二篇:【市场如何运行】。该片包含有三章,第四章:【供给与需求的市场力量】;第五章:【弹性及其应用】;第六章【供给、需求与政府政策】。这篇也可以说是一个基础了,这里充分的介绍了市场中“看不见的手”以及需求,供给的弹性和政府政策的关系。 第三篇;【市场和福利】。该篇包含有三章,第七章:【消费者、生产者与市场效率】;第八章:【应用:赋税的代价】;第九章:【应用国际贸易】。这篇介绍了基础知识消费者剩余,生产者剩余,以及市场效率。接着就介绍了知识方向的纵向延伸及其应用。 第四篇:【公共部门经济学】。第十章:【外部性】;第十一章:公共物品和公共资源;第十二章,【税率的设计】。这一部分,可以从中看到一些可以改变经济的一些因素。比如说税收,还有外部的因素,污染以及环境。其中还有介绍到公共物品与公共资源的介绍。“搭便车问题”这里挺好看的。

第五篇:【企业行为与产业组织】。第十三章:【生产成本】;第十四章:【竞争市场上的企业】;第十五章:【垄断】;第十六章:【垄断竞争】;第十七章;【寡头】。这一篇告诉了我们经济学家看到成本与会计看到的成本有明显的不同,经济学家研究的更为细致,把成本看出两部分有显性和隐性之分。其次还对竞争和垄断做了介绍。其中博弈论在寡头中知识很是有用。他可以解决很多的问题。 第六篇:【劳动市场经济学】。第十八章:【生产要素】;第十九章:【收入与歧视】;第二十章:【收入不平等与贫困】。这篇介绍到了与我们息息相关的东西,收入。这里可以解释现实社会中那些不平等与贫困的原因,值得有看几遍。 第七篇:【深入研究的论题】。第二十一章:【消费者选择理论】;第二十二章:【微观经济学前沿】。这一篇和我们专业课《信息经济学》很相似,它介绍了逆向选择,道德风险,以及各种定理。这一篇感觉挺精妙的。 六、读后心得感想: 在图书馆无意看到这本书,开始只是随便看看,只是没想到看着觉得这本 书说挺吸引人的,首先是作者给我们地位就是一个入门级的经济学者。开始会觉得这里我都懂,而且作者举了很多身边有趣的例子,让我感觉到经济学就在我的身边一样。花了一个多月终于把它给看完了,虽然其中有很多的地方自己没有认认真真的其花时间去学习,只能说比较深入而且很专业的知识我是没有去深入的学习了。作者通过浅显易懂的案例,让经济学学习起来更加的得心应手,真正的生活中的经济学。 这本《经济学原理》第一章的十大经济学理论,这里有必要摘录出来:一、人们如何做决策。1:人们面临权衡取舍;2:某种东西的成本是为了得到它所放弃的东西;3:理性人考虑边际;4:人们会对激励做出反应;二、人们如何相互交易:5:贸易可以使每个人的状况都变得跟好;6市场通常是组织经济学活动的一种好方法;7:政府有时可以改善市场结果;三、整体经济如何运行,8:一国的生活水平取决于它所生产物品与劳务的能力,9:当政府发行了过多的货币时,物价将会上升;10:社会面临通货膨胀与失业之间的短期权衡取舍。

博弈论复习题及答案

囚徒困境说明个人得理性选择不一定就是集体得理性选择。(√) 子博弈精炼纳什均衡不就是一个纳什均衡。(× ) 若一个博弈出现了皆大欢喜得结局,说明该博弈就是一个合作得正与博弈.()博弈中知道越多得一方越有利。( ×) 纳什均衡一定就是上策均衡。(× ) 上策均衡一定就是纳什均衡。(√) 在一个博弈中只可能存在一个纳什均衡。 (×) 在一个博弈中博弈方可以有很多个。(√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。 (√) 在博弈中纳什均衡就是博弈双方能获得得最好结果。 (× ) 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少. (×)上策均衡就是帕累托最优得均衡。(×) 因为零与博弈中博弈方之间关系都就是竞争性得、对立得,因此零与博弈就就是非合作博弈。 (×) 在动态博弈中,因为后行动得博弈方可以先观察对方行为后再选择行为,因此总就是有利得。(×) 在博弈中存在着先动优势与后动优势,所以后行动得人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒得困境博弈中两个囚徒之所以会处于困境,无法得到较理想得结果,就是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢得时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益得策略组合.(√)不存在纯战略纳什均衡与存在惟一得纯战略纳什均衡,作为原博弈构成得有限次重复博弈,共同特点就是重复博弈本质上不过就是原博弈得简单重复,重复博弈得子博弈完美纳什均衡就就是每次重复采用原博弈得纳什均衡。(√ ) 多个纯战略纳什均衡博弈得有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略与纯战略轮流采用。(√) 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)得子博弈完美均衡结局,其中对于任意得t<T,在t阶段得结局并不就是G得Nash均衡.(√)(或:如果阶段博弈G={A1,A2,…,An; u1,u2,…,un)具有多重Nash均衡,那么该重复博弈G(T)得子博弈完美均衡结局,对于任意得t<T,在t阶段得结局一定就是G得Nash均衡。) 零与博弈得无限次重复博弈中,所有阶段都不可能发生合作,局中人会一直重复原博弈得混合战略纳什均衡.(√)(或:零与博弈得无限次重复博弈中,可能发生合作,局中人不一定会一直重复原博弈得混合战略纳什均衡.(×)) 原博弈惟一得纳什均衡本身就是帕雷托效率意义上最佳战略组合,符合各局中人最大利益:采用原博弈得纯战略纳什均衡本身就是各局中人能实现得最好结果,符合所有局中人得利益,因此,不管就是重复有限次还就是无限次,不会与一次性博弈有区别。(√) 原博弈惟一得纳什均衡本身就是帕雷托效率意义上最佳战略组合,符合各局中人最大利益,但惟一得纳什均衡不就是效率最高得战略组合,存在潜在合作利益得

博弈论各章节课后习题答案 (4)

第四章谈判与协调 1.帕累托占优均衡和纳什均衡的关系是什么? 纳什均衡的基本思想是:每一个局中人选择一个策略,由所有局中人的策略构成了一个策略组合;在其它局中人选定策略不变的情况下,若某一个局中人单独地违背自己已选的策略,那么他的收益只会下降(或收益不会增加)。这样的策略组合构成一个均衡局势,并命名为纳什均衡。纳什均衡有纯策略的纳什均衡和混合策略的纳什均衡。一个博弈中有不止一个纳什均衡时,就构成一个多重纳什均衡问题。在多重纳什均衡下给出一些选择标准就得到一些特定的纳什均衡。其中帕累托占有纳什均衡是根据这样的选择标准选择的均衡。在博弈 中,若均为G 的其纳什均衡,若满足[,{},{}]i i G N S P =12,,,m s s s ????0 i s ?,0()()i i i j P s P s ?? >1,2,,,1,2,,i n j m ==??则称为博弈G 的帕累托占优纳什均衡。可见帕累托占有纳什均衡是纳什均衡中收益最大 0i s ? 的一种均衡。 2.分别找出具有下列性质的2人博弈的例子。 (1)不存在纯策略纳什均衡; (2)至少有两个纳什均衡,并且其中之一是帕累托占优均衡。 (1 )不存在纯策略的纳什均衡:该博弈不存在纯策略的纳什均衡 (2) 该博弈有三个纳什均衡:(战争,战争)、(和平,和平)和一个混合策略纳什均 衡。很显然,(和平,和平)是一个帕累托占优纳什均衡。 2525((,),(,77773.假设在某一产品市场上有两个寡头垄断企业,它们的成本函数分别为: TC 1=0.1q +20q 1+100000TC 2=0.4q +32q 2+20000 2122这两个企业生产一同质产品,其市场需求函数为:Q=4000-10p 。试分别基于古诺模型和纳什谈判模型求解两企业的利润。 解:由和400010Q p =?12 Q q q =+得124000.1() p q q =?+战争 和平国 家 1战争-5,-58,-10和平-10,810,10

(整理)合作竞争读书笔记.

《合作竞争》读书笔记 Yhq5115 在美国,包括我们在内的许多人都把研究《孙子》作为学习战略的必经之路。 比别人做得更好或更省钱是创造和获取价值的一个重要手段,但也不尽然。就拿微软公司来说,它之所以取得巨大的成功就是由于英特尔公司的存在及它们产品之间的互补性。 你不需要熄灭别人的灯光以使自己的明亮。 博弈论直指所有问题的关键:找到正确的战略并做出正确的决策。博弈论是在变化的商业环境中求生的思想方法。 我们认为博弈论通过以下五个要素来描述任何竞争:参加者、附加值、规则、战术和范围。简称PARTS。 真正的成功来自于主动地改变你参与的游戏:按照你的意愿改变游戏,而不是参与你发现的游戏。 如果商业是一种游戏,那么谁是参与者?答案是:顾客、供应商、竞争者还有互补者。 互补者的定义:如果顾客在同时拥有你和其他参与者的产品时获得的价值,要高于单独拥有你的产品时的价值,那么这个参与者就是你的互补者。 价值链:顾客 竞争者——公司——互补者 供应商 竞争者的定义:和互补者正好相反。 价值链的对称性,顾客和供应商扮演了对称的角色,竞争者和互补者扮演了镜像的角色。 从纸牌游戏到商业游戏,甚至是人生游戏,弄清在每个游戏中谁拥有主动权的关键就是附加值。你的附加值=你参与游戏时市场的大小—你不参与游戏时的市场的大小 如果我加入游戏,我会是游戏增加什么?不要只考虑自己所能接受的最低价,一定要考虑其他人为了让你参加游戏会付给你多少。 一份关于改变的清单 为了帮助你更加有效地改变游戏,我们列出了一份进行自我诊断的问题清单。这些根据PARTS模式排列的自我检查清单 PARTS模式列出的问题是很经典的。 关于参与者的问题 你是否已经为自己的机构画出了价值链图?并注意使这份参与者名单尽可能完整。 1、在你和你的客户、供应商、竞争者及互补者的关系中,合作与竞争的机会各是什么? 2、你是否愿意改变参与者的阵容?特别是,你希望在游戏中引入哪些新的参与者? 3、如果你成为一个游戏的参与者,谁应该是赢家,谁应该是输家? 关于附加值的问题: 1、你的附加值是什么? 2、如何提高你的附加值?特别是,你能创造忠实的客户和供应商吗? 3、游戏中其他参与者的附加值是什么?你是否愿意去限制他们的附加值? 关于规则的问题:

博弈论练习题2答案

博弈论练习题2答案

111111111111111111 博弈论练习题(四) 一、什么是子博弈精炼纳什均衡? 答:将纳什均衡中包含的不可置信的威胁策略剔除出去。它要求参与者的决策在任何时点上都是最优的。由于剔除了不可置信的威胁,在许多情况下,精炼纳什均衡也就缩小了纳什均衡的个数。只有当参与人的策略在每一个子博弈中都构成纳什均衡叫做精炼纳什均衡。或者说,组成精炼纳什均衡的策略必须在每一个子博弈中都是最优的。 二、参与人的理性问题对动态博弈分析的影响是否比静态博弈的影响更大?为什么? 答:正确,博弈论要求个体具有始终追求自身利益最大化的理性意识和理性能力的“自我”个体理性,这是静态博弈的范畴。除此之外,还要求相关的参与者具有层次较高的“交互理性”,要求不同个体之间在理性和行为方面具有一种“默契”。即,人们的自身利益的最大化不仅取决于自己的选择,还取决于与之相关的其他人的选择与行为,那么为了实现自己的最大利益,个体的理性决策就必须考虑他人的理性选择与行为。作

为博弈论的基础,交互理性是其基本的理性要求。博弈论还要求有关博弈的结构、各个博弈参与者的得益函数以及各个博弈参与者的理性等“知识”是所有博弈参与者之间的“共同知识”。也就是,每个博弈参与者不仅要首先明确自己和其他参与者所有可选的策略,还需知晓各种情况下自己最终的收益或其概率分布,并且每个博弈参与者都知道各个参与者掌握这些信息;更为重要的是,每个博弈参与者都知道所有参与者都是理性的,都知道其他博弈参与者知道所有参与者都是理性的,都知道其他博弈参与者知道其他博弈参与者知道所有博弈参与者都是理性的------。理性的共同知识假设是非合作博弈理论的一个非常重要和关键的假设,是实现交互理性和理性主义的纳什均衡的基本前提,这些,都是动态博弈的范畴。因此说,参与者理性问题对动态博弈的分析影响更大。 三、纳什均衡和精炼纳什均衡存在哪些问题?答:纳什均衡存在的问题: (1)不是所有博弈都存在纳什均衡如纯策略就不存在混合策略则一定会存在纳什均衡,它是通

博弈论读书报告

《妙趣横生博弈论》读书报告 ——山东企业三期:孙雯学校安排读了这么多的书,本以为《妙趣横生博弈论》会很容易懂,但看来看去还是一知半解,仅能就书中一些自己比较认可的观点跟大家分享一下了。 一、博弈论给我们最重要的教训就是必须理解对方的想法。 人们在本性上一般倾向于以自我为中心,只关注自己的理解和自身的需要。但如果想提高到“策略的艺术”的层次,那就不能囿于自我中心,而是必须要理解他人的立场、他人的观念以及他们看重什么,并运用这种对对手的理解来指导自己的行动。在这种理解的基础上,怎样很好地把竞争和合作结合起来,就是一种艺术。 博弈论本来就是科学的理论和行为的艺术。它不应该是沉闷的,而应该是生动的;它不应该只是乏味公式,而应该拥有丰富的情感;它不应该只局限于竞争,更应着眼于通过竞争展开合作。 博弈论不应该被理解为阴谋诡计,不应该被理解为小聪明,不应该被理解为厚黑学,不应该被理解为你死我活的权谋术。博弈论应该是展开有效竞争与合作的理论,应该是大智慧,应该是个人理性融入社会的艺术。对于那些试图探求真实世界现象之因缘的人们来说,博弈论也是理解高度互动的人类社会的一种思想方法和分析工具。 二、博弈的“术”与“道” 如果只想着把博弈论用于人际斗争,那只能算是博弈之术;只有理性地融入社会,才是博弈之道。“术”的博弈只是嵌入在“道”的博弈中的一个小博弈,如果只关注于“术”而忘却于“道”,无异于只见树木、不见森林,或可一时得利,却可能对个人的长期利益和更大的成功产生至为糟糕的影响。正如两位作者在书中屡屡提到:人生中总是存在更大的博弈,因此个人的决策不应该只着眼于一个小博弈的胜负。能够看到多大、多远的博弈,取决于个人的胸襟和眼光。从某种意义而言,他们所谓的小博弈与更大的博弈之分,正是博弈的“术”与“道”之分。 不得民心的暴君不可能长期控制一个数目庞大的人群,一个暴徒出现,就足以让整个校园陷入恐慌,但是如果整个校园的人归于理性,团结一致对抗暴徒,就一定不会引起恐慌。 这两个例子表明只要大多数人同时采取行动,其实是很容易取得成功的。 不过,统一行动少不了沟通与合作,偏偏沟通与合作在这个时候变得非常困难;而且压迫者深知群众的力量有多大,所以还会采取特殊的措施,阻止他们的沟通与合作。因为每个人如果都按照自己的利益来行动,结果对集体来说可能是灾难性的。囚徒困境可能是博弈论

博弈论复习题(附答案)

囚徒困境说明个人的理性选择不一定是集体的理性选择。(√) 子博弈精炼纳什均衡不是一个纳什均衡。(×) 若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。()博弈中知道越多的一方越有利。(×) 纳什均衡一定是上策均衡。(×) 上策均衡一定是纳什均衡。(√) 在一个博弈中只可能存在一个纳什均衡。(×) 在一个博弈中博弈方可以有很多个。(√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。(√) 在博弈中纳什均衡是博弈双方能获得的最好结果。(×) 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(×)上策均衡是帕累托最优的均衡。(×) 因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。 (×) 在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×) 在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(√)不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√) 多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(√) 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t

张维迎《博弈论与信息经济学》部分答案

张维迎《博弈论与信息经济学》部分习题答案 如果图片不显示,用打印预览就可以了。 P127 第一题:领悟精神就可以了,而且每本书上都有这些例题,不找了。 第二题: UMD 为参与人1的战略,LMR 为参与人2的战略。前面的数字代表参与人1的得益,后面的代表参与人2的得益。 参与人2的R 战略严格优于M 战略,剔除参与人2的M 战略,参与人1的U 战略优于M 战略,剔除参与人1的M 战略,参与人1的U 战略优于D 战略,剔除参与人1的D 战略,参与人2的L 战略优于R 战略,剔除参与人2的R 战略。最后均衡为U ,L (4,3)。这样可能看不清,按照步骤一步步画出图就好多了。 第三题:恩爱型 厌恶型 用划线法解出,恩爱的都活着或者都死,厌恶的或者受罪,死了对方另一个人开心的不得了。 第四题:没有人会选择比原来少的钱,战略空间为{原来的钱,比原来多的钱}。支付为{0,原来的钱,比原来多的钱}。纳什均衡为选择原来的钱。要画图自己画画。 第五题:n 个企业,其中的一个方程:π1=q 1(a -(q 1+q 2+q 3……q n )-c ),其他的类似就可以了,然后求导数,结果为每个值都相等,q 1= q 2=……q n =(a-c)/(n+1)。或者先求出2个企业的然后3个企业的推一下就好了。

第六题:在静态的情况下,没有一个企业愿意冒险将定价高于自己的单位成本C ,最终P=C ,利润为0。因为每个参与人都能预测到万一自己的定价高于C ,其他人定价为C 那么自己的利益就是负的(考虑到生产的成本无法回收)。就算两个企业之间有交流也是不可信的,最终将趋于P=C 。现实情况下一般寡头不会进入价格竞争,一定会取得一个P 1=P 2=P 均衡。此时利润不为零,双方将不在进行价格竞争。 第七题:设企业的成本相同为C ,企业1的价格为P 1,企业2的价格为P 2。 π1=(P 1-C)(a-P 1+P 2),π2=(P 2-C)(a-P 2+P 1)。一阶最优:a-2P 1+C+P 2=0,a-2P 2+C+P 1=0。 解得:P 1=P 2=a+C ,π1=π2=a 2。 第八题:不会! 到纳什均衡为(A,A,A),(A,B,A),(B,B,B),(A,C,C),(C,C,C)。 第十题: 无纯战略纳什均衡,设参与人1为P 1~P 4,参与人2为Q 1~Q 4。 得到:-Q 2+Q 4=Q 1-Q 3=Q 2-Q 4=-Q 1+Q 3,推出:Q 1=Q 2=Q 3=Q 4=1/4。同理P 1=P 2=P 3=P 4=1/4。以上述的概率在杆子,老虎,鸡,虫子中选择一个。

博弈论的书心得体会

博弈论的书心得体会 篇一:阅读博弈论类书籍的心得体会 阅读博弈论类书籍的心得体会 图书情报宋静思 最近阅读的书目主要围绕在博弈论领域,由浅入深的从博弈论平话类书籍到博弈论的理论应用类书籍都有一些涉猎。近一个月来我所阅读的书目主要有王则柯的《新编博弈论平话》、高志明的《生存博弈》、黄涛的《博弈论教程—理论、应用》以及张维迎的《博弈论与信息经济学》。由于个人能力与知识储备的限制,对以上书目的认识理解和心得也是有限的,下面我仅对上述书目中能够引起我思考的一些理论和案例展开分析并阐述我的一点见解,以及提出我所认为的这些博弈理论可以分析的社会现象。 一、对博弈论平话类书籍的心得 首先从王则柯教授的《新编博弈论平话》和高志明教授的《生存博弈》这两本书使我我深刻的认识到博弈论作为一种科学的思维方法对我们在日常生活中科学的做出决策有重大的意义。它们都是以比较浅显的例子和故事普及博弈论的一些知识和方法,阐发博弈论的一些思想和观念。从囚徒困境、情侣博弈、诺曼底登陆模拟和慕尼黑谈判模拟等能够引起读者兴趣的故事入手,介绍静态博弈、动态博弈、纳

什均衡、零和博弈、双赢对局、帕累托优势、子博弈精炼纳什均衡等博弈论的基本概念,以及劣势策略消去法、相对优势策略下划线法、确定混合策略纳什均衡的反应函数法、动态博弈的倒推法等博弈论基本方法,在以上两本书的论述中很少使用到高等数学的知识,这两本书是使我对博弈论产生兴趣的启蒙老师,帮助我了解博弈论的若干初步知识。 从最初对这两本书的阅读我真正理解了什么是博弈决策,就拿我们生活中报考什么学校、从事什么职业、选择何种方式度过周末闲暇时光等这些例子来说,之所以称之为博弈决策,是因为在这些例子当中,我的身边往往存在和我情形相似的决策者,我们的思维和行动相互之间产生着很微妙的互动影响。博弈论研究的目的,就是要清晰地揭示蕴涵于这种互动影响中的基本概念和原理,从而帮助我们建立策略思维的意识。 看过囚徒困境后,我明白了为什么寡头企业不选择在市场上结盟而是竞相采取低价策略企图抢占更多的市场份额;又为什么多数情形是非合作博弈。虽然通过囚徒困境的博弈分析我可以理解上述现象产生的原因,然而究其根本原因,是什么导致了囚徒困境呢?这不禁引发了我的思考。设想如果两个罪犯充分相信同伙遵守最初的约定死咬着抵赖会有最后的困境出现么?如果联盟内部成员相信彼此遵守约定

博弈论习题及参考答案

《博弈论》习题 一、单项选择题1.博弈论中,局中人从一个博弈中得到的结果常被称为()。 A. 效用 B. 支付 C. 决策 D. 利润 2.博弈中通常包括下面的内容,除了()。 A.局中人 B.占优战略均衡 C.策略 D.支付 3.在具有占优战略均衡的囚徒困境博弈中()。 A.只有一个囚徒会坦白 B.两个囚徒都没有坦白 C.两个囚徒都会坦白 D.任何坦白都被法庭否决了 4.在多次重复的双头博弈中,每一个博弈者努力()。 A.使行业的总利润达到最大 B.使另一个博弈者的利润最小 C.使其市场份额最大 D.使其利润最大 5.一个博弈中,直接决定局中人支付的因素是()。 A. 策略组合 B. 策略 C. 信息 D. 行动 6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时的博弈具有()。 A.囚徒困境式的均衡 B.一报还一报的均衡 C.占优策略均衡 D.激发战略均衡 7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的策略称为()。 A.一报还一报的策略 B.激发策略 C.双头策略 D.主导企业策略 8.在囚徒困境的博弈中,合作策略会导致()。 博弈双方都失败 B.博弈双方都获胜A. C.使得先采取行动者获胜 D.使得后采取行动者获胜 9.在什么时候,囚徒困境式博弈均衡最可能实现()。 A. 当一个垄断竞争行业是由一个主导企业控制时 B.当一个寡头行业面对的是重复博弈时 C.当一个垄断行业被迫重复地与一个寡头行业博弈时 D. 当一个寡头行业进行一次博弈时 10.一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种策略是一种()。 A.主导策略 B.激发策略 C.一报还一报策略 D.主导策略 11.关于策略式博弈,正确的说法是()。 A. 策略式博弈无法刻划动态博弈

对博弈论的一点认识——学习《经济博弈论》有感

2010年第9卷第9期 产业与科技论坛2010.(9).9 Industrial &Science Tribune 对博弈论的一点认识 ———学习《经济博弈论》有感 □孙 鑫 【摘要】本文通过对《经济博弈论》一书的学习,探讨了博弈论在日常生活中的广泛应用和实用性,并通过房价博弈的举例, 说明了博弈论的基本思想可以帮助我们用全新的视角解决实际问题。 【关键词】博弈论;博弈;读书报告 【作者简介】孙鑫(1978 ),女,上海社会科学院信息研究所助理研究员 对《经济博弈论》一书的学习,激发了笔者对博弈论领域的浓厚兴趣, 通过对相关文献和书籍的阅读,对这一领域有了一些粗浅的认识,我们身边充满 了博弈,或者说,我们身边的许多行为、现象都可用博弈来概括。博弈论并非高深知识,它与我们的生活息息相关。 一、博弈论的广泛应用和实用性“博弈即一些个人、对组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并 加以实施,各自取得相应结果的过程。”博弈由英文“game ”翻译过来,过去每每听到博弈一词,都觉得这是一个高深莫测、充满神秘色彩的领域,如今通过了系统的学习, 才终于可以对“博弈”有一些粗浅的理解。 博弈论的英文名称为Game Theory ,也翻译为对策论、游戏论。作为一门现代学科体系,博弈论早在 半个世纪以前就已经出现, 但长期以来并没有受到足够重视,除了少数博弈论专家以外,很少有人知道 它。可是, 近年来却受到高度的重视和青睐。1994年三位致力于博弈论基础理论研究的经济学家共同 获得了诺贝尔经济学奖, 使得博弈论作为重要的经济学分支学科的地位和作用得到了最具权威性的肯定。此后1996年,诺贝尔经济学奖又由博弈论和信 息经济学家莫里斯和维克瑞获得,这进一步肯定了博弈论在经济学中的重要地位,同时也从一个侧面体现出博弈理论已经渡过了成长期,步入了成熟期。为什么目前博弈论在经济学中的地位上升得这么 快,博弈论在经济学中的应用,和经济学的结合的程度会发展得这么快呢? 首先,现代经济活动的规模越来越大,对抗性、 竞争性越来越强,特别是寡头垄断或垄断竞争市场,竞争和决策较量更是厂商经营活动的核心内容,这些都使得人们越来越重视经济活动的环境条件及其变化,越来越重视竞争者或合作者的反应,因此经济 决策的“博弈性”越来越强。在这种情况下,以给定环境条件下的个体理性行为分析为基础的局部均衡理论或一般均衡理论,比较静态分析,以及以它们为基础的经济理论,在解释现实经济问题时必然越来越力不从心。而将研究投注于传统经济学研究中忽略掉的,或为了简化讨论避而不谈的,经济活动中各个方面行为或决策时相互之间的反应或反作用,也就是策略和利益的互动性和互相依赖关系的博弈论,却不存在传统经济学理论中由于上述忽略和回避造成的经济模型脱离实际的缺陷,因此在许多情况下它所得出的结论更加符合经济现实和更加具有应用性,对参加经济互动的各方或国家政府的决策互动有更强的指导作用。这正是为什么当忽略经济活动中普遍存在的相互依存和相互作用的传统西方经济学在理解当今世界各种经济现象、预测经济、制订有效政策方面屡屡失灵之后,博弈论却日益受到重视,能够飞速发展的最根本的原因。 其次,一方面也是由于社会经济活动中竞争不断加剧的原因;另一方面则是信息技术和社会经济信息化的发展,使得人们认识信息的作用和规律的要求不断提高,从而促进了信息经济学的发展要求。 · 131·

博弈的秘诀:《策略思维》读书笔记

博弈的秘诀:《策略思维》读书笔记 一、概述 耶鲁大学教授奈尔伯夫和普林斯顿大学教授迪克西特的《策略思维》,用许多活生生的例子,向没有经济学基础的读者展示了博弈论策略思维的道理,对于日常生活及工作方面的决策提供有力的理论保障,具有实践价值。 二、“策略思维”基本概念 (一)策略思维 策略思维是关于了解对手打算如何战胜你,然后战而胜之的艺术,关于策略思维的科学称为博弈论。 (二)混合策略博弈 混合策略博弈是指博弈的参与人通过模糊自己的策略动机迷惑对手的博弈。在人们的生活中,谈恋爱就是一种混合策略博弈。 (三)博弈 博弈是一种策略的相互依存状况:你的选择 (即策略)将会得到什么结果,取决于另一个或者另一群有目的的行动者的选择。处于一个博弈中的决策者称为参与者,而他们的选择称为行动。 三、运用“策略思维”遵循的法则 (一)法则1:向前展望,倒后推理。 展望你的最初决策最后可能导致什么结果,利用这个信息确定自己的最佳选择。一个普遍的观点是若要运用向前展望、倒后推理的原理,不可缺少的前提是后行者可以观察到先行者的行动。 向前展望、倒后推理原理的另一个适用条件:策略必须是不可逆转的。(二)法则2:假如你有一个优势策略,请照办。 “优势策略”的优势是指你的这个策略对你的其他策略占有优势,而不是对你的对手的策略占有优势。无论对手采用什么策略,某个参与者如果采用优势策略,就能使自己获得比采用任何其他策略更好的结果。 以策略观点来看,各方均有一个优势策略的博弈是最简单的一种博弈。虽然其中存在策略互动,却有一个可以预见的结局:全体参与者都会选择自己的

优势策略,完全不必理会其他人会怎么做。只有一方拥有优势策略的博弈其实也非常简单。拥有优势策略的一方将采用其优势策略,另一方则针对这个策略采用自己的最佳策略。 (三)法则3:剔除所有劣势策略,不予考虑,如此一步一步做下去。 对于任何一个相继选择并且数目有限的博弈,总是存在某种最佳策略。假如你不得不冒一点风险,通常都是越早冒险越好。 (四)法则4:寻找这个博弈的均衡,即一对策略,按照这对策略做,各个参与者的行动都是对对方行动的最佳回应。(纳什均衡) 四、使用方法 (一)后手原则 跟在别人后面第二个出手有两种办法:一是一旦看出别人的策略,你立即模仿,好比帆船比赛的情形;二是再等一等,直到这个策略被证明成功或者失败之后再说,好比电脑产业的情形。而在商界,等得越久越有利。 一旦你发现自己正在玩一个策略博弈,你必须确定其中的互动究竟是相继发生的还是同时发生的。 (二)同时行动的博弈 在同时行动的博弈中,有三个行动法则:一是寻找和运用优势策略;二是寻找和避免劣势策略,与此同时假设你的对手也在这么做;三是寻找和运用均衡。 (三)以牙还牙策略 合谋集中在比较透明的抉择层面,竞争则转向不那么容易看出来的层面,我们把这个现象称为“提高不透明度定律”。 密歇根大学的政治学学者罗伯特·阿克塞尔罗德 (Robert Axelrod)认为,以牙还牙法则体现了任何一个行之有效的策略应该符合的四个原则:清晰、善意、刺激性和宽容性。长期而言,以牙还牙策略会有一半时间合作,一半时间背叛。 可以考虑遵循以下指导原则,作为迈向这一方向的一步。(1)开始合作。(2)继续合作。(3)计算在你合作的情况下对方看上去背叛了多少次。(4)假如这个百分比变得令人难以接受,转向以牙还牙策略。

博弈论笔记

活学活用博弈论 威胁,承诺与序惯博弈 1 要使威胁与承诺可信的方法:切断退路交出控制权切断联系建立起一致的诚实信用按顺序各个击破的威胁非理性的疯狂和精神失常。 2 重复博弈的长期性与多阶段对于背叛很有帮助。 3 可置信的问题总是使截止期限很难确定。 4 人们一旦受到伤害就很难恢复,不过如果继续与违背交往对于自己有所补偿的话,那么最好的做法就是宽恕。但是那些被宽恕的人很可能在将来对你或者别人造成更大的伤害,所以法律对于那些伤害别人的人进行强制性制裁反而会降低对人们的伤害。 5 公司并购的毒丸:当并购者对标的公司的控股达到一定比例时,标的公司让原有股东(不包括并购者)拥有额外购股权或者发放红利给员工,以增加并购者的成本,确保自己的经营权。 6 阻止竞争对手进入的价格门槛:高于自己的成本同时低于对手的成本,让对手进入后没有利润而自己有微薄的利润。 7 连锁店悖论:第十个连锁店如果不会降价,那么第九个就不会降价,第九个不会降价,那么第八个也不会降价,如此类推:第一个连锁店也不会降价。所以进入者不会对连锁店的降价威胁置信。 8 对于一个理性的竞争对手来说,他不会通过对你的印象来判断你所说的话,而是从你的威胁和承诺是否对于你的将来有利来判断你是否可信。 9 只关心自己的收益是否最大化,不要因为对手比自己赚的多而心生烦恼。 10 除非你选择退出游戏,否则不要考虑自己的沉没成本。在有沉没成本的时候做的决策时 考虑的成本有且只有自己的边际成本。 11 靠降价来阻止对手进入并非上策,因为价格易变。 价格竞争的危险 1 要使报复有效,那么就要迅速做出反应并且采取切实的行动。当对手相信你会全力以赴 时他就会因为担心你的报复而不采取行动了。 2 采用复杂的定价策略可以有效的避免价格竞争。 3 如果采用价格竞争那么就会对服务打折,如果采用服务竞争那么就会避免价格竞争。 4 对于商家来说服务,品质,商品颜色,商标品牌都可以竞争,尽可能避免价格竞争。但 是即使没有价格竞争也会有竞争者进入从而引起价格竞争,此时对于商家来说把价格定得比较复杂可以避免价格竞争。 一次性博弈 1 一次性博弈的目标也在于自己的利益最大化,不要在意对手得到多少。 2 一次性博弈时就应避免去想对手会做什么,而应该把注意力放在对手能做什么。 3 解决一次性博弈的最好办法是找出自己的严格优势策略。所谓优势策略就是说对于自己 的其他策略而言其中一个策略比较起来都会获得最大的收效或者不会比其他策略差。 4 严格劣势策略就是说比起其他策略来说获得的收效总是最小,它是严格优势策略的反面。 一次性博弈时应该考虑到对手会避免采用严格劣势策略,采用严格优势策略。 5 最优反应是指相对于对手的特定策略来说自己采用什么策略能够获得最大的收效的反

博弈论第4章答案

R R M 4.1.a 标准式 1↖2 L ’ R ’ 4,1 0,0 3,0 0,1 2,2 2,2 纯战略纳什均衡:( L, L ’ ) ( R, R ’ ) 子博弈精炼纳什均衡:( L, L ’ ) ( R, R ’ ) 精炼贝叶斯纳什均衡:( L, L ’ ) 4.1.b 标准式 1↖2 L ’ M ’ R ’ 1, 3 1, 2 4, 0 4, 0 0, 2 3, 3 2, 4 2, 4 2, 4 纯战略纳什均衡:( R, M ’ ) 子博弈精炼纳什均衡:( R, M ’ ) 精炼贝叶斯均衡: 没有 4.2 标准式 1↖2 L ’ R ’ 2,2 2,2 3,0 0,1 0,1 3,0 六种纯战略组合,每种组合中都至少有一方存在偏离的动机,因此不存在纯战略纳什均衡,因此也就不存在纯战略精炼贝叶斯均衡。 求混合战略精炼贝叶斯均衡: 设参与者1选择L 、M 、R 的概率分别为1,2,12(1)p p p p ?? 参与者2选择L ’和R ’的概率分别为,(1)q q ? 在给定参与者1的战略下,参与者2选择L ’和R ’的收益无差异,则: 1212 120*1*1*0*p p p p p p +=+?= 给定参与者2的战略,参与者1选择L 、M 、R 的收益无差异,则: 121212 12[3*0*(1)][0*3*(1)]2*(1) 41:**,*112 p q q p q q p p p p p p q +?=+?=??=== =又 联立得 所以 L L M L L M L R L

4.3答案(见4.5) 4.4 表示方法 第一个括号,逗号左边为type 1发送者信号,逗号右边为type 1发送者信号; 第二个括号,逗号左边为接收到L 信号的反应,逗号右边为接收到R 信号的反应; P 为信号接收者对type 1发送L 的推断,q 为信号接收者对type 1发送R 的推断 (a ) [(,),(,),1/2] [(,),(,),1/2] [(,),((1),),1/2][(,),(,),1,0] R R u u p R R d u p R R d u u p L R u d p q αα><+?=== (b ) [(,),(,),1/2,2/3] [(,),(,),1,0][(,),(,),0,1] L L u u p q L R d u p q R L u d p q =<==== 中文版习题4.5答案 (a ) [(,),(,),1/3,1/2]R R u d p q >= (b ) 12121212[(,,),(,),1/3,1/2] [(,,),(,),1/2,0] L L L u u p p q q L L R u d p p q q ==+<==+=

相关主题