搜档网
当前位置:搜档网 › 博弈论练习2答案

博弈论练习2答案

博弈论练习2答案
博弈论练习2答案

111111111111111111

博弈论练习题(四)

一、什么是子博弈精炼纳什均衡?

答:将纳什均衡中包含的不可置信的威胁策略剔除出去。它要求参与者的决策在任何时点上都是最优的。由于剔除了不可置信的威胁,在许多情况下,精炼纳什均衡也就缩小了纳什均衡的个数。只有当参与人的策略在每一个子博弈中都构成纳什均衡叫做精炼纳什均衡。或者说,组成精炼纳什均衡的策略必须在每一个子博弈中都是最优的。

二、参与人的理性问题对动态博弈分析的影响是否比静态博弈的影响更大?为什么?

答:正确,博弈论要求个体具有始终追求自身利益最大化的理性意识和理性能力的“自我”

个体理性,这是静态博弈的范畴。除此之外,还要求相关的参与者具有层次较高的“交互理性”,要求不同个体之间在理性和行为方面具有一种“默契”。即,人们的自身利益的最大化不仅取决于自己的选择,还取决于与之相关的其他人的选择与行为,那么为了实现自己的最大利益,个体的理性决策就必须考虑他人的理性选择与行为。作为博弈论的基础,交互理性是其基本的理性要求。博弈论还要求有关博弈的结构、各个博弈参与者的得益函数以及各个博弈参与者的理性等“知识”是所有博弈参与者之间的“共同知识”。也就是,每个博弈参与者不仅要首先明确自己和其他参与者所有可选的策略,还需知晓各种情况下自己最终的收益或其概率分布,并且每个博弈参与者都知道各个参与者掌握这些信息;更为重要的是,每个博弈参与者都知道所有参与者都是理性的,都知道其他博弈参与者知道所有参与者都是理性的,都知道其他博弈参与者知道其他博弈参与者知道所有博弈参与者都是理性的------。理性的共同知识假设是非合作博弈理论的一个非常重要和关键的假设,是实现交互理性和理性主义的纳什均衡的基本前提,这些,都是动态博弈的范畴。因此说,参与者理性问题对动态博弈的分析影响更大。

三、纳什均衡和精炼纳什均衡存在哪些问题?

答:纳什均衡存在的问题:

(1)不是所有博弈都存在纳什均衡如纯策略就不存在混合策略则一定会存在纳什均衡,它是通过概率来计算纳什均衡,在这种均衡下,给定其他参与人的策略选择概率,每个参与人都可以为自己确定选择每一种策略的最优概率。

(2)在论及纳什均衡时,我们假设参与人是完全理性的,而且是假定参与人之间不允许达成任何协议的非合作博弈的均衡解。而现实并非如此。

精炼纳什均衡存在的问题:有限重复博弈的子博弈精炼纳什均衡有如下定理∶令G是阶段博弈,G(T)是重复T次的重复博弈。那么,如果G有唯一的纳什均衡,重复博弈G(T)的唯一子博弈精炼纳什均衡结果是阶段博弈G的纳什均衡重复T次。这个定理成立的条件是单阶段纳什均衡的“唯一性” ,若纳什均衡不是唯一的,上述定理的结论就不一定成立。

四、有限次重复博弈和无限次重复博弈有什么区别?这些区别对我们有什么启发?

答:有限次重复博弈与无限次重复博弈都属于动态博弈,对于有限次博弈,收益是每次收益的简单相加,可以采取子博弈纳什均衡的方法求解,即逆推法;但无限次博弈却不能采取;此外,有限次博弈中博弈的双方都还是关注的是自己短期的利益,而无限次博弈中博弈的双方可能针对某项事情达成协议,达到共谋,为共同的利益而选择自己的行动,达到整体的最优,供应链契约即类似。

五、有限次重复博弈的精炼纳什均衡的最后一次重复必定是第一阶段博弈的一个纳什均衡?答:

博弈重复次数有限,意味着存在所有参与人都可以预测到的“最后一次”。在最后的阶段博弈中,如果某一参与人选择了自己的占优战略,给其他参与人造成损失,则其他参与人不可能报复。所有的参与人都明白这一点,因而在最后一次阶段博弈中都会选择占优战略,换句话说,在给定最后阶段所有参与人都会选择占优战略的前提下,所有的参与人在倒数第二阶段的博弈中也都会选择占优战略。由此从最后的阶段开始,逐个阶段进行推理,可以得出以下结论:在阶段博弈有唯一的纳什均衡时,有限次重复博弈的唯一子博弈精炼纳什均衡结果,是阶段博弈的纳什均衡重复。这就是说,每个阶段博弈出现的都是一次性博弈的均衡结果。

六、无限次重复博弈均衡解的得益一定会优于原博弈均衡解的得益吗?

答:不一定。例如:无限次重复博弈的古诺博弈,此博弈是相同博弈重复无限次,当冷酷战略是整个博弈的纳什均衡时,当然也就是每个阶段的纳什均衡。此时,无限次重复古诺博弈的冷酷战略已意味着是两厂商在两种战略间进行选择的囚徒困境博弈,一是选择生产垄断产量的一半Q/2,另一是选择生产背叛产量时,冷酷战略是无限次重复古诺博弈的一个子博弈精炼纳什均衡。贴现因子较大说明未来的利益较大,对两厂商都有较大的吸引力,一般情况下,两厂商不会为了短期利益而背叛对方而失去较大的长远利益,即两厂商都有坚持冷酷战略的积极性。而当时,意味着冷酷战略不再是一个子博弈精炼纳什均衡。贴现因子较小说明未来的利益对两厂商都不具有吸引力,选择背叛才是两厂商的最优选择。这种条件下,博弈无限次重复也不能提高一次性博弈的得益。

七、触发战略所构成的均衡都是子博弈精炼纳什均衡吗?

答:“触发战略”是这样一种战略∶首先试探合作,如果对方合作,则给予奖励;如果对方不合作,则给以惩罚。在原博弈有多个纳什均衡的条件下,在重复博弈时,通过触发战略提高了双方的收益。首先,在第二次博弈时意味着该博弈结束,而均衡结果是原博弈的纳什均衡,双方都没有偏离的意愿;其次,第一次选的策略虽不是原博弈的纳什均衡,如果某一方偏离会增加收益,但这样会遭到对方第二次选另外的策略的惩罚而损失收益,使总得益减少。预见到这一点,只顾眼前不顾长远的偏离是得不偿失的事,因此双方会坚持选使总收益最大的策略。所以,触发战略构成的均衡都是子博弈精炼纳什均衡。

八、什么是冷酷战略?什么是针锋相对战略?什么是最小最大战略?

答:冷酷战略也称为触发战略,这种战略做法是∶

1、参与人在博弈开始时均选择合作;

2、只要对方一直选择合作,则继续合作下去,但当某一时刻对方选择了不合作,则一直永远选择不合作来惩罚对方的背叛行为。

针锋相对战略:参与人在博弈开始时选择合作;在时期t选择对方在时期t-1期所采用的战略,即如果对方在t-1期背叛(不合作),则自己在t期也选择背叛。

最小最大战略:最小最大战略是指当违规者不采取合作行为而对他进行惩罚时,违规者可能得到的最严厉的制裁的战略(相应的,违规者为了减少惩罚对自己的影响,而使自己得益最大的战略。

练习题(五)

一、若你正在考虑收购一家公司的一万股股票,卖方的开价是2元/股。根据经营情况的好

坏,该公司股票的价值对你来说有1元/股和5元/股两种可能,但只有卖方知道经营的

真实情况,你只知经营好、坏的概率各为0.5。如果公司经营不好时,卖方做到使你无

法识别真实情况的“包装”费为5万元,你是否会按卖方的价格买下这些股票?如果

“包装”费仅为0.5万元,你会如何选择?

答:当卖方使买房无法识别真实情况的包装费为5万元时,买方的股票价值期望值为

E=0.5 ×﹙1-5﹚+0 .5×5=0.5元/股

在这种情况下,无法接受卖方给出的价格

当卖方的包装费为0.5万元时,买方的股票价值期望值为

E=0.5 ×﹙1-0.5﹚+0 .5×5=2.75元/股

在这种情况下,接受卖方给出的价格

二、现实生活中常常是既有部分卖假冒伪劣产品的厂商会打出“质量三包”、“假一罚十”等

旗号,也有一些卖假冒伪劣产品的厂商声明“售出商品概不退换”。问这两类厂商有什

么不同,他们各自战略的根据是什么?

答:第一类厂商实行战略的根据是:“最大最小战略”,根据无限次重复博弈中的子博弈精炼

纳什均衡实际上是参与人相互合作的结果,要使合作成功,其战略中必须要有惩罚措施。所

谓最小最大战略是指当违规者不采取合作行为而对他进行惩罚时,违规者可能得到的最严厉

的制裁的战略。

第二类厂商采取战略的根据是:“冷酷战略”,任何为了短期利益的背叛行为的所得对长

期利益而言都是微不足道的,且会遭到对方一直背叛的冷酷打击,故参与人有积极性为自己

建立一个乐于合作的声誉,同时也有积极性惩罚对方的背叛行为。

三、在有两个投标者的暗标拍卖中,投标者的估价独立分布于[0,1]且两人的估价相同,则

贝叶斯纳什均衡是什么?博弈的结果是什么?如果两投标者知道他们的估价是相同的,

结果会发生什么变化?

解:两个人投标人为i ,j,投标者i 的支付如下:

最终解得,拍卖的对称贝叶斯均衡战略为∶

同理可得,对投标人j 也可得到相同的结论

即,在只有两个投标人时,这个博弈的贝叶斯均衡是,每个投标人的出价是其实际价值的一

半。

如果两个投标者知道他们的估价相同,即信息是完全的,买者之间的竞争将使卖者得到买者

价值的全部。

四、“说实话”的直接机制能保证博弈方都按他们的真实类型行为并获得理想的结果。

答:“说实话的直接机制”。即如果所设计的直接机制能使得各投标人讲真话,也就是声

明自己的真实类型(如对商品的真实价值)是贝叶斯纳什均衡,则称这样的直接机制为

?????<=->-=j i j i i i j i i i i j i i s s s s s s s s s s u ,0,2/)(),(θθθ;2/*i i s θ=2/*

j j s θ=

“说实话的直接机制”。也称为“激励—相容”或“鼓励—响应”机制。如果代理人从讲真话

中得到稍高的效用,则讲真话变为强均衡。事实上,如果讲真话的效用足够强,则代理

问题以及与之相联系的成本将会消失,能保证博弈方都按他们的真实类型行为并获得理

想的结果。

五、静态贝叶斯博弈中之所以博弈方需要针对自己的所有可能类型设定行为选择,是因为能

够迷惑其他博弈方,从而可以获得对自己更有利的均衡。

答:正确。不完全信息静态博弈的静态贝叶斯纳什均衡实际上是这样一种类型依从型战略组

合∶给定自己的类型和别人类型的概率分布情况下,每个参与人最大化自己的期望效

用。博弈方需要针对自己的所有可能类型设定行为选择,是因为能够迷惑其他博弈方,

从而可以获得对自己更有利的均衡

六、什么是贝叶斯纳什均衡?

答:n 人不完全信息静态博弈: 的纯战战略贝叶斯纳什均衡是一个类型依存战略组合,其中每个参与人i 在给定自己的类型

和其他参与人类型依存战略 ,的情况下最大化自己的期望效用函数 ,换言之,战略组合 是一个贝叶斯纳什均衡,如果对于所有的i , 有

,贝叶斯纳什均衡实际上是这样一种类型依从型战略组合∶给定自己的类型和别人类型的概率分布情况下,每个参与人最大化自

己的期望效用。

七、拍卖(招标)有哪几种常用的方式?

答:(1)最高价格密封出价拍卖(一级密封价格拍卖)

(2)次高价格密封出价拍卖(维克瑞拍卖)

(3)双方叫价拍卖

(4)最高价格公开出价拍卖(英国式拍卖)

(5)降价式拍卖(荷兰式拍卖)

八、机制设计的基本原理是什么?什么是“直接机制”与“显示原理”?

答:机制设计的基本原理是:选择一个博弈规则,最大化自己的期望效用函数。

直接机制:所谓直接机制,就是指代理人(这里的买者)的战略空间(拍卖中买者的报

价)等同于类型空间(拍卖中买者的价值)。其意义是只要代理人声明他们对拍卖商品

的价值,并不需要他们报出标价,委托人(卖方)会根据预先确定的运作机制(包括一

个随机选择过程)来确定中标者和中标价格。

显示原理:显示原理∶对每个导致可能说谎(即 的机制,其代理人的得益为

( ),存在着一个机制,代理人的得益为 (

)使其对于每个 (讲真话)的代理人得到相同的结果,这时,代理人将没有说谎话的积极性。

练习题(六)

一、假如某商品的确切价值是100,这只有卖方知道,你作为买方只知道该商品的价值标准

分布于[80,110]上。假设因为是积压品或需要回茏资金,因此卖方对该商品的主观价

}

,,;,,;,,;,,{1111n n n n u u p p A A G ΛΛΛΛθθ=i θ)

(*i i a --θi u )}(,),({*1*1*n n a a a θθΛ=),(i i i A a θ∈},

);(,{)(max arg )(**i i i i i i i i i a i i a a u p a i ----∑

∈θθθθθθ)i i S θ≠i u i q i s *i u i q i s i θ

值评价是在客观价值上打7折,这一点你也知道。如果交易价格由卖方提出,你只能选择是否接受,问该博弈中卖方和买方(你)的合理战略是什么?

答:

二、假如在一个经济案件中,原告清楚上法庭自己是否会赢,而且这是原被告的共同知识,

而被告不清楚谁会赢,只知道原告赢的可能性是1/3。再假设原告赢时的净利益为3,被告的净利益为-4;原告败诉时的净利益为-1,被告的净利益为0。如果原告在起诉之前可以先要求被告赔偿M=1或M=2和解,被告接受就不上法庭,拒绝则上法庭。用扩展形表示该博弈,并找出该博弈的均衡。

答:

三、什么是精炼贝叶斯均衡?

答:精炼贝叶斯均衡是所有参与人战略和信念的一种结合。它满足如下条件:第一,在给定每个参与人有关其他参与人类型的信念的条件下,该参与人的战略选择是最优的。第二,每个参与人关于其他参与人所属类型的信念,但是使用贝叶斯法则从所观察到的行为中获得的。

四、什么是混同均衡与分离均衡?有什么作用?

答:混同均衡:是指在这种均衡中,不同类型的参与人i选择相同的行动,这时,其他参与人无法从观察到的行动中得到的信息来识别参与人i的类型,也就无法对先验概率进行修正。

分离均衡:就是指在这种均衡中,不同类型的参与人i以概率1选择不同的行动,也就是说,没有不同类型的选择同一种行动。行动的信息准确地反映其类型,这样,其他参与人就可以从观察到的行动中得到的信息来识别参与人i的类型,也就可以据此信息对先验概率进行修正。

五、精炼贝叶斯均衡再精炼的方法有哪些?

答:用于精炼贝叶斯均衡的再精炼方法有:

(1)泽尔滕在1975年提出的“颤抖手均衡”

(2) 克瑞普斯(Kreps)和威尔逊(Wilson)在1982年提出的“序贯均衡”

(3) 梅耶森(Myerson)在1978年提出的“恰当均衡”

(4) 考尔伯格(Kohlberg)和默顿(Merten)在1986年提出的“稳定均衡”

六、假设你是一家证券公司的人事经理,需要为公司招聘10名操盘手。若用博弈论和信息经济学的思想和原理考虑,你的招聘计划中应包括哪些要点?

答:招聘博弈模型:局中人:招聘方与应聘者。

策略选择:应聘者有两种策略,欺骗或不欺骗;招聘方也有两种策略,相信或不相信应聘者。

要从两方面采取措施,防范和规避招聘风险:

1、设法使应聘者采取诚信的态度。

(1)降低应聘者欺骗成功的概率,使其不再有侥幸心理。比如采用申请表、笔试、绩效模拟和测验、工作抽样、面谈、专门的测评中心、履历调查、体格检查等多种手段进行甄选。

(2)增大应聘者欺骗行为的成本。例如,可以建立行业人才库,输入求职方的诚信档案,凡是行骗的求职方便会有相应的档案记录,增大其以后再求职的难度;在签订的劳动协议中注明,凡是有欺骗行为,均要赔偿招聘方的损失。

2、建立规范科学的招聘系统

针对应聘者和招聘方的博弈情况,自行设计了企业的招聘系统,以不断的完善企业的招聘工作,使其更加科学化规范化。

尹伯成《西方经济学简明教程》(第9版)题库-博弈论和信息经济学【圣才出品】

第7章博弈论和信息经济学 一、名词解释 1.代理人 答:代理人指一个为委托人完成某种行为的人。这里的“人”,可以是自然人或法人。在现实经济生活中,代理人的种类很多,如销售代理商、企业代理商、专利代理人、广告代理人、保险代理人、税务代理人等。在现代微观经济学中,企业的管理者可以被看成是所有者的代理人。随着分工和专业化的发展,交易和契约活动中的委托-代理关系成为现代经济中的重要问题。在公司制度中,由于所有权和控制权、经营权的分离,导致了所有者和管理者之间潜在的利益矛盾。特别是在一些大型股份公司里,如果股权极其分散,对管理者的控制和影响就更弱了。管理者是为了自己的利益最大化而工作,而不是为了股东利益最大化。而委托-代理问题的重要之处在于,由于代理人的某些信息或某些行动是不可观察的,或者虽然可观察但不可确证,委托人难以通过一个直接的强制性契约来实现自己的利益最大化,而只能通过一个间接的激励方案,使代理人在追求自我利益的最大化实现的同时,也使委托人的利益尽可能地得到实现。 2.委托-代理问题 答:委托-代理问题是指所有者(委托人)与经营者(代理人)的预期目标不一致,从而导致两者的行为准则、价值取向不和谐甚至相互冲突的问题。由于信息的不完全性,委托人往往不知道代理人要采取什么行动或者即使知道代理人采取某种行动,也不能观察和测度代理人从事这一行动时的努力程度,同时两者之间存在的利益分割关系,通常会使得代理人不完全按照委托人的意图行事。 解决委托-代理问题最有效的办法是实施一种最优合约,即委托人花费最低限度的成本

而使得代理人采取有效率的行动实现委托人目标的合约。 3.贝叶斯均衡 答:贝叶斯均衡是一种不完全信息静态博弈的均衡,由海萨尼于1967~1968年提出。贝叶斯均衡表示这样一种策略组合,给定自己的类型和其他参与人类型的概率分布的情况下,每个参与人的期望效用度达到了最大化,这时,没有人有积极性去选择其他策略。贝叶斯均衡是纳什均衡在不完全信息对策中的自然扩展。 4.囚徒困境 答:囚徒困境指两个被捕获的囚徒之间的一种特殊“博弈”,说明为什么在合作对双方都有利时,保持合作也是困难的。具体情况如下:两囚徒被指控是同案犯。他们被分关在不同的牢房里且无法互通信息,各囚徒都被要求坦白罪行。如果两囚徒都坦白,则各将被判入狱5年;如果两人都不坦白,则各将被判入狱2年;如果一方坦白另一方不坦白,则坦白方入狱1年,另一方入狱10年。下面的支付矩阵列明了两囚徒选择的结果。 如果囚徒A不坦白,他就冒着被囚徒B利用的危险,因为不管囚徒A怎么选择,坦白总是囚徒B的最优方案。同样,坦白也总是囚徒A的最优方案。总之,从上面可以看出,对囚徒个人而言,选择坦白总比不坦白收益高,但从两人的支付总和来看,双方都不坦白的收益是最高的。因此,囚徒困境揭示了社会和经济生活中的一种普遍情况,即“个人理性”与“集体理性”之间的矛盾。它意味着个人理性并不是实现集体理性的充分条件。 二、简答题

博弈论经典案例分析

博弈论经典案例分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

博弈论练习题2答案

博弈论练习题2答案

111111111111111111 博弈论练习题(四) 一、什么是子博弈精炼纳什均衡? 答:将纳什均衡中包含的不可置信的威胁策略剔除出去。它要求参与者的决策在任何时点上都是最优的。由于剔除了不可置信的威胁,在许多情况下,精炼纳什均衡也就缩小了纳什均衡的个数。只有当参与人的策略在每一个子博弈中都构成纳什均衡叫做精炼纳什均衡。或者说,组成精炼纳什均衡的策略必须在每一个子博弈中都是最优的。 二、参与人的理性问题对动态博弈分析的影响是否比静态博弈的影响更大?为什么? 答:正确,博弈论要求个体具有始终追求自身利益最大化的理性意识和理性能力的“自我”个体理性,这是静态博弈的范畴。除此之外,还要求相关的参与者具有层次较高的“交互理性”,要求不同个体之间在理性和行为方面具有一种“默契”。即,人们的自身利益的最大化不仅取决于自己的选择,还取决于与之相关的其他人的选择与行为,那么为了实现自己的最大利益,个体的理性决策就必须考虑他人的理性选择与行为。作

为博弈论的基础,交互理性是其基本的理性要求。博弈论还要求有关博弈的结构、各个博弈参与者的得益函数以及各个博弈参与者的理性等“知识”是所有博弈参与者之间的“共同知识”。也就是,每个博弈参与者不仅要首先明确自己和其他参与者所有可选的策略,还需知晓各种情况下自己最终的收益或其概率分布,并且每个博弈参与者都知道各个参与者掌握这些信息;更为重要的是,每个博弈参与者都知道所有参与者都是理性的,都知道其他博弈参与者知道所有参与者都是理性的,都知道其他博弈参与者知道其他博弈参与者知道所有博弈参与者都是理性的------。理性的共同知识假设是非合作博弈理论的一个非常重要和关键的假设,是实现交互理性和理性主义的纳什均衡的基本前提,这些,都是动态博弈的范畴。因此说,参与者理性问题对动态博弈的分析影响更大。 三、纳什均衡和精炼纳什均衡存在哪些问题?答:纳什均衡存在的问题: (1)不是所有博弈都存在纳什均衡如纯策略就不存在混合策略则一定会存在纳什均衡,它是通

博弈论案例分析

(1)失火了,你往哪个门跑 失火了,你往哪个门跑——这就是博弈论 一天晚上,你参加一个派对,屋里有很多人,你玩得很开心。这时候,屋里突然失火,火势很大,无法扑灭。此时你想逃生。你的面前有两个门,左门和右门,你必须在它们之间选择。但问题是,其他人也要争抢这两个门出逃。如果你选择的门是很多人选择的,那么你将因人多拥挤、冲不出去而烧死;相反,如果你选择的是较少人选择的,那么你将逃生。这里我们不考虑道德因素,你将如何选择?这就是博弈论! 你的选择必须考虑其他人的选择,而其他人的选择也考虑你的选择。你的结果——博弈论称之为支付,不仅取决于你的行动选择——博弈论称之为策略选择,同时取决于他人的策略选择。你和这群人构成一个博弈(game)。 上述博弈是一个叫张翼成的中国人在1997年提出的一个博弈论模型,被称之为少数者博弈或少数派博弈(Minority Game)。当然,原来的博弈形式不是这么简单,这里我把它简化了,我们在第三部分论述归纳推理时还要谈这个博弈模型。现在很多学者在研究这个问题。 生活中博弈的案例很多,你会见到很多例子。只要涉及到人群的互动,就有博弈。 什么叫博弈?博弈的英文为game,我们一般将它翻译成“游戏”。而在西方,game的意义不同于汉语中的游戏。在英语中,game即是

人们遵循一定规则下的活动,进行活动的人的目的是使自己“赢”。奥林匹克运动会叫Olympic Games。在英文中,game有竞赛的意思,进行game的人是很认真的,不同于汉语中游戏的概念。在汉语中,游戏有儿戏的味道。因此将关于game的理论,即game theory翻译成博弈论或者对策论,是恰当的。本书下面统称game theory为博弈论。 博弈论的出现只有50多年的历史。博弈论的开创者为诺意曼与摩根斯坦,他们1944年出版了《博弈论与经济行为》。诺意曼是着名的数学家,他同时对计算机的发明作出了巨大贡献,他去世时博弈论还未对经济学产生广泛影响,否则经济学的诺贝尔奖肯定有他的名字,因为诺贝尔奖有规定,只颁发给在世的学者。谈到博弈论,不能忽略博弈论天才纳什(John Nash)。纳什的开创性论文《n人博弈的均衡点》(1950)、《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。今天博弈论已发展成一个较完善的学科。 博弈论对于社会科学有着重要的意义,它正成为社会科学研究范式中的一种核心工具,以至于我们可称博弈论是“社会科学的数学”,或者说是关于社会的数学。从理论上讲,博弈论是研究理性的行动者(agents)相互作用的形式理论,而实际上它正深入到经济学、政治学、社会学等等,被各门社会科学所应用。甚至有学者声称要用博弈论重新改写经济学。1994年经济学诺贝尔奖颁发给三位博弈论专家:纳什、塞尔屯、哈桑尼(),而像1985年获得诺贝尔奖的公共选择学派的领导者布坎南,1995年获得诺贝尔奖的理性主义学派的领袖卢

博弈论复习题及标准答案

囚徒困境说明个人的理性选择不一定是集体的理性选择。(√) 子博弈精炼纳什均衡不是一个纳什均衡。(×) 若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。( ) 博弈中知道越多的一方越有利。( ×) 纳什均衡一定是上策均衡。(×) 上策均衡一定是纳什均衡。(√) 在一个博弈中只可能存在一个纳什均衡。(×) 在一个博弈中博弈方可以有很多个。(√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。 (√ ) 在博弈中纳什均衡是博弈双方能获得的最好结果。(×) 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(×)上策均衡是帕累托最优的均衡。 (×) 因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。 (×) 在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×) 在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(√ ) 不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√ ) 多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(√) 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t

博弈论经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A来说,囚徒B有坦白和不坦白两种可能的选择,假设囚徒B的选择是不坦白,则对囚徒A来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B选择的是坦白,则囚徒A不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B采取何种策略囚徒A的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 嫌疑犯乙

案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 价格战 案例:假设市场中仅有A 、B 两家企业,每家企业可采取的定价策略都是10元或15元,我们可以得出得益矩阵如下: 分析:无论对企业A 还是企业B 来说,低价都是他们的占优战略。从表可见,企业A 的占优战略是10元,因为无论B 采取什么战略,企业A 都能获取比定价15元更多的利润。 如果企业B 定价10元,企业A 定价10元能够获利80万元,而定价15元只能获得30万元;如果企业B 定价15元,企业A 定价10元可获利170万元,而定价15元却只能获利120万元。同样地,企业B 的占优战略也是定价10元的策略。 企业B 男

博弈论各章节课后习题答案 (4)

第四章谈判与协调 1.帕累托占优均衡和纳什均衡的关系是什么? 纳什均衡的基本思想是:每一个局中人选择一个策略,由所有局中人的策略构成了一个策略组合;在其它局中人选定策略不变的情况下,若某一个局中人单独地违背自己已选的策略,那么他的收益只会下降(或收益不会增加)。这样的策略组合构成一个均衡局势,并命名为纳什均衡。纳什均衡有纯策略的纳什均衡和混合策略的纳什均衡。一个博弈中有不止一个纳什均衡时,就构成一个多重纳什均衡问题。在多重纳什均衡下给出一些选择标准就得到一些特定的纳什均衡。其中帕累托占有纳什均衡是根据这样的选择标准选择的均衡。在博弈 中,若均为G 的其纳什均衡,若满足[,{},{}]i i G N S P =12,,,m s s s ????0 i s ?,0()()i i i j P s P s ?? >1,2,,,1,2,,i n j m ==??则称为博弈G 的帕累托占优纳什均衡。可见帕累托占有纳什均衡是纳什均衡中收益最大 0i s ? 的一种均衡。 2.分别找出具有下列性质的2人博弈的例子。 (1)不存在纯策略纳什均衡; (2)至少有两个纳什均衡,并且其中之一是帕累托占优均衡。 (1 )不存在纯策略的纳什均衡:该博弈不存在纯策略的纳什均衡 (2) 该博弈有三个纳什均衡:(战争,战争)、(和平,和平)和一个混合策略纳什均 衡。很显然,(和平,和平)是一个帕累托占优纳什均衡。 2525((,),(,77773.假设在某一产品市场上有两个寡头垄断企业,它们的成本函数分别为: TC 1=0.1q +20q 1+100000TC 2=0.4q +32q 2+20000 2122这两个企业生产一同质产品,其市场需求函数为:Q=4000-10p 。试分别基于古诺模型和纳什谈判模型求解两企业的利润。 解:由和400010Q p =?12 Q q q =+得124000.1() p q q =?+战争 和平国 家 1战争-5,-58,-10和平-10,810,10

博弈论的经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

复旦大学经济学基础科目经典教材书单

复旦大学经济学基础科目经典教材书单 入门阶段: 中文版名称:《经济学原理》曼昆 英文版名称:principle of economics by Mankiw, N.G. 基础阶段: 《微观经济学》周惠中 《微观经济学:现代观点》哈尔.R.范里安(Hal R. Varian) 《宏观经济学》多恩布什(Rudiger Dornbusch / Stanley Fischer / Richard Startz) 《全球视角的宏观经济学》萨克斯(Jeffrey D. Sachs) 《国际经济学》克鲁格曼(Paul R. Krugman) 《国际金融与开放经济的宏观经济学》(Giancarlo Gandolfo) 《金融学》博迪/莫顿(Zvi Bodie / Robert C.Merton ) 《货币金融学》米什金(Frederic S.Mishkin) 《货币理论与政策》Carl E. Walsh 《数理经济学的基本方法》蒋中一(Alpha C. Chiang) 《经济学中的分析方法》高山晟(Akira Takayama) 《金融经济学原理》LeRoy / Werner 提高阶段: ①计量经济学: ⑴中文名:《计量经济学》林文夫 英文名:Econometrics by Fumio Hayashi ⑵中文名:《计量经济学分析》格林 英文名:Econometric Analysis by Greene ⑶中文名:《横截面与面板数据的经济计量分析》伍德里奇 英文名:Econometric Analysis of Cross Section and Panel Data by Wooldridge ②微观经济学: ⑴中文名:《高级微观经济理论》杰里/ 瑞尼(JR) 英文名:Advanced Microeconomic Theory by Geoffrey A. Jehle / Philip J. Reny 简称(JR) ⑵中文名:《微观经济学高级教程》范里安 英文名:Microeconomics Analysis by Hal R. Varian ⑶中文名:《微观经济学》安德鲁.马斯-科莱尔等(MWG) 英文名:Microeconomic Theory by Andreu Mas-Colell / Michael D. Whinston / Jerry R.Green 简称(MWG) ③宏观经济学: ⑴中文名:《高级宏观经济学》戴维.罗默 英文名:Advanced Macroeconomics by David Romer

博弈论三大经典案例

经典的囚徒困境 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ?若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ?若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ?若二人都互相检举(互相“背叛”),则二人同样判监2年。 用表格概述如下: 甲沉默(合作)甲认罪(背叛) 乙沉默(合作)二人同服刑半年甲即时获释;乙服刑10年 乙认罪(背叛)甲服刑10年;乙即时获释二人同服刑2年 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ?若对方沉默、背叛会让我获释,所以会选择背叛。 ?若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 由囚徒困境可以写出类似的员工困境: 一名经理,数名员工; 前提,经理比较苛刻; 如果所有员工都听从经理吩咐,则奖金等待遇一样,不过所有人都超负荷工作 如果某人不听从吩咐,其他人听从吩咐,则此人下岗。其他人继续工作 如果所有人都不听从经理吩咐,则经理下岗 但是,由于员工之间信息是不透明的,而且,都担心别人听话自己不听话而下岗,所以,大家只能继续繁重的工作. 囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。

金融经济学经典教材

推荐几本优秀的数学基础课教材吧,而且基本都有中文版了 1、微积分教程——计算机代数方法I. Anshel D.Goldfeld 这是哥伦比亚大学的数学基础课改革试点教材,写的很好,它从一开始就把微积分思想同整个数学和使用计算机的数学软件结合起来,非常好的微积分入门基础教材,如果你自己有台电脑,学点Mathematica或者Matlab这个常用数学软件的话,就可以很好的自学这本教材了。这本教材的特点是,用计算机实验来很好的表达微积分的数学思想。而且它的优秀就在于,不仅介绍古典的微积分思想,更帮助读者引入到现代多维空间的代数几何思想,通俗易懂,非常好的高等数学入门教材。如果想学数学,就从这本开始。 2、数学分析原理Walter Rudin 在数学基础课领域,Rudin的教材一直是备受美国各著名大学比如MIT、耶鲁等所推崇的,写的非常好,他自己是搞分析领域的,所以分析路线里你都可以找他写的教材看,思路清晰,语言平易,很好的阐述了数学思想的精髓;而且这本数分教材开始引入简单的拓扑思想和基础知识了,为以后学习更深的数学奠定了很好的基础。 3、高等微积分Lynn H. Loomis / Shlomo Sternberg 这是哈佛的数学教材,供高年级本科生和低年级研究生使用,这本教材基本代表了当今微积分领域的最先进的思想,它几乎就是用现代数学的思想来完全重新改写了整个古典微积分,你必须要有非常好的数学基础,才能看得懂这本教材。我刚打开这本教材时,简直就感觉我从来没有学过高等数学,从来没有学过微积分,呵呵。这本教材的中文版翻译工作也是由中科院院士王元亲自来做的,这本教材也是哈佛教授、Fields奖获得者***鼎力推荐的数学基础课教材; 4、实分析与复分析Walter Rudin 5、泛函分析Walter Rudin 这两本不说了,Rudin的教材一定顶,呵呵 6、分析学Elliott H. Lieb / Michael Loss 这是一本非常优秀的实分析教材,普林斯顿的教材,还有什么可讲的; 7、线性代数及其应用David C. Lay 这是一本很不错的线性代数入门教材,也是美国国家科学基金支持线性代数教学改革的一本教材,也是全面引入现代数学理念,结合计算机数学软件来讲授线性代数,配有光盘,里面有大量的编好Matlab、Mathematica的程序,来帮助读者学习; 8、高等代数丘维声 这是北大比较经典的高等代数教材,特点是内容比较全面,尽管教材编写本身没有什么创新之处,数学思想应用也很普通(国内数学教材普遍如此),但总体来说内容比较**全面,错误也很少,也算是国内难得的几本比较经典的数学教材了。这个级别内容的国外教材翻译的不多,而且还是苏联的那套比较多,所以这本用用也挺好的。 9、概率论基础教程Sheldon M. Ross 这是本不错的概率论入门教材,概率论国内很弱,基本没有什么好教材的,所以还是用国外教材好。Ross是概率路线的大牛,他写过很多概率统计方面的教材,都很受欢迎,包括金融数学、随机模拟等 10、概率论及其应用威廉?费勒 作者是概率路线的世界级权威,这本书是相当全面优秀的概率论教材,有一定难度,对于像深入学习经济学博弈论的朋友来说,是很好的基础教材; 11、基础偏微分方程David Bleecker / George Csordas 既然是基础教程,当然起点不会太高,有些微积分和高等代数基础的就可以用这本了,这本内容还是比较丰富的。

博弈论 课后习题答案

博弈论课后习题答案 第四部分课后习题答案 1. 参考答案: 括号中的第一个数字代表乙的得益,第二个数字代表甲的得益,所以a表示乙 的得益,而b表示甲的得益。 在第三阶段,如果,则乙会选择不打官司。这时逆推回第二阶段,甲会选择 a,0 不分,因为分的得益2小于不分的得益4。再逆推回第一阶段,乙肯定会选择 不借,因为借的最终得益0比不借的最终得益1小。 在第三阶段,如果,则乙轮到选择的时候会选择打官司,此时双方得益是 (a,b)。a,0 逆推回第二阶段,如果,则甲在第二阶段仍然选择不分,这时双方得益为 (a,b)。b,2 在这种情况下再逆推回第一阶段,那么当时乙会选择不借,双方得益(1,0), 当a,1 时乙肯定会选择借,最后双方得益为(a,b)。在第二阶段如果,则甲会选择 a,1b,2分,此时双方得益为(2,2)。再逆推回第一阶段,乙肯定会选择借,因为 借的得益2大于不借的得益1,最后双方的得益(2,2)。 根据上述分析我们可以看出,该博弈比较明确可以预测的结果有这样几种情况: (1),此时本博弈的结果是乙在第一阶段不愿意借给对方,结束博弈,双方a,0 得益 (1,0),不管这时候b的值是多少;(2),此时博弈的结果仍然012,,,ab且

是乙在第一阶段选择不借,结束博弈,双方得益(1,0);(3),此时博ab,,12 且弈的结果是乙在第一阶段选择借,甲在第二阶段选择不分,乙在第三阶段选择打,最后结果是双方得益 (a,b);(4),此时乙在第一阶段会选择借,甲在第二阶段会选择分,ab,,02且双方得益(2,2)。 要本博弈的“威胁”,即“打”是可信的,条件是。要本博弈的“承诺”,即a,0 “分”是可信的,条件是且。 a,0b,2 注意上面的讨论中没有考虑a=0、a=1、b=2的几种情况,因为这些时候博弈方的选择很难用理论方法确定和预测。不过最终的结果并不会超出上面给出的范围。 2. 参考答案: 静态贝叶斯博弈中博弈方的一个策略是他们针对自己各种可能的类型如何作相应的完整计划。或者换句话说,静态贝叶斯博弈中博弈方的策略就是类型空间到行为空间的一个函数,可以是线性函数,也可以是非线性函数,当博弈方的类型只有有限几种时是离散函数,当博弈方的类型空间是连续区间或空间时则是连续函数。只有一种类型的博弈方的策略仍然是一种行为选择,但我们同样可以认为是其类型的函数。 静态贝叶斯博弈中博弈方的策略之所以必须是针对自己所有可能类型的函数,原因是博弈方相互会认为其他博弈方可能属于每种类型,因此会考虑其他博弈方所有可能类型下的行为选择,并以此作为自己行为选择的根据。因此各个博弈方必须设定自己在所有各种可能类型下的最优行为,而不仅仅只考虑针对真实类型的行为选择。 3. 参考答案:

博弈论中的几个经典问题

几个博弈论中的经典问题 博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。 几个重要的概念 1、策略(strategies):一局博弈中,每个局中人都有选择实际可行的完整的行动方案, 即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。 2、得失(payoffs):一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时 的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付(payoff)函数。 3、次序(orders):各博弈方的决策有先后之分,且一个博弈方要作不止一次的决策 选择,就出现了次序问题;其他要素相同次序不同,博弈就不同。 4、博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。 在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。 5、纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况, 当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人B仍采取b*,而局中人A却采取另一种策略a,那么局中人A 的支付不会超过他采取原来的策略a*的支付。这一结果对局中人B亦是如此。 经典的博弈问题 1、“囚徒困境” “囚徒困境”是博弈论里最经典的例子之一。讲的是两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是"坦白从宽,抗拒从严",如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。 在这个例子里,博弈的参加者就是两个嫌疑犯A和B,他们每个人都有两个策略即坦白和不坦白,判刑的年数就是他们的支付。可能出现的四种情况:A和B均坦白或均不坦白、A坦白B不坦白或者B坦白A不坦白,是博弈的结果。A和B均坦白是这个博弈的纳什均衡。这是因为,假定A选择坦白的话,B最好是选择坦白,因为B坦白判8年而抵赖却要判十年;假定A选择抵赖的话,B最好还是选择坦白,因为B坦白判不被判刑而抵赖确要被判刑1年。即是说,不管A坦白或抵赖,B的最佳选择都是坦白。反过来,同样地,不管B是坦白还是抵赖,A的最佳选择也是坦白。结果,两个人都选择了坦白,各判刑8年。在(坦白、坦白)这个组合中,A和B都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡。

“博弈论”习题及参考答案

《博弈论》习题 一、单项选择题 1.博弈论中,局中人从一个博弈中得到的结果常被称为()。 A. 效用 B. 支付 C. 决策 D. 利润 2.博弈中通常包括下面的内容,除了()。 A.局中人 B.占优战略均衡 C.策略 D.支付 3.在具有占优战略均衡的囚徒困境博弈中()。 A.只有一个囚徒会坦白 B.两个囚徒都没有坦白 C.两个囚徒都会坦白 D.任何坦白都被法庭否决了 4.在多次重复的双头博弈中,每一个博弈者努力()。 A.使行业的总利润达到最大 B.使另一个博弈者的利润最小 C.使其市场份额最大 D.使其利润最大 5.一个博弈中,直接决定局中人支付的因素是()。 A. 策略组合 B. 策略 C. 信息 D. 行动 6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时 的博弈具有()。 A.囚徒困境式的均衡 B.一报还一报的均衡 C.占优策略均衡 D.激发战略均衡 7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的策略称为()。 A.一报还一报的策略 B.激发策略 C.双头策略 D.主导企业策略 8.在囚徒困境的博弈中,合作策略会导致()。 A.博弈双方都获胜 B.博弈双方都失败

C.使得先采取行动者获胜 D.使得后采取行动者获胜 9.在什么时候,囚徒困境式博弈均衡最可能实现()。 A. 当一个垄断竞争行业是由一个主导企业控制时 B.当一个寡头行业面对的是重复博弈时 C.当一个垄断行业被迫重复地与一个寡头行业博弈时 D. 当一个寡头行业进行一次博弈时 10.一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种策略是一种()。 A.主导策略 B.激发策略 C.一报还一报策略 D.主导策略 11.关于策略式博弈,正确的说法是()。 A. 策略式博弈无法刻划动态博弈 B. 策略式博弈无法表明行动顺序 C. 策略式博弈更容易求解 D. 策略式博弈就是一个支付矩阵 12.下列关于策略的叙述哪个是错误的(): A. 策略是局中人选择的一套行动计划; B. 参与博弈的每一个局中人都有若干个策略; C. 一个局中人在原博弈中的策略和在子博弈中的策略是相同的; D. 策略与行动是两个不同的概念,策略是行动的规则,而不是行动本身。 13. 囚徒困境说明(): A. 双方都独立依照自己的利益行事,则双方不能得到最好的结果; B. 如果没有某种约束,局中人也可在(抵赖,抵赖)的基础上达到均衡; C. 双方都依照自己的利益行事,结果一方赢,一方输; D、每个局中人在做决策时,不需考虑对手的反应 14. 一个博弈中,直接决定局中人损益的因素是(): A. 策略组合 B. 策略 C. 信息 D. 行动 15. 动态博弈参与者在关于博弈过程的信息方面是() A 不对称的 B 对称的 C 不确定的 D 无序的

(完整word版)经典的博弈论分析案例——“海盗分金”问题

经典的博弈论分析案例——“海盗分金”问题 5个海盗抢得100枚金币,他们按抽签的顺序依次提方案:首先由1号提出分配方案,然后5人表决,超过半数同意方案才被通过,否则他将被扔入大海喂鲨鱼,依此类推。 “海盗分金”其实是一个高度简化和抽象的模型,体现了博弈的思想。在“海盗分金”模型中,任何“分配者”想让自己的方案获得通过的关键是事先考虑清楚“挑战者”的分配方案是什么,并用最小的代价获取最大收益,拉拢“挑战者”分配方案中最不得意的人们。 假设前提 假定“每个海盗都是绝顶聪明且很理智”,那么“第一个海盗提出怎样的分配方案才能够使自己的收益最大化?” 推理过程 从后向前推,如果1至3号强盗都喂了鲨鱼,只剩4号和5号的话,5号一定投反对票让4号喂鲨鱼,以独吞全部金币。所以,4号惟有支持3号才能保命。 3号知道这一点,就会提出(100,0,0)的分配方案,对4号、5号一毛不拔而将全部金币归为已有,因为他知道4号一无所获但还是会投赞成票,再加上自己一票,他的方案即可通过。 不过,2号推知3号的方案,就会提出(98,0,1,1)的方案,即放弃3号,而给予4号和5号各一枚金币。由于该方案对于4号和5号来说比在3号分配时更为有利,他们将支持他而不希望他出局而由3号来分配。这样,2号将拿走98枚金币。 同样,2号的方案也会被1号所洞悉,1号并将提出(97,0,1,2,0)或(97,0,1,0,2)的方案,即放弃2号,而给3号一枚金币,同时给4号(或5号)2枚金币。由于1号的这一方案对于3号和4号(或5号)来说,相比2号分配时更优,他们将投1号的赞成票,再加上1号自己的票,1号的方案可获通过,97枚金币可轻松落入囊中。这无疑是1号能够获取最大收益的方案了!答案是:1号强盗分给3号1枚金币,分给4号或5号强盗2枚,自己独得97枚。分配方案可写成(97,0,1,2,0)或(97,0,1,0,2)。分析 1号看起来最有可能喂鲨鱼,但他牢牢地把握住先发优势,结果不但消除了死亡威胁,还收益最大。这不正是全球化过程中先进国家的先发优势吗?而5号,看起来最安全,没有死亡的威胁,甚至还能坐收渔人之利,却因不得不看别人脸色行事而只能分得一小杯羹。 不过,模型任意改变一个假设条件,最终结果都不一样。而现实世界远比模型复杂。 首先,现实中肯定不会是人人都“绝对理性”。回到“海盗分金”的模型中,只要3号、4号或5号中有一个人偏离了绝对聪明的假设,海盗1号无论怎么分都可能会被扔到海里去了。所以,1号首先要考虑的就是他的海盗兄弟们的聪明和理性究竟靠得住靠不住,否则先分者倒霉。 如果某人偏好看同伙被扔进海里喂鲨鱼。果真如此,1号自以为得意的方案岂不成了自掘坟墓! 再就是俗话所说的“人心隔肚皮”。由于信息不对称,谎言和虚假承诺就大有用武之地,而阴谋也会像杂草般疯长,并借机获益。如果2号对3、4、5

尹伯成《西方经济学简明教程》(第9版)笔记和课后习题考研真题详解

尹伯成《西方经济学简明教程》(第9版)笔记和课后习题(含考研真题)详解>精研学习?提供资料>无偿试用20%资料 全国547所院校视频及题库全收集 考研全套>视频资料>课后答案>往年真题>职称考试 目录 第1章导言 1.1复习笔记 1.2课后习题详解 1.3名校考研真题详解 第2章商品供求与均衡价格 2.1复习笔记 2.2课后习题详解 2.3名校考研真题详解 第3章消费者行为理论 3.1复习笔记 3.2课后习题详解 3.3名校考研真题详解 第4章企业、生产和成本理论 4.1复习笔记 4.2课后习题详解 4.3名校考研真题详解 第5章完全竞争和完全垄断市场中价格和产量的决定 5.1复习笔记 5.2课后习题详解 5.3名校考研真题详解 第6章垄断竞争市场与寡头市场中价格和产量的决定 6.1复习笔记 6.2课后习题详解 6.3名校考研真题详解 第7章博弈论和信息经济学 7.1复习笔记 7.2课后习题详解 7.3名校考研真题详解 第8章要素价格与收入分配 8.1复习笔记 8.2课后习题详解

8.3名校考研真题详解 第9章市场效率与微观经济政策 9.1复习笔记 9.2课后习题详解 9.3名校考研真题详解 第10章国民收入核算 10.1复习笔记 10.2课后习题详解 10.3名校考研真题详解 第11章国民收入决定:收入-支出模型11.1复习笔记 11.2课后习题详解 11.3名校考研真题详解 第12章国民收入决定:IS-LM模型12.1复习笔记 12.2课后习题详解 12.3名校考研真题详解 第13章国民收入决定:AD-AS模型13.1复习笔记 13.2课后习题详解 13.3名校考研真题详解 第14章通货膨胀与失业 14.1复习笔记 14.2课后习题详解 14.3名校考研真题详解 第15章宏观经济政策 15.1复习笔记 15.2课后习题详解 15.3名校考研真题详解 第16章经济增长、经济发展与经济周期16.1复习笔记 16.2课后习题详解 16.3名校考研真题详解 第17章国际经济学初步 17.1复习笔记 17.2课后习题详解 17.3名校考研真题详解 第18章西方经济学与中国 18.1复习笔记 18.2课后习题详解 18.3名校考研真题详解

相关主题