搜档网
当前位置:搜档网 › 浙大博弈论考试题目

浙大博弈论考试题目

浙大博弈论考试题目
浙大博弈论考试题目

博弈论考试

1、完全信息静态博弈

1“老师点名和学生逃课”的案例

构建如下模型:老师

点名不点名

学生逃课a1,b1 a2,b2

不逃课a3,b3 a4,b4

结果:(1)老师每次点名,学生每次不逃课

a3> a1 ,b3> b4 ,a2< a4 ,b2< b1

(2)老师每次不点名,学生每次不逃课

a4> a2 , b4> b3 , a1< a3 , b1< b2

(3)老师有时候点名,学生有时候逃课

a1< a3 , a2> a4 , b1> b2 , b3< b4

(4)老师每次不点名,学生每次逃课

a2> a4 , b2> b1 , a3< a1 , b3< b4

2市场占有者和想进入市场者

构建模型:占有者

默认斗争

进入者进入(40,50)(-10,0)

不进入(0,300)(0,300)

没有占优战略均衡,也没有重复剔除的占优均衡。

结果:(1)占有者默认,进入者进入时,占有者会损失部分利益

(2)占有者斗争,进入者进入,则占有者利益变0,而进入者为负,两败俱伤,因而占有者“斗争”是弱劣战略。

(3)占优者默认,进入者不进入,则占有者获得全部市场

(4)(斗争,不进入时,占有者仍获得全部市场。

综上存在两个纳什均衡,(进入,默认)和(不进入,斗争)

3应试教育和素质教育学生

应试教育素质教育

学校应试教育(0,0)(0,-1)

素质教育(-1,0)(1,1)

(1)假设学校和学生都采取应试教育为(0,0),那么若他们都转向素质教育达到最优结局(1,1),(2)但如果单方面采取素质教育,另一方为应试教育,其支付就变为-1,比如如果学校重视应试成绩,而学生重视素质教育,学生单方面受损,为-1 (3)若学校注重素质教育,而学生只注重成绩,学校的策略难以推行,支付为-1.

此博弈中存在两个纳什均衡,即(应试,应试)和(素质,素质),虽然(素质,素质)是最优纳什均衡,但一方采取素质教育存在风险:另一方为应试时,支付变为-1;若采取应试没有变为-1的风险,那么最终结局为(应试,应试)。4两个人合作开发一项产品假设项目开发成功每人收益为4,失败时收益为

0,偷懒者的机会成本为1

参与人2

努力偷懒

参与人1 努力9/16 3/8

偷懒3/8 1/4

(1)双方都努力的期望收益W=9/16*4-1=1.25

(2)自己偷懒对方努力:W=3/8*4=1.5

(3)自己努力,对方偷懒:3/8*4-1=0.5

(4)双方偷懒:W=1/4*4=1

所以此博弈的收益矩阵分布为:努力偷懒

努力 1.25/1.25 0.5/1.5

偷懒 1.5/0.5 1/1

由此可见,偷懒成了最优策略

5公共物品的供给问题(基础设施的建设)

B

建设不建设

A 建设3,3 2,4

不建设4,2 1,1

当两者都建设时,是(3,3)

当A建设,B不建设时,(2,4),B的利益大,A损失了部分利益

当两者都不建设时,(1,1),是弱劣战略

当A不建设,B建设时,(4,2)B损失了部分利益

但是人们都是为了追求人类利益最大化的,最终会造成(不建设,不建设)的困境,也是典型的多劳不多得。

6中国政府于电信企业的博弈

政府采用的策略

不激励激励

电信企业维持原状6,6 7,5

技术改进5,9 8,7

无论电信企业采取何种战略,“不激励”都是政府的占优策略。

(1)有纳什均衡(维持原状,不激励)是非合作博弈

(2)电信维持原状,政府激励时,(7,5)政府损失部分利益

(3)电信改进,政府不采取时,(5,9)电信有损失

我们可以看出实际上(8,7)是最优战略,但他们都从“个体理性”出发,追求个人利益最大化,而得到了不好的结果。

2、过犹不及

(1)竞技体育运动员B c指损失,a指收益

激进(概率为q) 平和

运动员A 激进a-c,a-c 2a,0

平和0,2a a,a

当a>c,采用激进—激进纯战略纳什均衡

当a

同时出招,a-c<0时,W(A激进)=(a-c)*q+2a(1-q)为期望收益

W(A平和)=0*q+a(1-q)

当两者相等时,得出q=a/c 当a增加时,q增加;c增加时,q下降

W(A平和)=a(1-q)=a(1-a/c)

画图,当a增加时,可得出c/2是一个临界点,当>c/2时,太过于激进,收益反而下降,所以运动员在竞争时,尽力是好的,但过度激进,比如服用兴奋剂,反而会使运动生涯过早的结束。

(2)卖假烟卖假烟者A

限量过量

卖假烟者B 限量a,a 0,2a

过量2a,0 a-c,a-c

C指损失,a指卖假烟的收益,分析照上面,当P=a/c时为均衡点

现在山寨是很流行的,卖假烟在一定程度上不能认为是违法行为的,有时可以缓解经济压力、充面子等,当然这只限于假烟的销量控制在一定范围内,如果过量造成假烟泛滥,则会使市场变得混乱,收益反而会下降,而贩卖假烟本身也可能因此坐牢,这是危害社会和个人的事情。

(3)腾讯QQ和360之间的竞争

QQ

(退)和平相处过度竞争(进)PA 360 和平相处PB 0,0 2,0

过度竞争2,0 -3,-3

E(B退)=P(A进)*0+P(A退)*0 E(B进)=P(A进)*-3+ P(A退)*-2

当两者相等时,得出P(A进)=0.6 P(A退)=0.4

P(B进)=0.6 P(B退)=0.6

两者都选择和平共处时是(0,0),然而当它们都为自己的利益而过度竞争,相互斗争时,收益反而下降,它们的用户大量减少,这是双方都受损的情况,因而过度反而是不对的。

(4)对美国“9.11”事件的态度

官员A

鹰鸽

官员B 鹰2,2 10,0

鸽0,10 5,5

最好的是自己选择鹰战略,对方选择鸽战略

鸽派立足美国自身做出反思,主张从自身寻找消除恐怖主义的途径,在国际关系中奉行多边合作,促进美国发展;但鹰派相反,更加强硬,主张先发制人消除威胁,如伊拉克战争等。可鹰派的行为并未使自身安全,他们的盟友如英国、埃及惨遭打击,他们的过激行为反而阻碍了美国前进。

“租值消散”理论指无主的、没有归属的收入,在竞争下会消散,在边际上会下降为0,如公海没有业主,钓鱼不收费,他的边际租值为0.

中国巨额的土地红利往往会带来巨大的竞争

竞争人A a指土地红利

合作竞争c指过度竞争带来的损失竞争人B 合作a,a 0,2a 分析可照上面

竞争2a,0 a-c,a-c

他们都是对自身利益最大化的追求,因而选择(竞争,竞争)概率很大,当过度竞争时,往往会造成贪污腐败,土地减产,价值下跌,暗箱操作等不良问题,反而使自己的投入得不到回报

对于中国土地红利,我个人认为中国国民消费过于保守,投资理念始终停留在对国有银行的存款利息,从根本上让房产投资者土地升值。我想正是因为它的巨大红利才会造成对土地竞争者的泛滥,供小于求,使得总收益下降,只有少部分获利,贫富差距拉大,妨碍了土地的整合和规模经济,而同时土地红利会造成资源的过度使用甚至是浪费。

3、石头、剪子、布

假设A、B两人玩“石头、剪子、布”的游戏,A是说准备出石头的人,但是

既然

理性个人B预料到A会这么想,因此出“石头”最有利,并且A出布的可能性很小;况且如果他真的出石头,而自己再出剪刀岂不是自投罗网,显得“很没面子”,所以出剪刀的可能性最小。

如果我是A,实际上我会出“布”,因为根据以上分析,B最可能出石头,而我出“布”的胜算最大,我认为言语在利益对立的博弈中能起作用。

例子:抛硬币。甲乙可自行绝对所抛出的硬币为正面还是反面,若方向相同,则甲胜;若方向相反,则乙胜。

1/2,与甲不说时相同。但实际上,言语对参与者而言打了一场心理战,甲认为乙会受影响而出“反”,他实际上很可能出“反”,乙也会意识到这点,因此他出“正”的概率反而会比“反”大。

所以我认为言语能在利益对立的博弈中起作用。同样正如“石头、剪子、布”的游戏,A说会出石头,同样A、B两人因为这句话而打起了心理战。

4、“万元陷阱”

“万元陷阱”是竞拍者利用人们对巨大利益追求的心理而从中获利的手段,(参与者都是自愿的),一旦参与者选择参与,多人竞争会使他们的喊价不断工作,组后则是鹬蚌相争,渔人得利。

参与者如果想要赢利,应该把握以下准则:1确定投入的极限及预先的约定,譬如投资多少钱或是多少时间?2要坚持到底(止损原则)3自己打定注意,不必看别人4保持良好的心态5别指望能以很低的价格买入6不要随波逐流,有自己的主见和底线。7尽快传递“势在必得”的信号8合作,与他人共享,打倒其余的竞拍者。

具体事例:1如现实生活中购买彩票,抽奖活动,赌马,赌球,股票等,这些都是所谓的“万元陷阱”。这些活动利用了人们追求巨大利益的心理,他们为此都不断投入精力去做,但最终不一定会有等价的回报,他们通常有两种动机:经济上和人际关系上。想赢回自己的损失,有时却会导致更大的损失,而另一方面为了挽回失败的面子,证明自己。

2学校设立的期末奖项评比,也可看作是“万元陷阱”,为此学生想得奖来证明自己的能力,要付出很大的精力来学习,但是奖项是有限的、困难的,最终不一定会有所收获。

3企业的年终奖金评比,企业为了调动员工们的工作积极性,以年终奖来诱惑他们,员工们就陷入一种“万元陷阱”中,将不断投入精力去争取。

因此止损策略是十分重要的,它既要求我们不要无止境地把精力投放在某件事上,反而会得不偿失;又同时要求我们学会坚持到底,在确定极限后,不轻易更改,这样你就能获得最后的胜利,因此它教会我们有张有弛。

同时跟谁博弈比“怎么博弈”更加重要,“万元陷阱”中更理性的一方恰恰是损失更大的一方,虽然自己理性地选择,但是对象是属于“不理性”的,那么你最终反而会失利。在选择竞争对手时,也要兼顾他与自己的比较,同样不能过于理性,有时要打定注意,坚持到底。

5、征税博弈

理解:首先做一个关于征税博弈的收益树状图

A百姓

养鱼不养鱼

重税 B B政府

(-2,10)(4,4) (0,0) (0,0)轻税

若政府事后违约,百姓即使养鱼仍收重税,那么百姓的实际收益反而下降,

这是因为政府是强势的一方,没有关在笼子里,所以认为能建立有效的机制,

把他们关在笼子里,才能增加百姓收入,建立和谐社会。

建一个收益矩阵甲

养鱼不养鱼

乙养鱼2,2 0,1

不养鱼1,0 5,5

此时有两个均衡点,但在都不养鱼的时候,是革命胜利的收益,但如果

(不养鱼,不养鱼),可能会有损失的风险,往往会达成(养鱼,养鱼)的

均衡,这样就革命失败了,没有完成把统治者关进笼子里的想法。

囚徒困境 A

认罪不认罪

B 认罪10年,10年0,20

不认罪20,0 1,1

他们都是从自我利益出发,A会想假定B认罪,他不认罪要判20年,B不

认罪,他不认罪要判1年,综上认罪比不认罪要好,他们两人都这么想,结

果得到一个相对较劣的结果。

在希望把统治者关进笼子里时,不同的人都从自己的利益出发,不愿直接和

统治者相抗衡,想等其他人革命而暗中得利,但每个人都是这么想的,因而

无法实现把统治者关进笼子里的愿望。

同时要注意是否可行,比如给猫挂铃铛的故事,老鼠们为了反抗统治者相出这么个自认为可行的方法,但这是个人利益最大化和集体利益最大化的矛盾。

如何做:1统治者获胜的关键在于他能离间所有人之间的关系,也就是如果想推翻他,就要学会团结,认识到统治者在损害自身利益,全体集中反抗。2猫本身是一个暴者,统治者在危害人民利益,因而可从笼子方面着手,建立有效的法律机制,人质机制,让政府守信。

3人民掌握监督权,统治者只享受有限的权力,减少腐败的可能迫使统治者关注人民的利益,对人民负责。

4关注贫富差距,统治者在征税时要区别富人和穷人的征税额度。

5健全福利保障。

6雇主与雇员的监督博弈

(1)记雇主检查的概率为P,雇员偷懒的概率为q

Y主检查=(-C+F)*q+(V-W-C)*(1-q)

Y主不检查=-W*q+(V-W)*(1-q)

当Y主检查=Y主不检查时,得出q=C/(W+F)

Y员偷=-F*P+W*(1-P) , Y员不偷=(W-H)*P+(W-H)*(1-P) 当Y员偷=Y员不偷时,P=H/(W+F)

(2)由上可知,在混合战略纳什均衡时,雇主Y检查=Y不检查

所以Y主=P*Y检查+(1-P)*Y不检查=Y不检查=V-W-q*V=V-W-CV/(W+F)

(Y主),=-1+CV/(W+F)2

当Y主,=0时,W=(VC)1/2-F

所以综上,W=(VC)1/2-F时,雇主的期望收益是最大的。

(3)与不能没收雇员的抵押金F相比,雇主检查的概率与雇员偷懒的概率q都下降了,因为当没收抵押金时,雇员偷懒所造成的经济损失

增加,就不敢偷懒,而雇主也知道雇员不敢偷懒,自然检查也就松

懈了。

(4)怎样建立信任机制:他们可以通过增加工资,改善工作环境,完善员工的福利保障制度,增加年终奖金,多与下属员工进行良好的平

等沟通,密切关系等。

(5)是,应禁止收取抵押金。

因为收取抵押金不利于创造和谐的工作环境,甚至影响雇主和员工之间的关系,会在一定程度上带给员工内心的恐惧与不安全感,这是不符合社会福利最大化标准的。

并且根据计算,雇主得到最大利益时,收取抵押金Y员=(VC)1/2-F-H,不收取时为Y员=(VC)1/2-H,可见雇员的工资收益也有所降低。

7合法伤害权的价值

具有合法伤害权的是处于博弈的优势方,不具有合法伤害权的处于博弈的劣势方。权力越大,越能带来巨大的经济利益,对自己越有利。

以上述例子作一个收益矩阵:设贪污的钱为A,检查成本为B,C为贪污后的处罚成本,设贪污的概率为P,检查的概率为Q。

贪污P 不贪污1-P

Q检查(C+A-B,-C)(-B,0)

1-Q不检查(-A,A)(0,0)

Y查=(C+A-B)*P+(-P)*(-B)=-A*P

即P=B/(2A+C)

-C*Q+(1-Q)*A =0, P=A/(A+C)

当贪污的P大于B/2A时,检查时最优选择。

上述例子中,得益的都是贪污的人,打1拳代表的是官权,只要有权,不行使也能得利,如新闻中局长付德武要求他的弟弟将罪名全部承担,而弟弟迫于贪官的权力而被迫承担下来。

贪官可以利用自己的权力采用“双规”手段对付别人,使自己得利,博弈双方是权力者和无权力者,而这个权力就是迫使别人低头用的,有能力压迫别人做某事,但不一定真的耍手段,他要压迫别人,只要有这个权力即可,这就是均衡。

在这里博弈是多重的,各种利益的博弈,规则与人性的博弈,个体与规则的博弈,贪官为了追求更大的利益而运用合法伤害权,同时摒弃了规则与人性,在一种潜规则下与人达成了均衡,它的本质是为了谋利,当一方具有合法伤害别人的权力时,他会充分利用来达到使自己收益最大化的目的,而他们贿赂贪官,除了想得利,也是希望他们不迫害自己。

8For Whom the Bell Tolls

枪打出头鸟的收益矩阵,分为甲乙造反、不造反

造反不造反

乙造反(-1,-1)或(1,1)(-1,-1)

不造反(1,1)(-2,-2)

从收益矩阵中可以看出(不造反,不造反)是均衡点,可造反的人若是失败,则收益为负;若是成功,躲在后面的人也会跟着得利,造反的人不论是哪种情况,都是没有好处的。因为理性群体哦都市向往自身利益最大化,他们绝不愿未出力的人跟着得益,因而最终得到均衡点(不造反,不造反),所以说“枪打出头鸟”,哪些率先造反的人往往要做出很大牺牲。

也可以做一个猎人和鸟的收益矩阵,更清晰地表示“枪打出头鸟”。

鸟鸟

出头不出头

猎人打(0,0)(-10,-10)

不打(0,10)(5,5)

所以猎人在鸟出头的时候最好的决策就是打,猎人指的是“暴政者”,出头的鸟指“造反的人”。

躲在后面的鸟仍然要付出代价。出头鸟为前瞻者,追随者为前瞻者,前者没有积累足够的经验,损失很大;而后者为了前者的铺垫,懂得如何规避,所以他们得到很大的利益,但不能说他们就没有损失。

躲在后面的鸟就是不造反的人,在反对压迫者时只要大多数人同时行动,很容易成功,但有人躲在后面,意味着造反的人要付出很大的代价,同时意味着造反很可能失败,那么躲在后面的人仍然要受剥削者的压迫,集体的利益受到损害,个人利益也会受到牵连。

枪打出头鸟的经典案例:智猪博弈,是多劳不多得

小猪

行动等待

大猪行动5,1 4,4

等待9,-1 0,0

从矩阵中可以看出小猪的占优策略是等待,而大猪是行动,却分了部分利益给小猪,这是一种“搭便车”的行为。

而躲在后面的鸟会有两种情况,一种出头鸟成功,后人得益;另一种出头鸟失败了,后面的人不得不再次面对出不出头的困境,并继续深受暴政者的压迫。

9皇帝与功臣

第一种情况有纯战略纳什均衡(杀,造反),皇帝损益为0,功臣损益为0 第二种情况纯战略纳什均衡不存在谢林点,因此分析混合战略均衡,得到皇帝杀的概率为1/2,功臣造反的概率为1/2,皇帝损益-1/2,功臣损益1/2 第三种情况有纯战略的纳什均衡(不杀,不造反),皇帝损益为1,功臣损益为1.

当功臣实力越强,就越可能造反;当功臣实力为中时,皇帝与功臣期望损益最少。明末安史之乱为第一种情况,宋朝赵匡胤“杯酒释兵权”为第三种情况,而林彪造反为第二种情况。

能传递。因为功臣实力越弱,皇帝不杀的可能性越高。历史上这样的例子很多,如安禄山、范蠡等,功臣可以通过告老还乡、交出自己的大权;或者“装傻充愣”,不要显得比皇帝聪明,多多巴结讨好皇帝,有时候学会犯些小错误。

皇帝传递自己是强的,可以这样做:政治上,励精图治,开明,获取民心,得到百姓的拥戴:严惩贪官污吏,以达到杀一儆百的目的;在军事上,集中兵权,相对削弱功臣的兵权,只给其一定的指挥权,并严格选拔优秀的军事将领,加强巩固边防,训练士兵,开发新式武器。

经济上,减免苛捐杂税,鼓励耕织,放松从商限制,鼓励通商,并可利用此建立良好的外交,并培养大批人才为己用。

这样皇帝强了,功臣就弱了,功臣认为自己造反成功的概率减小,就不敢造反了。

采取哪些有效的机制:1民主与法制的完美结合,皇帝不能单靠暴力手段统治天下。要有一定的机构制约皇帝的权力,皇帝应懂得“取信于民”的重要性,依法治民。

2健全福利保障制度,充分改善百姓生活,获得民心,巩固自己的地位,从制度上保证执政党的利益与人民一致。

3通过民主选举,轮流选出百姓心目中真正能力强的人当领袖,民主领导大众,人民当家作主,人人平等,建立社会主义。

10印象最深或收获最大的内容。

刚走进课堂,老师您幽默风趣的讲解深深吸引了我,我对博弈论有了初步的了解,在这门课上,我接触了一个全新的领域,从许多真实而鲜活的例子中,我感觉到博弈论与我们的生活息息相关,学会了一种新的思考方式

——博弈思考,如强盗分金币、万元陷阱等,非常有趣,反常规思考,采用了逆向思考的方法,也让我在以后的社会竞争中记住要反常规出牌,要能学会预测趋势,做到知己知彼。

我从博弈论这门课中得到许多启迪:

第一点:说真话骗人。这是一个有趣而又发人深省的现象。一方面揭示了信任缺失的可悲现状,一方面也提供了一种极为巧妙地方法。在我知道你不会相信我,于是我故意说出真实的情况,你不信我,因而就达成了欺骗的目的,也就取胜了。如老师上课所举的“曹操败走华容道”的例子,事实上在当代经济、政治等方方面面领域都是受用的。

第二点:在博弈中,若希望得到对方的信任,关键是让其相信双方利益时一致的,就像老师上课时所讲的“公主与侍卫的选择”这个例子,只有当他们两人目标一致时,才能得到自己想要的结果。现实社会中亦是如此,每个人首先都要为自己的利益考虑,从自身出发,若两人的利益产生冲突,则合作也就破产了,沟通的有效性往往来自于利益的一致性,就比如国家外交,公司之间的合作经营等,都是如此。有句话曾这样说过:“没有永远的朋友,只有永远的利益。”这固然有些势利,但也确实如此,利益或许可以成为合作的前提,同时在合作后建立真正的信任,这对我的启发很大,在现代竞争型社会中,利益的冲突不可避免,你不能一味排斥,尽可以从善如流。

第三点:博弈论在生活中的应用。以前一直觉得博弈论离我的生活很远,但上了蒋老师的课后,发现生活中处处都在博弈。就比如价格战博弈,通常我们买衣服时都会讲价,而一开始我们最好把价格压得低一些,老板觉得不合理就讨价还价,最终找到一个我们都能接受的均衡点,还譬如我的收入与支出,自己和朋友、同学之间的交往等等,我们应该从中找到最理想的方式使收益达到最高。而在现代社会中做生意想要成功同样需要博弈,因而博弈论在生活中的应用是很广泛的。

感谢博弈论这门课为我开拓了一个全新的领域,也谢谢蒋老师您生动有趣的上课方式!!

40

社科1008班

黄露

周二晚的课

博弈论考试题目

博弈论考试题 一、名词解释(20分) 1.纳什均衡 2.子博弈完美均衡 3.重复博弈 4.贝叶斯博弈 二、简答题(30分) 1.按照信息和顺序,博弈有哪些分类?且对应的均衡概念分别是什 么? 2.在完全信息静态博弈中,求纳什均衡的方法有几种,分别是什么? 3.对于重复博弈,合作解可能在哪些情况下产生? 三、分析题(25分,每小题5分) 假设公安局抓住了两个合伙犯罪的嫌疑犯,但获得的证据并不十分确切,对于两者的量刑就取决于两者对于犯罪事实的供认。这两名犯罪嫌疑人在公安局是分别关押以防他们串供。两名犯罪嫌疑人都知道,如果他们都交代犯罪事实,则可能将各被判5年;如果他们都不交代,则有可能会被较轻的妨碍公务罪各判2年;如果一人交代,另一人不交代,交代者会被立即释放,不交代者被判8年。回答以下问题:(1)请写出这两名犯罪嫌疑人博弈的支付矩阵。 (2)假设这两名犯罪嫌疑人都是自私且不讲江湖道义的人,同时被审问且不能够相互沟通串供。请给出该博弈的纳什均衡。(3)说明这两个囚徒的困境在哪里?

(4)利用囚徒困境博弈对下面现象进行解释:电信市场上移动和联通的价格战。 (5)请指出一种走出囚徒困境的办法。 四、计算题(25分) 企业甲和企业乙都是家电制造商,他们都可以选择生产高端或是低端产品,两企业在不同选择下的利润如以下得益矩阵所示。假设企业甲先于企业乙进行产品选择并投入生产,企业乙在决定生产时已经知道企业甲的选择,而且这一点大家都知道。 (1)请写出该博弈的扩展式; (2)该博弈的子博弈完美均衡是什么? 企业2 高端低端 高端 企业1 低端 答题要求: 1.必须手写; 2.稿纸单面书写; 3.下周三上午统一交。

浙大博弈论考试题目

博弈论考试 1、完全信息静态博弈 1“老师点名和学生逃课”的案例 构建如下模型:老师 点名不点名 学生逃课a1,b1 a2,b2 不逃课a3,b3 a4,b4 结果:(1)老师每次点名,学生每次不逃课 a3> a1 ,b3> b4 ,a2< a4 ,b2< b1 (2)老师每次不点名,学生每次不逃课 a4> a2 , b4> b3 , a1< a3 , b1< b2 (3)老师有时候点名,学生有时候逃课 a1< a3 , a2> a4 , b1> b2 , b3< b4 (4)老师每次不点名,学生每次逃课 a2> a4 , b2> b1 , a3< a1 , b3< b4 2市场占有者和想进入市场者 构建模型:占有者 默认斗争 进入者进入(40,50)(-10,0) 不进入(0,300)(0,300) 没有占优战略均衡,也没有重复剔除的占优均衡。 结果:(1)占有者默认,进入者进入时,占有者会损失部分利益 (2)占有者斗争,进入者进入,则占有者利益变0,而进入者为负,两败俱伤,因而占有者“斗争”是弱劣战略。 (3)占优者默认,进入者不进入,则占有者获得全部市场 (4)(斗争,不进入时,占有者仍获得全部市场。 综上存在两个纳什均衡,(进入,默认)和(不进入,斗争) 3应试教育和素质教育学生 应试教育素质教育 学校应试教育(0,0)(0,-1) 素质教育(-1,0)(1,1) (1)假设学校和学生都采取应试教育为(0,0),那么若他们都转向素质教育达到最优结局(1,1),(2)但如果单方面采取素质教育,另一方为应试教育,其支付就变为-1,比如如果学校重视应试成绩,而学生重视素质教育,学生单方面受损,为-1 (3)若学校注重素质教育,而学生只注重成绩,学校的策略难以推行,支付为-1. 此博弈中存在两个纳什均衡,即(应试,应试)和(素质,素质),虽然(素质,素质)是最优纳什均衡,但一方采取素质教育存在风险:另一方为应试时,支付变为-1;若采取应试没有变为-1的风险,那么最终结局为(应试,应试)。4两个人合作开发一项产品假设项目开发成功每人收益为4,失败时收益为 0,偷懒者的机会成本为1

《经济博弈论》期末考试复习

《经济博弈论》期末考试复习资料 第一章导论 1.博弈的概念: 博弈即一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,并从中各自取得相应结果的过程。它包括四个要素:参与者,策略,次序和得益。 2.一个博弈的构成要素: 博弈模型有下列要素:(1)博弈方。即博弈中决策并承但结果的参与者.包括个人或组织等:(2)策略。即博弈方决策、选择的内容,包括行为取舍、经济活动水平或多种行为的特定组合等。各博弈方的策略选择范围称策略空间。每个博弈方各选一个策略构成一个策略组合。(3)进行博弈的次序:次序不同一般就是不同的博弈,即使博弈的其他方面都相同。(4)得益。各策略组合对应的各博弈方获得的数值结果,可以是经济利益,也可以是非经济利益折算的效用等。 3.合作博弈和非合作博弈的区别: 合作博弈:允许存在有约束力协议的博弈;非合作博弈:不允许存在有约束力协议的博弈。主要区别:人们的行为互相作用时,当事人能否达成一个具有约束力的协议。 假设博弈方是两个寡头企业,如果他们之间达成一个协议,联合最大化垄断利润,并且各自按这个协议生产,就是合作博弈。 如果达不成协议,或不遵守协议,每个企业都只选择自己的最优产品(价格),则是非合作博弈。 合作博弈:团体理性(效率高,公正,公平) 非合作博弈:个人理性,个人最优决策(可能有效率,可能无效率) 4.完全理性和有限理性: 完全理性:有完美的分析判断能力和不会犯选择行为的错误。 有限理性:博弈方的判断选择能力有缺陷。 区分两者的重要性在于如果决策者是有限理性的,那么他们的策略行为和博弈结果通常与在博弈方有完全理想假设的基础上的预测有很大差距,以完全理性为基础的博弈分析可能会失效。所以不能简单地假设各博弈方都完全理性。 5.个体理性和集体理性: 个体理性:以个体利益最大为目标;集体理性:追求集体利益最大化。 第一章课后题:2、4、5 2.设定一个博弈模型必须确定哪几个方面? 设定一个博弈必须确定的方面包括:(1)博弈方,即博弈中进行决策并承担结果的参与者;(2)策略(空间),即博弈方选择的内容,可以是方向、取舍选择,也可以是连续的数量水平等;(3)得益或得益函数,即博弈方行为、策略选择的相应后果、结果,必须是数量或者能够折算成数量;(4)博弈次序,即博弈方行为、选择的先后次序或者重复次数等;(5)信息结构,即博弈方相互对其他博弈方行为或最终利益

博弈论复习题及答案

囚徒困境说明个人的理性选择不一定是集体的理性选择。(√) 子博弈精炼纳什均衡不是一个纳什均衡。(×) 若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。()博弈中知道越多的一方越有利。(×) 纳什均衡一定是上策均衡。(×) 上策均衡一定是纳什均衡。(√) 在一个博弈中只可能存在一个纳什均衡。(×) 在一个博弈中博弈方可以有很多个。(√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。(√) 在博弈中纳什均衡是博弈双方能获得的最好结果。(×) 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(×)上策均衡是帕累托最优的均衡。(×) 因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。 (×) 在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×) 在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(√)不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√) 多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(√) 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t

博弈论考试试题

博弈论考试试题 你有三个小时考试时间。回答所有问题。考试内容比较多,我在认为最难的问题旁边标注了星号,如果你担心不够时间,可以把这些带星号的问题留到最后才做。 1.(55分钟—36分)简略回答下面每个子问题。请写出你的计算过程,并在你不能给出正式结论时,提供大概的解释,那样我可以给你部分分数。 (a)尽可能给出正式的说明,指出一个观察到的行为是无穷连续的多级博弈意味什么?给出一个不是无穷连续博弈的例子。 (b)尽可能给出正式的说明,指出一个一般性支持的性质意味着什么?在课上我们看到什么理论关于一般性支持的性质? (c)课堂上,在说明带有可观察行为的有限扩展型博弈和无限期多级博弈时,我不同地详细讲述了支付函数。支付函数范畴是如何不同?为什么我做出这个改变? (d)在扩展型博弈中给出一个策略的正式定义。 (e)给出一个博弈的例子,其中一个看起来不合理的结果在一个子博弈完美均衡里变成可能。(f)下面显示的扩展型博弈里,博弈者1有多少个纯策略?写出正常形式的支付矩阵。这个博弈有多少子博弈? (g)找出下面博弈中全部的纳什均衡。

(h )找出二阶段博弈的子博弈完美均衡,博弈者在成本a/16处选择a ,于是博弈者1和2同时行动进行博弈,如下面所示。 (i )找出同时行动博弈中的纳什均衡,其中博弈者1选择1a ∈?,博弈者2选择2a ∈?,支付是,

考虑如下的关于信任的博弈,这在很多试验中都做过。试验者从给博弈者1$10和给博弈者2$0开始。然后试验者问博弈者1愿意将多少美元给博弈者2来帮助他。如果他选择给x美元给试验者,则试验者给博弈者2 *3x。随后,博弈者2有机会将一些或全部(或没有)他获得的钱给博弈者1。 (a)假定这两个博弈者都是风险中性的,仅关心他们自己的支付,找出这个博弈的子博弈完美均衡。(顺便说明,子博弈完美均衡不像在试验中出现。通常博弈者1给出一些,但不会把全部的钱给回试验者) (b) 这个博弈有博弈者获得更高支付的纳什均衡吗? (c)假定我们修改了博弈,以致在上述的两阶段后,博弈者1有机会打博弈者2。假定这将减少博弈者1的效用1美元,减少博弈者2的效用5美元。这将改变你们在(a)和(b)中的答案吗?如果我们在第二阶段后有如下显示的博弈会怎么样呢?作个你认为合理的预测。 (d*)对这个试验结果的另一个解释是,博弈者可以是无私心的。说明无私心的最简单表达——每个博弈者最大化他自己的美元支付和其他博弈者美元支付的权重和——除了权重上一个特别(非强迫)的选择,不能解释试验规则性。你能想出可能被用来说明试验结果的效用函数吗?

博弈论考题与答案

一、假设市场上有三个垄断企业,企业无生产成本,问达到纳什均衡时的产量为多少?假设市场的价格和数量之间P=a—b*Q 解: 二、什么是纳什均衡,你是如何理解纳什均衡的? 答:纳什均衡指的是这样一种战略组合,这种战略组合由所有参与人的最优战略组成,也就是说,给定别人战略的情况下,没有任何单个参与人有积极性选择其他战略使自己获得更大利益,从而没有任何人有积极性打破这种均衡。当然,“纳什均衡”虽然是由单个人的最优战略组成,但并不意味着是一个总体最优的结果。如上述,在个人理性与集体理性的冲突的情况下,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。 三、构建一个博弈,说明如何杜绝学生考试作弊现象(参考高薪养廉博弈) 答: 四、给出该博弈的纳什均衡,并用消除劣势战略法,找出 (R1,C3)这个纳什均衡。 C1 C2 C3 R1 2,12 1,10 1,12 R2 0,12 0,10 0,11 R3 0,12 0,10 0,13 五、两个老朋友在一起喝酒,每个人有四个纯战略:杠子、老虎、鸡和虫子,输赢规则是:杠子降鸡,鸡吃虫子,虫子降杠子,两人同时出令。如果一个打败另一个,赢的效用为1,输的效用为-1,否则效用为0,写出这个博弈的支付矩阵,计算其混合战略纳什均衡。 答:设S为棒子T为老虎C为鸡W为虫子,则其支付矩阵为: 2 S T C W S 0,0 1,-1 0,0 -1,1 1 T -1,1 0,0 1,-1 0,0 C 0,0 -1,1 0,0 1,-1 W 1,-1 0,0 -1,1 0,0 设1、2出STCW的概率分别为P1P2P3P4和Q1Q2Q3Q4,则矩阵达到均衡时,2的期望收益必须满足:0*p1—1*p2+0*p3+1*p4=1*p1+0*p2—1*p3+0*p4=0*p1+1*p2+0*p3—1*p4= —1*p1+0*p2+1*p3+0*p4 整理为—p2+p4=p1—p3= —p1+p3 由于上式为对称的,所以,p1=p2=p3=p4,又p1+p2+p3+p4=1,可得p1=p2=p3=p4=0.25. 同理q1=q2=q3=q4=0.25 综上所述,混合战略的纳什均衡为:A1(0.25,0.25,0.25,0.25)A2(0.25,0.25,0.25,0.25) 六、5个海盗抢到了100颗宝石,每一颗大小和价值都一样他们决定这么分:抽签决定自己的号码(1、2、3、4、5)。首先,1号提出分配方案。然后大家5人进行表决,当超过半数的人同意时,按照他的提案进行分配,否则将被扔人大海喂鳌鱼。如果1号死后,再由2号提出分配方案,然后大家4人进行表决,当且仅当超过半数的人同意时,按照他的提案进行分配,否则将被扔人大海喂鳖鱼。以次类推。假定每个个强盗都是经济学假设的“理性人”,假定每个判决都能顺利执行。那么,如果你是第一个强盗,你该如何提出分配方案才能够使自己的收益最大化? 七、假设选民政治态度是成线性均匀分布的,说明为什么两党政治具有欺骗性,如果是三党政治情况如何,为什么? 答:政党和政治家争取选民情况实际上就和杂货铺定位博弈一样。工党一定要打出劳工代言人的旗帜,所以他是站在左边的,左边是他的地盘。但是只有左边一半的选民,还不足以保证胜出。为了在竞选中获胜,他要想办法把中间的在两党之间摇摆的选民争取过来。最好的办法,就是使自己的竞选纲领向“右”的方向靠过去一点,就是在竞选中宣布也要照顾中产阶级的利益。移过去一点,地盘就可能大一点。同样,原来立党之本是在“右”边的保守党,在竞选的过程中,也要往左边靠,争取更多的选民。这样斗法的结果,在漫长的竞选过程中,虽然两党的漫骂不断升级,但是实际纲领却不断靠近,直到两个政党在中点紧挨在一起,才是稳定的纳什均衡。 这个政党纲领向中点移动的机制,也说明西方两党政治的欺骗性。竞选的时候,怎样有利于拉票就怎样讲,当选以后,可以忘得一干二净。在这个意义上,我们说不要以为哪个政党上台这些西方国家的态度就会改变,确实很有道理。政党政治,本来在理论上有促使政治家个人操守不可太放肆的优点。但是在西方国家,小学生都知道政治家说的话不可靠,无奈制度决定了,每次竞选,人们只能在那少数政治家之间作出他信非常有限的选择。 为什么第三个政党难成气候?这是因为,如果三个政党的位置不相同,不在同一个点上,那么他们都有向中点

博弈论测试题

博弈论测试题十一 一、什么是子博弈精炼纳什均衡? 答:将纳什均衡中包含的不可置信的威胁策略剔除出去。它要求参与者的决策在任何时点上都是最优的。由于剔除了不可置信的威胁,在许多情况下,精炼纳什均衡也就缩小了纳什均衡的个数。只有当参与人的策略在每一个子博弈中都构成纳什均衡叫做精炼纳什均衡。或者说,组成精炼纳什均衡的策略必须在每一个子博弈中都是最优的。 二、参与人的理性问题对动态博弈分析的影响是否比静态博弈的影响更大?为什么? 答:正确,博弈论要求个体具有始终追求自身利益最大化的理性意识和理性能力的“自我” 个体理性,这是静态博弈的范畴。除此之外,还要求相关的参与者具有层次较高的“交互理性”,要求不同个体之间在理性和行为方面具有一种“默契”。即,人们的自身利益的最大化不仅取决于自己的选择,还取决于与之相关的其他人的选择与行为,那么为了实现自己的最大利益,个体的理性决策就必须考虑他人的理性选择与行为。作为博弈论的基础,交互理性是其基本的理性要求。博弈论还要求有关博弈的结构、各个博弈参与者的得益函数以及各个博弈参与者的理性等“知识”是所有博弈参与者之间的“共同知识”。也就是,每个博弈参与者不仅要首先明确自己和其他参与者所有可选的策略,还需知晓各种情况下自己最终的收益或其概率分布,并且每个博弈参与者都知道各个参与者掌握这些信息;更为重要的是,每个博弈参与者都知道所有参与者都是理性的,都知道其他博弈参与者知道所有参与者都是理性的,都知道其他博弈参与者知道其他博弈参与者知道所有博弈参与者都是理性的------。理性的共同知识假设是非合作博弈理论的一个非常重要和关键的假设,是实现交互理性和理性主义的纳什均衡的基本前提,这些,都是动态博弈的范畴。因此说,参与者理性问题对动态博弈的分析影响更大。 三、纳什均衡和精炼纳什均衡存在哪些问题? 答:纳什均衡存在的问题: (1)不是所有博弈都存在纳什均衡如纯策略就不存在混合策略则一定会存在纳什均衡,它是通过概率来计算纳什均衡,在这种均衡下,给定其他参与人的策略选择概率,每个参与人都可以为自己确定选择每一种策略的最优概率。 (2)在论及纳什均衡时,我们假设参与人是完全理性的,而且是假定参与人之间不允许达成任何协议的非合作博弈的均衡解。而现实并非如此。 精炼纳什均衡存在的问题:有限重复博弈的子博弈精炼纳什均衡有如下定理∶令G是阶段博弈,G(T)是重复T次的重复博弈。那么,如果G有唯一的纳什均衡,重复博弈G(T)的唯一子博弈精炼纳什均衡结果是阶段博弈G的纳什均衡重复T次。这个定理成立的条件是单阶段纳什均衡的“唯一性” ,若纳什均衡不是唯一的,上述定理的结论就不一定成立。 四、有限次重复博弈和无限次重复博弈有什么区别?这些区别对我们有什么启发? 答:有限次重复博弈与无限次重复博弈都属于动态博弈,对于有限次博弈,收益是每次收益的简单相加,可以采取子博弈纳什均衡的方法求解,即逆推法;但无限次博弈却不能采取;此外,有限次博弈中博弈的双方都还是关注的是自己短期的利益,而无限次博弈中博弈的双方可能针对某项事情达成协议,达到共谋,为共同的利益而选择自己的行动,达到整体的最优,供应链契约即类似。 五、有限次重复博弈的精炼纳什均衡的最后一次重复必定是第一阶段博弈的一个纳什均衡?答:

博弈论第三章习题

问题1:如果开金矿博弈中第三阶段乙选择打官司后的结果尚不能肯定,即下图中a 、b 数值不确定。试讨论本博弈有哪几种可能的结果。如果本博弈中的“威胁”和“承诺”是可信的,a 或b 应满足什么条件? ①0a <,不借—不分—不打; ②01a <<,且2b >,借—不分—打; ③1a >,且2b >,借—不分—打(,)a b ; ④0a >,且2b <,借—分—(2,2) 问题2:三寡头市场需求函数Q P -=100,其中Q 是三个厂商的产量之和,并且已知三个厂商都有常数边际成本2而无固定成本。如果厂商1和厂商2同时决定产量,厂商3根据厂商1和厂商2的产量决策,问它们各自的产量和利润是多少? 1123111231(100)2(98)q q q q q q q q q π=----=--- 2123221232(100)2(98)q q q q q q q q q π=----=--- 3123331233(100)2(98)q q q q q q q q q π=----=--- 331230,(98)/2q q q q π?=?=--? 代入,11212122(98)/2,(98)/2q q q q q q ππ=--=-- (a ,b ) (0,4)

1212 0,0q q ππ??==??,得***12398/3,49/3q q q ===

***1234802/9,2401/9πππ===。 问题3:设两个博弈方之间的三阶段动态博弈如下图所示。 (1)若a 和b 分别等于100和150,该博弈的子博弈完美纳什均衡是什么? (2)T N L --是否可能成为该博弈的子博弈完美纳什均衡路径,为什么? (3)在什么情况下博弈方2会获得300单位或更高的得益? (1)博弈方1在第一阶段选择R ,在第三阶段选择S ,博弈方2在第二阶段选择M 。 (2)不可能。T N L --带来的利益50明显小于博弈方1在第一阶段R 的得益300;无论a 和b 是什么数值,该路径都不能构成Nash 均衡,不能成为子博弈完美Nash 均衡。 (3)由于T N L --不是本博弈的子博弈完美Nash 均衡,因此博弈方2不可能通过该路径实现300单位的得益,唯一有可能实现300单位及以上的得益的路径为L N S --,要使该路径成为子博弈完美Nash 均衡而且博弈方2得到300单位及以上的得益必须300,300a b >≥。 问题4:企业甲和企业乙都是彩电制造商,都可以选择生产低档产品或高档产品,每个企业在四种不同的情况下的利润如以下得益矩阵所示。如果企业甲先于企业乙进行产品 (a ,b ) 50,300

博弈论 课后习题答案

博弈论课后习题答案 第四部分课后习题答案 1. 参考答案: 括号中的第一个数字代表乙的得益,第二个数字代表甲的得益,所以a表示乙 的得益,而b表示甲的得益。 在第三阶段,如果,则乙会选择不打官司。这时逆推回第二阶段,甲会选择 a,0 不分,因为分的得益2小于不分的得益4。再逆推回第一阶段,乙肯定会选择 不借,因为借的最终得益0比不借的最终得益1小。 在第三阶段,如果,则乙轮到选择的时候会选择打官司,此时双方得益是 (a,b)。a,0 逆推回第二阶段,如果,则甲在第二阶段仍然选择不分,这时双方得益为 (a,b)。b,2 在这种情况下再逆推回第一阶段,那么当时乙会选择不借,双方得益(1,0), 当a,1 时乙肯定会选择借,最后双方得益为(a,b)。在第二阶段如果,则甲会选择 a,1b,2分,此时双方得益为(2,2)。再逆推回第一阶段,乙肯定会选择借,因为 借的得益2大于不借的得益1,最后双方的得益(2,2)。 根据上述分析我们可以看出,该博弈比较明确可以预测的结果有这样几种情况: (1),此时本博弈的结果是乙在第一阶段不愿意借给对方,结束博弈,双方a,0 得益 (1,0),不管这时候b的值是多少;(2),此时博弈的结果仍然012,,,ab且

是乙在第一阶段选择不借,结束博弈,双方得益(1,0);(3),此时博ab,,12 且弈的结果是乙在第一阶段选择借,甲在第二阶段选择不分,乙在第三阶段选择打,最后结果是双方得益 (a,b);(4),此时乙在第一阶段会选择借,甲在第二阶段会选择分,ab,,02且双方得益(2,2)。 要本博弈的“威胁”,即“打”是可信的,条件是。要本博弈的“承诺”,即a,0 “分”是可信的,条件是且。 a,0b,2 注意上面的讨论中没有考虑a=0、a=1、b=2的几种情况,因为这些时候博弈方的选择很难用理论方法确定和预测。不过最终的结果并不会超出上面给出的范围。 2. 参考答案: 静态贝叶斯博弈中博弈方的一个策略是他们针对自己各种可能的类型如何作相应的完整计划。或者换句话说,静态贝叶斯博弈中博弈方的策略就是类型空间到行为空间的一个函数,可以是线性函数,也可以是非线性函数,当博弈方的类型只有有限几种时是离散函数,当博弈方的类型空间是连续区间或空间时则是连续函数。只有一种类型的博弈方的策略仍然是一种行为选择,但我们同样可以认为是其类型的函数。 静态贝叶斯博弈中博弈方的策略之所以必须是针对自己所有可能类型的函数,原因是博弈方相互会认为其他博弈方可能属于每种类型,因此会考虑其他博弈方所有可能类型下的行为选择,并以此作为自己行为选择的根据。因此各个博弈方必须设定自己在所有各种可能类型下的最优行为,而不仅仅只考虑针对真实类型的行为选择。 3. 参考答案:

清华大学经济博弈论期末考试04

经济博弈论(2004年秋季学期)期末测验题答案 注意:请将所有题目的答案写在答题册上,写在本试题页上一律无效。 1. (20 points) Lucy offers to play the following game with Charlie: “Let us show pennies to each other, each choosing either heads or tails. If we both show heads, I pay you $3. If we both show tails, I pay you $1. If the two don’t match, you pay me $2.” Charlie reasons as follows. “The probability of both heads is 1/4, in which case I get $3. The probability of both tails is 1/4, in which case I get $1. The probability of no match is 1/2, and in that case I pay $2. So it is a fair game.” Is he right? If not, (a) why not, and (b) what is Lucy’s expected profit from the game?(game table, 5 points; solutions, 7 points; (a), 4 points; (b), 4 points) (20分)露西提出与查理玩下面的游戏:“让我们互相向对方亮出硬币,每个人可以选择正面或者背面。如果双方亮出的都是正面,我给你3美元。如果双方亮出的是背 面,我给你1美元。如果两枚硬币正背面不同,你给我2美元。”查理做了这样的推理: “两枚硬币都是正面的概率是1/4,如此我得到3美元。都是背面的概率为1/4,如此我 得到1美元。正背面不同的概率为1/2,如此我付出2美元。因此这是一个公平游戏。” 他的想法是否正确?如果不正确,(a)为什么不正确?(b)露西从游戏中得到的期望 利润是多少?(博弈表5分;解7分;(a)问4分;(b)问4分。) 解答: 该博弈为零和博弈。博弈表如下(5分): CHARLIE Head Tail LUCY Head -3 2 Tail 2 -1 求解博弈。容易看出,该零和博弈没有纯策略纳什均衡。(1分) 只有一个混合策略的纳什均衡为:露西和查理均以3/8的概率出正面,5/8的概率出背面。 (6分) (a)查理的推理不对。因为双方实际(策略性)选择的、出硬币的正背面的概率不同于完 全随机选择的概率(后者正背面概率各为1/2)。查理错误地将一个混合策略的博弈情境当成 了随机选择的“赌博”情境。(4分) (b)露西的期望利润为1/8。(4分)(相应的,查理的期望利润为-1/8,不要求) 2. (20 points) You have to decide whether to invest $100 in a friend’s enterprise, where in a year’s time the money will increase to $130. You have agreed that your friend will then repay you $120, keeping $10 for himself. But instead he may choose to run away with the whole $130. Any of your money that you don’t invest in your friend’s venture, you can invest elsewhere safely at the prevailing rate of interest r, and get $100(1+r) next year. (a) Draw the game tree for this situation and show the rollback equilibrium. (8 points) Next suppose this game is played repeatedly infinitely often. That is, each year you have the

“博弈论”习题及参考答案

《博弈论》习题 一、单项选择题 1.博弈论中,局中人从一个博弈中得到的结果常被称为()。 A. 效用 B. 支付 C. 决策 D. 利润 2.博弈中通常包括下面的内容,除了()。 A.局中人 B.占优战略均衡 C.策略 D.支付 3.在具有占优战略均衡的囚徒困境博弈中()。 A.只有一个囚徒会坦白 B.两个囚徒都没有坦白 C.两个囚徒都会坦白 D.任何坦白都被法庭否决了 4.在多次重复的双头博弈中,每一个博弈者努力()。 A.使行业的总利润达到最大 B.使另一个博弈者的利润最小 C.使其市场份额最大 D.使其利润最大 5.一个博弈中,直接决定局中人支付的因素是()。 A. 策略组合 B. 策略 C. 信息 D. 行动 6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时 的博弈具有()。 A.囚徒困境式的均衡 B.一报还一报的均衡 C.占优策略均衡 D.激发战略均衡 7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的策略称为()。 A.一报还一报的策略 B.激发策略 C.双头策略 D.主导企业策略 8.在囚徒困境的博弈中,合作策略会导致()。 A.博弈双方都获胜 B.博弈双方都失败

C.使得先采取行动者获胜 D.使得后采取行动者获胜 9.在什么时候,囚徒困境式博弈均衡最可能实现()。 A. 当一个垄断竞争行业是由一个主导企业控制时 B.当一个寡头行业面对的是重复博弈时 C.当一个垄断行业被迫重复地与一个寡头行业博弈时 D. 当一个寡头行业进行一次博弈时 10.一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种策略是一种()。 A.主导策略 B.激发策略 C.一报还一报策略 D.主导策略 11.关于策略式博弈,正确的说法是()。 A. 策略式博弈无法刻划动态博弈 B. 策略式博弈无法表明行动顺序 C. 策略式博弈更容易求解 D. 策略式博弈就是一个支付矩阵 12.下列关于策略的叙述哪个是错误的(): A. 策略是局中人选择的一套行动计划; B. 参与博弈的每一个局中人都有若干个策略; C. 一个局中人在原博弈中的策略和在子博弈中的策略是相同的; D. 策略与行动是两个不同的概念,策略是行动的规则,而不是行动本身。 13. 囚徒困境说明(): A. 双方都独立依照自己的利益行事,则双方不能得到最好的结果; B. 如果没有某种约束,局中人也可在(抵赖,抵赖)的基础上达到均衡; C. 双方都依照自己的利益行事,结果一方赢,一方输; D、每个局中人在做决策时,不需考虑对手的反应 14. 一个博弈中,直接决定局中人损益的因素是(): A. 策略组合 B. 策略 C. 信息 D. 行动 15. 动态博弈参与者在关于博弈过程的信息方面是() A 不对称的 B 对称的 C 不确定的 D 无序的

《博弈论》期中考试试卷及参考答案

20XX 级经济学专业(1-2班) 《博弈论》期中考试试卷(开卷) 班级 学号 姓名 成绩 1、不能用铅笔答题,违反者按缺考处理; 2、开卷考试,给足够时间答题,请认真完成考试;卷面务必保持清楚整洁,每涂改一处扣10分; 3、每一道题的解务必写出完整的解题过程,没有过程,只有答案不给分; 4、如果发现雷同卷,一律按零分处理。 一、下面的支付矩阵表示一个两人的静态博弈。问当a 、b 、c 、d 、f 、g 、h 之间满足什么条件时,该博弈存在严格优势策略均衡(20分) 参考答案: 1、严格优势策略均衡是由各博弈方的严格优势策略组成的策略组合。(2分) 2、对于博弈方1,如果a >e 且c >g ,则U 是相对于D 的严格优势策略;如果a <e 且c <g ,则D 是相对于U 的严格优势策略;(3分) 3、对于博弈方2,如果b >d 且f >h 则L 是相对于R 的严格优势策略;如果b <d 且f <h ,则R 是相对于L 的严格优势策略。(3分) 4、上述两个博弈方各自有两种严格优势策略的相对支付情况的组合,总共可能构成四种严格优势策略均衡:(12分) 1)如果a >e 且c >g ,b >d 且f >h ,严格优势策略均衡是(U ,L ) 2)如果a >e 且c >g ,b <d 且f <h ,严格优势策略均衡是(U ,R ) 3)如果a <e 且c <g ,b >d 且f >h ,严格优势策略均衡是(D ,L ) 4)如果a <e 且c <g ,b <d 且f <h ,严格优势策略均衡是(D ,R ) (在求解本题时,如果前面三点没有写,但这四条都能写出来,可以按每条5分计算,共20分) 二、一个工人给一个老板干活,工资标准是100元。工人可以选择是否偷懒,老板则选择是否克扣工资。假设工人不偷懒有相当于50元的负效用,老板想克扣工资总有借口扣掉60元工资,工人不偷懒老板有150元产出,而工人偷懒时老板只有80元产出,但老板在支付工资之前无法知道实际产出,这些情况是双方都知道的。请问:(1)如果老板完全能够看出工人是否偷懒,博弈属于哪种类型?请用支付矩阵或博弈树表示该博弈(要求按教材给出的格式来表示,并求出博弈的所有Nash 均衡及博弈的结果(2)如果老板无法看出工人是否偷懒,博弈属于哪种类型?请用支付矩阵或博弈树表示该博弈(要求按教材给出的格式来表示,并求出博弈的均衡解。(共30分) 参考答案 g ,h e ,f c ,d a , b L R U D 博弈方2博弈方1

博弈论试题

Brigham Young University Department of Economics Economics 381 – Intermediate Macroeconomics Dr. Phillips (sections 2 & 4) Winter Semester 2005 Midterm Exam 2 key Mar. 11 - 12, 2005 This exam is closed book and closed notes, though you may use a calculator. Read all questions carefully before answering. Write your answers legibly in the space provided. Keep your answers concise and correct. Points will be deducted for answers which are irrelevant to the question. You may use a testing center calculator to help with the math, if you wish. Section I (multiple choice, 2 points each) Circle the letter of the correct answer. 1. Consumption smoothing refers to (a) the tendency of all consumers to choose the same amount of current consumption. (b) the tendency of consumers to seek a consumption path over time that is smoother than income. (c) the tendency of consumers to seek an income path over time that is smoother than consumption. (d) consumer’s concerns about going heavily into debt. 2. An increase in first-period income results in (a) an increase in first-period consumption, an increase in second-period consumption, and an increase in saving. (b) an increase in first-period consumption, a decrease in second-period consumption, and an increase in saving. (c) a decrease in first-period consumption, an increase in second-period consumption, and an increase in saving. (d) an increase in first-period consumption, an increase in second-period consumption, and a decrease in saving. 3. An increase in the real interest rate is an example of a (a) pure substitution effect. (b) substitution effect and a positive income effect. (c) substitution effect and a negative income effect. (d) substitution effect and an income effect whose sign depends on whether the consumer is initially a borrower or a lender. 4. An increase in lifetime wealth is likely to (a) increase current labor supply and increase current consumption demand. (b) increase current labor supply and decrease current consumption demand. (c) decrease current labor supply and increase current consumption demand. (d) decrease current labor supply and decrease current consumption demand.

经济博弈论

1、纳什均衡的概念。 对于任一个博弈游戏来讲,一定存在这么一组策略,使得其对于任一个局中人而言都是最好的,如果其它的所有局中人不改变他们的策略的话。 2、非合作博弈与合作博弈的区别。形成合作博弈的两个条件: (1)对联盟来说,整体收益大于其每个成员单独经营时的收益之和。 (2)对联盟内部而言,应存在具有帕累托改进性质的分配规则,即每个成员都能获得比不加入联盟时多一些的收益。 如何保证实现和满足这些条件,这是由合作博弈的本质特点决定的。也就是说,联盟内部成员之问的信息是可以互相交换的,所达成的协议必须强制执行。这些与非合作的策略型博弈中的每个局中人独立决策、没有义务去执行某种共同协议等特点形成了鲜明的对比。因此可以说:形成合作博弈的原因是在某种制度约束下的集体理性战胜了个人理性。 3、解释下列概念:纯策略、混合策略、策略组合、纳什均衡、贝叶斯均衡、反应函数 在完全信息博弈中,如果在每个给定信息下,只能选择一种特定策略,这个策略为纯策略。纯策略是混合策略的特例。 按照一定的概率,从一套“纯策略”中随机选取实际的对策,称为混合策略。混合策略是纯策略在空间上的概率分布,纯策略是混合策略的特例。 策略组合指参与者可能采取的所有行动方案的集合。策略集合必须有两个以上元素,否则,无所谓对策,只是独自决策。 所谓贝叶斯纳什均衡是指这样一组策略组合:在给定自己的特征和其他局中人特征的概率分布的情况下,每个局中人选择策略使自己的期望支付达到最大化,也就是说,没有人有积极性选择其他策略 反应函数,在无限策略的古诺博弈模型中,博弈方的策略有无限多种,因此各个博弈方的最佳对策也有无限种,它们之间往往构成一种连续函数的关系,把这个连续函数称为反应函数。4、解释下列概念:博弈、静态博弈和动态博弈、完全信息博弈和不完全信息博 弈、完美信息动态博弈和不完美信息动态博弈 博弈是指在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与人依靠所掌握的信息,选择各自策略(行动),以实现利益最大化和风险成本最小化的过程。简单说就是人与人之间为了谋取利益而竞争。 静态博弈是指博弈中参与者同时采取行动,或者尽管参与者行动的采取有先后顺序,但后行动的人不知道先采取行动的人采取的是什么行动。 动态博弈是指参与人的行动有先后顺序,而且行动在后者可以观察到行动在先者的选择,并据此作出相应的选择。 完全信息博弈:是指每一参与者都拥有所有其他参与者的特征、策略集及得益函数等方面的准确信息的博弈。 不完全信息博弈,也称贝叶斯博弈,是指对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的信息,在这种情况下进行的博弈就是不完全信息博弈。博弈参与者对于对手的收益函数没有完全信息。 完全信息动态博弈,是指博弈中信息是完全的,即双方都掌握参与者对他参与人的战略空间和战略组合下的支付函数有完全的了解,但行动是有先后顺序的,后动者可以观察到前者的行动,了解前者行动的所有信息,而且一般都会持续一个较长时期。 不完美信息动态博弈,在动态博弈中,在不完全信息条件下,至少有一个局中人对其他某些局中人的收益不清楚。由于行动有先后顺序,后行动者可以通过观察先行动者的行为,获得有关先行动者的信息,从而证实或修正自己对先行动者的行动。 6、在公司制企业中,股东、经理、债券人、顾客、供货商等都被称为利益相关者。试分析不同

相关主题