搜档网
当前位置:搜档网 › 博弈论习题及参考答案

博弈论习题及参考答案

博弈论习题及参考答案
博弈论习题及参考答案

《博弈论》习题

一、单项选择题1.博弈论中,局中人从一个博弈中得到的结果常被称为()。

A. 效用

B. 支付

C. 决策

D. 利润

2.博弈中通常包括下面的内容,除了()。

A.局中人

B.占优战略均衡

C.策略

D.支付

3.在具有占优战略均衡的囚徒困境博弈中()。

A.只有一个囚徒会坦白

B.两个囚徒都没有坦白

C.两个囚徒都会坦白

D.任何坦白都被法庭否决了

4.在多次重复的双头博弈中,每一个博弈者努力()。

A.使行业的总利润达到最大

B.使另一个博弈者的利润最小

C.使其市场份额最大

D.使其利润最大

5.一个博弈中,直接决定局中人支付的因素是()。

A. 策略组合

B. 策略

C. 信息

D. 行动

6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时的博弈具有()。

A.囚徒困境式的均衡

B.一报还一报的均衡

C.占优策略均衡

D.激发战略均衡

7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的策略称为()。

A.一报还一报的策略

B.激发策略

C.双头策略

D.主导企业策略

8.在囚徒困境的博弈中,合作策略会导致()。

博弈双方都失败 B.博弈双方都获胜A.

C.使得先采取行动者获胜

D.使得后采取行动者获胜

9.在什么时候,囚徒困境式博弈均衡最可能实现()。

A. 当一个垄断竞争行业是由一个主导企业控制时

B.当一个寡头行业面对的是重复博弈时

C.当一个垄断行业被迫重复地与一个寡头行业博弈时

D. 当一个寡头行业进行一次博弈时

10.一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种策略是一种()。

A.主导策略

B.激发策略

C.一报还一报策略

D.主导策略

11.关于策略式博弈,正确的说法是()。

A. 策略式博弈无法刻划动态博弈

B. 策略式博弈无法表明行动顺序

C. 策略式博弈更容易求解

D. 策略式博弈就是一个支付矩阵

12.下列关于策略的叙述哪个是错误的():

A. 策略是局中人选择的一套行动计划;

B. 参与博弈的每一个局中人都有若干个策略;

C. 一个局中人在原博弈中的策略和在子博弈中的策略是相同的;

D. 策略与行动是两个不同的概念,策略是行动的规则,而不是行动本身。

13. 囚徒困境说明():

A. 双方都独立依照自己的利益行事,则双方不能得到最好的结果;

B. 如果没有某种约束,局中人也可在(抵赖,抵赖)的基础上达到均衡;

C. 双方都依照自己的利益行事,结果一方赢,一方输;

D、每个局中人在做决策时,不需考虑对手的反应

14. 一个博弈中,直接决定局中人损益的因素是():

A. 策略组合

B. 策略

C. 信息

D. 行动

15. 动态博弈参与者在关于博弈过程的信息方面是()

A 不对称的

B 对称的

无序的 D 不确定的C

16. 古诺模型体现了寡头企业的( )决策模型。

A 成本

B 价格

C 产量

D 质量

17.伯特兰德模型体现了寡头企业()决策模型。

A 成本

B 价格

C 产量

D 质量

18. 用囚徒困境来说明两个寡头企业的情况,说明了:()

A、每个企业在做决策时,不需考虑竞争对手的反应

B、一个企业制定的价格对其它企业没有影响

C、企业为了避免最差的结果,将不能得到更好的结果

D、一个企业制定的产量对其它企业的产量没有影响

19. 子博弈精炼纳什均衡():

A. 是一个一般意义上的纳什均衡;

B. 和纳什均衡没有什么关系;

C. 要求某一策略组合在每一个子博弈上都构成一个纳什均衡;

D. 要求某一策略组合在原博弈上都构成一个纳什均衡。

20. 在一般产品销售市场上,以下哪种原因导致了逆向选择。 ( )

A 产品质量的不确定性

B 私人信息

C 公共信息

D 产品价格

21. 完全信息动态博弈参与者的行动是( )

A 无序的

B 有先后顺序的

C 不确定的

D 因环境改变的

22. 市场交易中普遍存在的讨价还价属于哪种博弈。()

A 完全信息静态博弈

B 完全信息动态博弈

C 不完全信息静态博弈 D不完全信息动态博弈

23.下面哪种模型是一种动态的寡头市场博弈模型()

A 古诺模型

B 伯川德模型

C 斯塔克尔伯格模型 D田忌齐威王赛马

24.博弈方根据一组选定的概率,在两种或两种以上可能行为中随机选择的策略为()

混合策略 B 纯策略A

C 激发策略 D一报还一报策略

25.影响重复博弈均衡结果的主要因素是()

A 博弈重复的次数

B 信息的完备性

C 支付的大小

D A和B

26.在动态博弈战略行动中,只有当局中人从实施某一威胁所能获得的总收益()不实施该威胁所获得的总收益时,该威胁才是可信的。

A 大于

B 等于

C 小于

D 以上都有可能

二、判断正误并简要说明理由

1. 纳什均衡一定是上策均衡,上策均衡一定是纳什均衡。

2.在一个博弈中博弈方可以有很多个。

3. 在一个博弈中只可能存在一个纳什均衡。

4. 因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。

5. 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。

6.由于两个罪犯只打算犯罪一次,所以被捕后才出现了不合作的问题即囚徒困境。但如果他们打算重复合伙多次,比如说20次,那么对策论预测他们将采取彼此合作的态度,即谁都不招供。

7. 在博弈中纳什均衡是博弈双方能获得的最好结果。

8. 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。

9. 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。

10. 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。

11. 斯塔克博格产量领导者所获得的利润的下限是古诺均衡下它得到的利润。

12.在有限次重复博弈中,存在最后一次重复正是破坏重复博弈中局中人利益和行为的相互制约关系,使重复博弈无法实现更高效率均衡的关键问题。

13. 子博弈精炼纳什均衡不是一个纳什均衡。

14. 零和博弈的无限次重复博弈中,可能发生合作,局中人不一定会一直重复原博弈的混合战略纳什均衡。.

15.原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合,符合各局中人最大利益:采用原博弈的纯战略纳什均衡本身是各局中人能实现的最好结果,符合所有局中人的利益,因此,不管是重复有限次还是无限次,不会和一次性博弈有区别。

16.在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。

三、计算与分析题

1、A、B两企业利用广告进行竞争。若A、B两企业都做广告,在未来销售中,A企业可以获得20万元利润,B企业可获得8万元利润;若A企业做广告,B 企业不做广告,A企业可获得25万元利润,B企业可获得2万元利润;若A企业不做广告,B企业做广告,A企业可获得10万元利润,B企业可获得12万元利润;若A、B两企业都不做广告,A企业可获得30万元利润,B企业可获得6万元利润。

(1)画出A、B两企业的损益矩阵。

(2)求纯策略纳什均衡。

2、可口可乐与百事可乐(参与者)的价格决策:双方都可以保持价格不变或者提高价格(策略);博弈的目标和得失情况体现为利润的多少(收益);利润的大小取决于双方的策略组合(收益函数);博弈有四种策略组合,其结局是:

(1)双方都不涨价,各得利润10单位;

(2)可口可乐不涨价,百事可乐涨价,可口可乐利润100,百事可乐利润-30;

(3)可口可乐涨价,百事可乐不涨价,可口可乐利润-20,百事可乐利润30;

(4)双方都涨价,可口可乐利润140,百事可乐利润35;

画出两企业的损益矩阵求纳什均衡。

3、假定某博弈的报酬矩阵如下:

左右

c,d a,b 甲上

g,h

e,f

下(1)如果(上,左)是上策均衡,那么,a>?, b>?, g?

如果(上,左)是纳什均衡,上述哪几个不等式必须满足?(2).

4、北方航空公司和新华航空公司分享了从北京到南方冬天度假胜地的市场。如果它们合作,各获得500000元的垄断利润,但不受限制的竞争会使每一方的利润降至60000元。如果一方在价格决策方面选择合作而另一方却选择降低价格,则合作的厂商获利将为零,竞争厂商将获利900000元。

(1)将这一市场用囚徒困境的博弈加以表示。

(2)解释为什么均衡结果可能是两家公司都选择竞争性策略。

5、博弈的收益矩阵如下表:

左右

d

,cb

,a上

甲h

,f

e,g下之间必然满足哪些g、hea(1)如果(上,左)是占优策略均衡,则、b、c、d、、f、关系?(尽量把所有必要的关系式都写出来) 1)中的关系式哪些必须满足?(2)如果(上,左)是纳什均衡,则()如果(上,左)是上策均衡,那么它是否必定是纳什均衡?为什么?(3 )在什么情况下,纯策略纳什均衡不存在?(4、猪圈里有一头大猪和一头小猪,猪圈的一头有一个饲料槽,另一头装有控制饲料供应的6个单位的成本。谁去按按钮。按一下按钮就会有10个单位饲料进槽,但谁按谁就要付出2个单位,小猪吃到一个单位;若9按纽则谁后到;都去按则同时到。若大猪先到,大猪吃到个单4个单位;若小猪先到,大猪吃六个单位,小猪吃同时到,大猪吃7个单位,小猪吃3 )各种情况组合扣除成本后的支付矩阵位。求(1 2()求纳什均衡。(单位:各自选择是生产高价啤酒还是低价啤酒,相应的利润、7设啤酒市场上有两家厂商,万元)由下图的得益矩阵给出:

乙低价高价

50

,50800

,低价100 甲600

,900 高价-30

,-20 )有哪些结果是纳什均衡?1(.

(2)两厂商合作的结果是什么?

8、求出下列博弈的所有纯策略纳什均衡。

局中2

0,33,23,4局中1

A2,3

1,25,24,4B0,1

10,23,14,11,4C

10,1

4,1

3,1

-1,2

D

9、求出下面博弈的纳什均衡(含纯策略和混合策略)。

L

R

0,8

U

5,0

甲4,5

D

2,6

10、根据两人博弈的损益矩阵回答问题:

乙右左0,0 上 2,3

甲0,0

下 4,2

)写出两人各自的全部策略。(1 (2)找出该博弈的全部纯策略纳什均衡。(3)求出该博弈的混合策略纳什均衡。市场需求函倍, 11、某寡头垄断市场上有两个厂商,总成本均为自身产量的20 Q=200-P。数为)若两个厂商同时决定产量,产量分别是多少?求:(1 (2)若两个厂商达成协议垄断市场,共同安排产量,则各自的利润情况如何?(3)用该案例解释囚徒困境。Q20C?QC2?2,市场需求曲线为、假设双头垄断企业的成本函数分别为:,122211P?400?2QQ?Q?Q。,其中,21)均衡情况下的产量、价格和利润,求出各自的反应函数,并Cournot)求出古诺(1(

图示均衡点。

(2)求出斯塔克博格(Stackelberg)均衡情况下的产量、价格和利润。

(3)说明导致上述两种均衡结果差异的原因。

13.下面的得益矩阵两博弈方之间的一个静态博弈,该博弈有没有纯策略的纳什均衡,博弈的结果是什么?

接受则按哥弟弟可以接受或拒绝,14. 两个兄弟分一块冰激凌。哥哥先提出一个分割比例,对弟了,但这时候冰激凌已化得只剩1/2哥的提议分割,若拒绝就自己提出一个比例。若拒绝冰激凌会全若接受则按弟弟的建议分割,弟提议的比例哥哥也可以接受或拒绝,因此我们假设接受和拒绝利益相同时因为兄弟之间不应该做损人不利己的是,部化光。兄弟俩都会接受。求该博弈的子博弈完美纳什均衡。,如果学生只复习一部分重点,则有如果学生在考试之前全面复习,考好的概率为90%15.小时。重点复习之需要花费t2=20 的概率考好。全面复习花费的时间t1=100 小时,50%为努力e和Wl,是考试成绩,有高低两种分数学生的效用函数为:U=W-2e,其中WWh 学习的时间。问老师如何才能促使学生全面复习?如果没试用划线法分析该博弈有无纯策略纳什均衡;.在下列监工与工人之间的博弈中,16 有,那么写出混合策略纳什均衡的结果。

监工监督不监督

-1-1 ,2 工人,1 偷懒 2

,23

,-2 不偷懒

17.求解下列博弈的纳什均衡。

博弈2

321博弈1

14616

9

18.某人正在打一场官司,不请律师肯定会输,请律师后的结果与律师的努力程度有关。假设当律师努力工作(100小时)时有50%的概率能赢,律师不努力工作(10小时)则只有15%的概率能赢。如果诉讼获胜可得到250万元赔偿,失败则没有赔偿。因为委托方无法监督律师的工作,

因此双方约定根据结果付费,赢官司律师可获赔偿金额的10%,m e.005.m 是报酬,,失败则律师一分钱也得不到。如果律师的效用函数为其中e是努力小时数,且律师有机会成本5万元。求这个博弈的均衡。

四、论述题

1、解释“囚犯困境”,并举商业案例说明。

2、用“小偷与守卫的博弈”说明“激励(监管)悖论”。

《博弈论》习题参考答案一、单项选择题

1~5 B. B. C. D. A. 6~10 C. A. A. D. C.

11~15. B. C. A. A. C. 16~20 C. B. C. C. B.

21~26. B. B. C. B. D. A.

二、判断正误并简要说明理由

1、F 上策均衡是比纳什均衡更严格的均衡。所以上策均衡一定是纳什均衡,而纳什均衡不一定是上策均衡,

2、T 博弈类型按局中人数多少分为单人博弈、双人博弈和多人博弈

3.F 博弈双方偏好存在差异的条件下,一个博弈模型中可能存在多个纳什均衡,如性别战。

4.T 零和博弈指参与博弈各方在严格竞争下,一方收益等于另一方损失,博弈各方收益与损失之和恒为零,所以双方不存在合作可能性

5.T 上策均衡是通过严格下策消去法(重复剔除下策)所得到的占优策略,只能有一个纳什均衡

6.F 只要两囚犯只打算合作有限次,其最优策略均为招供。比如最后一次合谋,两小偷被抓

住了,因为将来没有合作机会了,最优策略均为招供。回退到倒数第二次,既然已经知道下次不会合作,这次为什么要合作呢。依此类推,对于有限次内的任何一次,两小偷均不可能合作。7.F 纳什均衡是上策的集合,指在给定的别人策略情况下,博弈方总是选择利益相对较大的

策略,并不保证结果是最好的。

8.F 局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标

9.T 纳什均衡是上策的集合,指在给定的别人策略情况下,没有人会改变自己的策略而减低

自己的收益

10.F 局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标

11.T 虽然斯塔格伯格模型各方利润总和小于古诺模型,但是领导者的利润比古诺模型时高.

12. .T无限次重复博弈没有结束重复的确定时间;而在有限次重复博弈中,存在最后一次重复,并且正是有结束重复的确定时间,使重复博弈无法实现更高效率均衡。

13. F 子博弈精炼纳什均衡一定是一个纳什均衡。

14.F零和博弈的无限次重复博弈中,所有阶段都不可能发生合作,局中人会一直重复原博弈的

混合战略纳什均衡。

15.T 原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合,因此不管是重复有限次还是无限次,不会和一次性博弈有区别。

16.F 动态博弈是指各博弈方的选择和行动又先后次序的博弈。动态博弈的信息可以是不对称的。

所以策略分为先发制人和。斯塔克伯格博弈揭示“先发制人”更有利,而“后发制人”-----后行动的博弈方可以先观察对方行为后再选择行为反而处于不利境地。

三、计算与分析题

1、(1)

B

做广告不做广告

A做广告20,8 25,2

做广告 10,12

6

30,不(2)纯策略纳什均衡为(做广告,做广告),(做广告,做广告)。不不2、

百事可乐

不涨价涨价

可口可乐不涨价10,-30 100,10

涨价 -20,30

35

,140

纳什均衡(不涨价,不涨价),(涨价,涨价)。从帕累托均衡角度,为(涨价,涨价)

3、 (1)如果(上,左)是上策均衡,那么,a>e b>d, gh

(2)如果(上,左)是纳什均衡,a>e b>d,不等式必须满足

4、

新华航

合竞

0,90北方航合50,50

90,0

竞6,6

5、略

6、

小猪

等按

4

,4按 1

,5 大猪0

0,等 9,-1

纳什均衡为(按,等)。、略7 B8、纯策略纳什均衡(,甲),(A,丙) 9、乙

R L

甲0,8 5,0 U

4,5

2,6

D

)不存在纯策略纳什均衡(11-P1 P1”的概率为,则选择“”的概率为DU(2)设甲选择“1-P2 RP2L乙选择“”的概率为,则选择“”的概率为,使乙选择“左”和“右”的期对甲而言,最佳策略是按一定的概率选“上”和“下”望值相等P1*8+(1-P1)*0= P1*1+(1-P1)*5 即P1=5/12 解得

均衡Nash概率选“下”为甲的混合策略、概率选“上”5/125/12,7/12即()按7/12,使乙选

择“上”和“下”的期对乙而言,最佳策略是按一定的概率选“左”和“右”望值相等P2*5+(1-P2)*0= P2*2+(1-P2)*4

即.

解得P2=4/7

即(4/7,3/7)按4/7概率选“左”、3/7概率选“右”为乙的混合策略Nash均衡

10、略。

11、见笔记

12、见笔记。

13.

首先,运用严格下策反复消去法的思想,不难发现在博弈方1的策略中,B是相对于T的严格下策。把博弈方1的B策略消去后又可以发现,博弈方2的策略中C是相对于R的严格下策,从而也可以消去。

博弈,已经不存在任何严2两个博弈方各消去一个策略后的博弈是如下的两人2×,M2博弈有两个纯策略纳什均衡(2格下策。再运用划线或箭头法,很容易发现这个×)。TL)和(,R

由于两个纯策略纳什均衡之间没有帕累托效率意义上的优劣关系,一次性静态博弈由于双方在该博弈中可能采取混合策略,因此实际上该博弈的结果可的结果不能肯定。以是4个纯策略组合中的任何一个。14.

是哥,:是自己的份额,弟的方案是,其中:假设哥的方案是S11-S1S1S21-S2S2 的份额,那么可用如下的扩展形表示该博弈:

由于只要接受的利益不少于不接受的运用逆推归纳法先分析最后一阶段哥的选择。,哥就会≥

S20S2/2≥0,也就是利益哥就会接受,因此在这个阶段只要弟的方案满足接受,否则不会接受。由于冰激凌的份额不可能是负数,也就是说因为哥不接受弟的方案冰激凌会全部化掉,因此任何方案哥都会接受。由于弟知道后一阶段哥的选择方法,因此知道如果不现在回到前一阶段弟的选择。如1/2块冰激凌;S2=0,独享此时还未化掉的接受前一阶段哥提出的比例,自己可以取,1/2S1≤,,显然只要1-S1≥1/2即果选择接受前一阶段哥的提议,那么自己将得到1-S1 弟就会接受哥的提议。再回到第一阶段哥的选择。哥清楚后两个阶段双方的选择逻辑和结果,因此他在超过这个份额将什么,正是能够被弟接受的自己的最大限度份额,这一阶段选择S1=1/2 S1=1/2是最佳选择。都不能得到,因此分割,弟(1/2,1/2)综上,该博弈的子博弈完美纳什均衡是:哥哥开始时就提议按弟接受。本题中老师的调控手段高分和低分的差距。该博弈的扩展形如下:15.

+ 0.1 (Wl-200 ) (Wh-200)U1=0.9学生选择全面复习的期望得益是+ 0.5(Wl-40 )

)Wh-40(U2=0.5重点复习的期望得益是

只有当U1》U2时学生才会选择全面复习。根据U1》U2我们可以算出Wh- Wl》400。这就是老师能有效全面复习需要满足的条件。其实在奖学金与成绩挂钩时,Wh- Wl也可以理解成不同等奖学金的差额。

16.没有纯策略均衡,只有混合策略均衡((0.25,0.75),(0.5,0.5))

17.可以根据画线法求得有唯一纯策略均衡(上,左)

18.参见第15题

四、论述题

1、解释“囚犯困境”,并举商业案例说明。

(1)假设条件举例:两囚徒被指控是一宗罪案的同案犯。他们被分别关在不同的牢房无法互通信息。各囚徒都被要求坦白罪行。如果两囚徒都坦白,各将被判入狱5年;如果两人都不坦白,两囚徒可以期望被从轻发落入狱2年;如果一个囚徒坦白而另一个囚徒不坦白,坦白的这个囚徒就只需入狱1年,而不坦白的囚徒将被判入狱10年。

(2)囚徒困境的策略矩阵表。每个囚徒都有两种策略:坦白或不坦白。表中的数字分别代表囚徒甲和乙的得益。

囚徒乙

坦白不坦白

-1,-5坦白,-5

-10 囚徒甲

-2,-2

不坦白-10,-1

(3)分析:通过划线法可知:在囚徒困境这个模型中,纳什均衡就是双方都“坦白”。给定甲坦白的情况下,乙的最优策略是坦白;给定乙坦白的情况下,甲的最优策略也是坦白。这里双方都坦白不仅是纳什均衡,而且是一个上策均衡,即不论对方如何选择,个人的最优选择是坦白。其结果是双方都坦白。

(4)商业案例:寡头垄断厂商经常发现它们自己处于一种囚徒的困境。当寡头厂商选择产量时,如果寡头厂商们联合起来形成卡特尔,选择垄断利润最大化产量,每个厂商都可以得到更多的利润。但卡特尔协定不是一个纳什均衡,因为给定双方遵守协议的情况下,每个厂商都想增加生产,结果是每个厂商都只得到纳什均衡产量的利润,它远小于卡特尔产量下的利润。

2、用“小偷与守卫的博弈”说明“激励(监管)悖论”。

(1)假设条件举例:偷窃和防止偷窃是小偷和门卫之间进行博弈的一场游戏。门卫可以不睡觉,或者睡觉。小偷可以采取偷、不偷两种策略。如果小偷知道门卫睡觉,他的最佳选择就是偷;如果门卫不睡觉,他最好还是不偷。对于门卫,如果他知道小偷想偷,他的最佳选择是不睡觉,如果小偷采取不偷,自己最好去睡觉。

(2)小偷与门卫的支付矩阵表(假定小偷在门卫睡觉时一定偷成功,在门卫不睡觉时偷一定会被抓住):

门卫

睡觉不睡觉

-2, 0

-1 偷1,小偷

0, 2 0, 0

不偷(3)分析:通过划线法可知:这个博弈是没有纳什均衡的。门卫不睡觉,小偷不偷,双方都没有收益也没有损失;门卫不睡觉,小偷偷,门卫因为是本职工作得不到奖励,小偷被判刑丧失效用2单位;门卫睡觉,小偷不偷,门卫睡觉的很愉快得到效用2单位,小偷没有收益也没有损失;门卫睡觉,小偷偷,门卫因失职被处分而丧失效用1单位,小偷偷窃成功获得效用1单位。(4)“激励(监管)悖论”说明:现实中,我们看到,当门卫不睡觉时,偷窃分子便收敛一阵;严打的时期一过,偷窃分子又开始兴风作浪,在不能容忍小偷过分猖狂的时候,门卫不得不再次开始认真。即偷的小偷越多,那么不睡觉的门卫将会越多,偷的小偷越少,不睡觉的门卫将越少;反过来,不睡觉的门卫越多,偷的小偷就越少,不睡觉的门卫越少,偷的小偷就越多。如果偷窃集团倾巢出动,那么门卫的选择也是全部不睡觉,但门卫一旦全部不睡觉,小偷最好选择全部不偷,小偷一旦选择全部不偷,门卫最好全部选择睡觉。

(5)结论:加重对小偷的处罚在长期中并不能抑制偷窃(而只能使门卫偷懒);加重处罚失职门卫恰恰是会降低偷窃发生的概率。这种门卫和小偷的博弈所揭示的,政策目标和政策结果之间的这种意外关系,常被称为“激励的悖论”。

博弈论考试题目

博弈论考试题 一、名词解释(20分) 1.纳什均衡 2.子博弈完美均衡 3.重复博弈 4.贝叶斯博弈 二、简答题(30分) 1.按照信息和顺序,博弈有哪些分类?且对应的均衡概念分别是什 么? 2.在完全信息静态博弈中,求纳什均衡的方法有几种,分别是什么? 3.对于重复博弈,合作解可能在哪些情况下产生? 三、分析题(25分,每小题5分) 假设公安局抓住了两个合伙犯罪的嫌疑犯,但获得的证据并不十分确切,对于两者的量刑就取决于两者对于犯罪事实的供认。这两名犯罪嫌疑人在公安局是分别关押以防他们串供。两名犯罪嫌疑人都知道,如果他们都交代犯罪事实,则可能将各被判5年;如果他们都不交代,则有可能会被较轻的妨碍公务罪各判2年;如果一人交代,另一人不交代,交代者会被立即释放,不交代者被判8年。回答以下问题:(1)请写出这两名犯罪嫌疑人博弈的支付矩阵。 (2)假设这两名犯罪嫌疑人都是自私且不讲江湖道义的人,同时被审问且不能够相互沟通串供。请给出该博弈的纳什均衡。(3)说明这两个囚徒的困境在哪里?

(4)利用囚徒困境博弈对下面现象进行解释:电信市场上移动和联通的价格战。 (5)请指出一种走出囚徒困境的办法。 四、计算题(25分) 企业甲和企业乙都是家电制造商,他们都可以选择生产高端或是低端产品,两企业在不同选择下的利润如以下得益矩阵所示。假设企业甲先于企业乙进行产品选择并投入生产,企业乙在决定生产时已经知道企业甲的选择,而且这一点大家都知道。 (1)请写出该博弈的扩展式; (2)该博弈的子博弈完美均衡是什么? 企业2 高端低端 高端 企业1 低端 答题要求: 1.必须手写; 2.稿纸单面书写; 3.下周三上午统一交。

浙大博弈论考试题目

博弈论考试 1、完全信息静态博弈 1“老师点名和学生逃课”的案例 构建如下模型:老师 点名不点名 学生逃课a1,b1 a2,b2 不逃课a3,b3 a4,b4 结果:(1)老师每次点名,学生每次不逃课 a3> a1 ,b3> b4 ,a2< a4 ,b2< b1 (2)老师每次不点名,学生每次不逃课 a4> a2 , b4> b3 , a1< a3 , b1< b2 (3)老师有时候点名,学生有时候逃课 a1< a3 , a2> a4 , b1> b2 , b3< b4 (4)老师每次不点名,学生每次逃课 a2> a4 , b2> b1 , a3< a1 , b3< b4 2市场占有者和想进入市场者 构建模型:占有者 默认斗争 进入者进入(40,50)(-10,0) 不进入(0,300)(0,300) 没有占优战略均衡,也没有重复剔除的占优均衡。 结果:(1)占有者默认,进入者进入时,占有者会损失部分利益 (2)占有者斗争,进入者进入,则占有者利益变0,而进入者为负,两败俱伤,因而占有者“斗争”是弱劣战略。 (3)占优者默认,进入者不进入,则占有者获得全部市场 (4)(斗争,不进入时,占有者仍获得全部市场。 综上存在两个纳什均衡,(进入,默认)和(不进入,斗争) 3应试教育和素质教育学生 应试教育素质教育 学校应试教育(0,0)(0,-1) 素质教育(-1,0)(1,1) (1)假设学校和学生都采取应试教育为(0,0),那么若他们都转向素质教育达到最优结局(1,1),(2)但如果单方面采取素质教育,另一方为应试教育,其支付就变为-1,比如如果学校重视应试成绩,而学生重视素质教育,学生单方面受损,为-1 (3)若学校注重素质教育,而学生只注重成绩,学校的策略难以推行,支付为-1. 此博弈中存在两个纳什均衡,即(应试,应试)和(素质,素质),虽然(素质,素质)是最优纳什均衡,但一方采取素质教育存在风险:另一方为应试时,支付变为-1;若采取应试没有变为-1的风险,那么最终结局为(应试,应试)。4两个人合作开发一项产品假设项目开发成功每人收益为4,失败时收益为 0,偷懒者的机会成本为1

博弈论复习题及答案

囚徒困境说明个人的理性选择不一定是集体的理性选择。(√) 子博弈精炼纳什均衡不是一个纳什均衡。(×) 若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。()博弈中知道越多的一方越有利。(×) 纳什均衡一定是上策均衡。(×) 上策均衡一定是纳什均衡。(√) 在一个博弈中只可能存在一个纳什均衡。(×) 在一个博弈中博弈方可以有很多个。(√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。(√) 在博弈中纳什均衡是博弈双方能获得的最好结果。(×) 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(×)上策均衡是帕累托最优的均衡。(×) 因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。 (×) 在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×) 在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(√)不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√) 多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(√) 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t

《经济博弈论》期末考试复习

《经济博弈论》期末考试复习资料 第一章导论 1.博弈的概念: 博弈即一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,并从中各自取得相应结果的过程。它包括四个要素:参与者,策略,次序和得益。 2.一个博弈的构成要素: 博弈模型有下列要素:(1)博弈方。即博弈中决策并承但结果的参与者.包括个人或组织等:(2)策略。即博弈方决策、选择的内容,包括行为取舍、经济活动水平或多种行为的特定组合等。各博弈方的策略选择范围称策略空间。每个博弈方各选一个策略构成一个策略组合。(3)进行博弈的次序:次序不同一般就是不同的博弈,即使博弈的其他方面都相同。(4)得益。各策略组合对应的各博弈方获得的数值结果,可以是经济利益,也可以是非经济利益折算的效用等。 3.合作博弈和非合作博弈的区别: 合作博弈:允许存在有约束力协议的博弈;非合作博弈:不允许存在有约束力协议的博弈。主要区别:人们的行为互相作用时,当事人能否达成一个具有约束力的协议。 假设博弈方是两个寡头企业,如果他们之间达成一个协议,联合最大化垄断利润,并且各自按这个协议生产,就是合作博弈。 如果达不成协议,或不遵守协议,每个企业都只选择自己的最优产品(价格),则是非合作博弈。 合作博弈:团体理性(效率高,公正,公平) 非合作博弈:个人理性,个人最优决策(可能有效率,可能无效率) 4.完全理性和有限理性: 完全理性:有完美的分析判断能力和不会犯选择行为的错误。 有限理性:博弈方的判断选择能力有缺陷。 区分两者的重要性在于如果决策者是有限理性的,那么他们的策略行为和博弈结果通常与在博弈方有完全理想假设的基础上的预测有很大差距,以完全理性为基础的博弈分析可能会失效。所以不能简单地假设各博弈方都完全理性。 5.个体理性和集体理性: 个体理性:以个体利益最大为目标;集体理性:追求集体利益最大化。 第一章课后题:2、4、5 2.设定一个博弈模型必须确定哪几个方面? 设定一个博弈必须确定的方面包括:(1)博弈方,即博弈中进行决策并承担结果的参与者;(2)策略(空间),即博弈方选择的内容,可以是方向、取舍选择,也可以是连续的数量水平等;(3)得益或得益函数,即博弈方行为、策略选择的相应后果、结果,必须是数量或者能够折算成数量;(4)博弈次序,即博弈方行为、选择的先后次序或者重复次数等;(5)信息结构,即博弈方相互对其他博弈方行为或最终利益

博弈论考试试题

博弈论考试试题 你有三个小时考试时间。回答所有问题。考试内容比较多,我在认为最难的问题旁边标注了星号,如果你担心不够时间,可以把这些带星号的问题留到最后才做。 1.(55分钟—36分)简略回答下面每个子问题。请写出你的计算过程,并在你不能给出正式结论时,提供大概的解释,那样我可以给你部分分数。 (a)尽可能给出正式的说明,指出一个观察到的行为是无穷连续的多级博弈意味什么?给出一个不是无穷连续博弈的例子。 (b)尽可能给出正式的说明,指出一个一般性支持的性质意味着什么?在课上我们看到什么理论关于一般性支持的性质? (c)课堂上,在说明带有可观察行为的有限扩展型博弈和无限期多级博弈时,我不同地详细讲述了支付函数。支付函数范畴是如何不同?为什么我做出这个改变? (d)在扩展型博弈中给出一个策略的正式定义。 (e)给出一个博弈的例子,其中一个看起来不合理的结果在一个子博弈完美均衡里变成可能。(f)下面显示的扩展型博弈里,博弈者1有多少个纯策略?写出正常形式的支付矩阵。这个博弈有多少子博弈? (g)找出下面博弈中全部的纳什均衡。

(h )找出二阶段博弈的子博弈完美均衡,博弈者在成本a/16处选择a ,于是博弈者1和2同时行动进行博弈,如下面所示。 (i )找出同时行动博弈中的纳什均衡,其中博弈者1选择1a ∈?,博弈者2选择2a ∈?,支付是,

考虑如下的关于信任的博弈,这在很多试验中都做过。试验者从给博弈者1$10和给博弈者2$0开始。然后试验者问博弈者1愿意将多少美元给博弈者2来帮助他。如果他选择给x美元给试验者,则试验者给博弈者2 *3x。随后,博弈者2有机会将一些或全部(或没有)他获得的钱给博弈者1。 (a)假定这两个博弈者都是风险中性的,仅关心他们自己的支付,找出这个博弈的子博弈完美均衡。(顺便说明,子博弈完美均衡不像在试验中出现。通常博弈者1给出一些,但不会把全部的钱给回试验者) (b) 这个博弈有博弈者获得更高支付的纳什均衡吗? (c)假定我们修改了博弈,以致在上述的两阶段后,博弈者1有机会打博弈者2。假定这将减少博弈者1的效用1美元,减少博弈者2的效用5美元。这将改变你们在(a)和(b)中的答案吗?如果我们在第二阶段后有如下显示的博弈会怎么样呢?作个你认为合理的预测。 (d*)对这个试验结果的另一个解释是,博弈者可以是无私心的。说明无私心的最简单表达——每个博弈者最大化他自己的美元支付和其他博弈者美元支付的权重和——除了权重上一个特别(非强迫)的选择,不能解释试验规则性。你能想出可能被用来说明试验结果的效用函数吗?

博弈论练习题2答案

博弈论练习题2答案

111111111111111111 博弈论练习题(四) 一、什么是子博弈精炼纳什均衡? 答:将纳什均衡中包含的不可置信的威胁策略剔除出去。它要求参与者的决策在任何时点上都是最优的。由于剔除了不可置信的威胁,在许多情况下,精炼纳什均衡也就缩小了纳什均衡的个数。只有当参与人的策略在每一个子博弈中都构成纳什均衡叫做精炼纳什均衡。或者说,组成精炼纳什均衡的策略必须在每一个子博弈中都是最优的。 二、参与人的理性问题对动态博弈分析的影响是否比静态博弈的影响更大?为什么? 答:正确,博弈论要求个体具有始终追求自身利益最大化的理性意识和理性能力的“自我”个体理性,这是静态博弈的范畴。除此之外,还要求相关的参与者具有层次较高的“交互理性”,要求不同个体之间在理性和行为方面具有一种“默契”。即,人们的自身利益的最大化不仅取决于自己的选择,还取决于与之相关的其他人的选择与行为,那么为了实现自己的最大利益,个体的理性决策就必须考虑他人的理性选择与行为。作

为博弈论的基础,交互理性是其基本的理性要求。博弈论还要求有关博弈的结构、各个博弈参与者的得益函数以及各个博弈参与者的理性等“知识”是所有博弈参与者之间的“共同知识”。也就是,每个博弈参与者不仅要首先明确自己和其他参与者所有可选的策略,还需知晓各种情况下自己最终的收益或其概率分布,并且每个博弈参与者都知道各个参与者掌握这些信息;更为重要的是,每个博弈参与者都知道所有参与者都是理性的,都知道其他博弈参与者知道所有参与者都是理性的,都知道其他博弈参与者知道其他博弈参与者知道所有博弈参与者都是理性的------。理性的共同知识假设是非合作博弈理论的一个非常重要和关键的假设,是实现交互理性和理性主义的纳什均衡的基本前提,这些,都是动态博弈的范畴。因此说,参与者理性问题对动态博弈的分析影响更大。 三、纳什均衡和精炼纳什均衡存在哪些问题?答:纳什均衡存在的问题: (1)不是所有博弈都存在纳什均衡如纯策略就不存在混合策略则一定会存在纳什均衡,它是通

博弈论考题与答案

一、假设市场上有三个垄断企业,企业无生产成本,问达到纳什均衡时的产量为多少?假设市场的价格和数量之间P=a—b*Q 解: 二、什么是纳什均衡,你是如何理解纳什均衡的? 答:纳什均衡指的是这样一种战略组合,这种战略组合由所有参与人的最优战略组成,也就是说,给定别人战略的情况下,没有任何单个参与人有积极性选择其他战略使自己获得更大利益,从而没有任何人有积极性打破这种均衡。当然,“纳什均衡”虽然是由单个人的最优战略组成,但并不意味着是一个总体最优的结果。如上述,在个人理性与集体理性的冲突的情况下,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。 三、构建一个博弈,说明如何杜绝学生考试作弊现象(参考高薪养廉博弈) 答: 四、给出该博弈的纳什均衡,并用消除劣势战略法,找出 (R1,C3)这个纳什均衡。 C1 C2 C3 R1 2,12 1,10 1,12 R2 0,12 0,10 0,11 R3 0,12 0,10 0,13 五、两个老朋友在一起喝酒,每个人有四个纯战略:杠子、老虎、鸡和虫子,输赢规则是:杠子降鸡,鸡吃虫子,虫子降杠子,两人同时出令。如果一个打败另一个,赢的效用为1,输的效用为-1,否则效用为0,写出这个博弈的支付矩阵,计算其混合战略纳什均衡。 答:设S为棒子T为老虎C为鸡W为虫子,则其支付矩阵为: 2 S T C W S 0,0 1,-1 0,0 -1,1 1 T -1,1 0,0 1,-1 0,0 C 0,0 -1,1 0,0 1,-1 W 1,-1 0,0 -1,1 0,0 设1、2出STCW的概率分别为P1P2P3P4和Q1Q2Q3Q4,则矩阵达到均衡时,2的期望收益必须满足:0*p1—1*p2+0*p3+1*p4=1*p1+0*p2—1*p3+0*p4=0*p1+1*p2+0*p3—1*p4= —1*p1+0*p2+1*p3+0*p4 整理为—p2+p4=p1—p3= —p1+p3 由于上式为对称的,所以,p1=p2=p3=p4,又p1+p2+p3+p4=1,可得p1=p2=p3=p4=0.25. 同理q1=q2=q3=q4=0.25 综上所述,混合战略的纳什均衡为:A1(0.25,0.25,0.25,0.25)A2(0.25,0.25,0.25,0.25) 六、5个海盗抢到了100颗宝石,每一颗大小和价值都一样他们决定这么分:抽签决定自己的号码(1、2、3、4、5)。首先,1号提出分配方案。然后大家5人进行表决,当超过半数的人同意时,按照他的提案进行分配,否则将被扔人大海喂鳌鱼。如果1号死后,再由2号提出分配方案,然后大家4人进行表决,当且仅当超过半数的人同意时,按照他的提案进行分配,否则将被扔人大海喂鳖鱼。以次类推。假定每个个强盗都是经济学假设的“理性人”,假定每个判决都能顺利执行。那么,如果你是第一个强盗,你该如何提出分配方案才能够使自己的收益最大化? 七、假设选民政治态度是成线性均匀分布的,说明为什么两党政治具有欺骗性,如果是三党政治情况如何,为什么? 答:政党和政治家争取选民情况实际上就和杂货铺定位博弈一样。工党一定要打出劳工代言人的旗帜,所以他是站在左边的,左边是他的地盘。但是只有左边一半的选民,还不足以保证胜出。为了在竞选中获胜,他要想办法把中间的在两党之间摇摆的选民争取过来。最好的办法,就是使自己的竞选纲领向“右”的方向靠过去一点,就是在竞选中宣布也要照顾中产阶级的利益。移过去一点,地盘就可能大一点。同样,原来立党之本是在“右”边的保守党,在竞选的过程中,也要往左边靠,争取更多的选民。这样斗法的结果,在漫长的竞选过程中,虽然两党的漫骂不断升级,但是实际纲领却不断靠近,直到两个政党在中点紧挨在一起,才是稳定的纳什均衡。 这个政党纲领向中点移动的机制,也说明西方两党政治的欺骗性。竞选的时候,怎样有利于拉票就怎样讲,当选以后,可以忘得一干二净。在这个意义上,我们说不要以为哪个政党上台这些西方国家的态度就会改变,确实很有道理。政党政治,本来在理论上有促使政治家个人操守不可太放肆的优点。但是在西方国家,小学生都知道政治家说的话不可靠,无奈制度决定了,每次竞选,人们只能在那少数政治家之间作出他信非常有限的选择。 为什么第三个政党难成气候?这是因为,如果三个政党的位置不相同,不在同一个点上,那么他们都有向中点

博弈论测试题

博弈论测试题十一 一、什么是子博弈精炼纳什均衡? 答:将纳什均衡中包含的不可置信的威胁策略剔除出去。它要求参与者的决策在任何时点上都是最优的。由于剔除了不可置信的威胁,在许多情况下,精炼纳什均衡也就缩小了纳什均衡的个数。只有当参与人的策略在每一个子博弈中都构成纳什均衡叫做精炼纳什均衡。或者说,组成精炼纳什均衡的策略必须在每一个子博弈中都是最优的。 二、参与人的理性问题对动态博弈分析的影响是否比静态博弈的影响更大?为什么? 答:正确,博弈论要求个体具有始终追求自身利益最大化的理性意识和理性能力的“自我” 个体理性,这是静态博弈的范畴。除此之外,还要求相关的参与者具有层次较高的“交互理性”,要求不同个体之间在理性和行为方面具有一种“默契”。即,人们的自身利益的最大化不仅取决于自己的选择,还取决于与之相关的其他人的选择与行为,那么为了实现自己的最大利益,个体的理性决策就必须考虑他人的理性选择与行为。作为博弈论的基础,交互理性是其基本的理性要求。博弈论还要求有关博弈的结构、各个博弈参与者的得益函数以及各个博弈参与者的理性等“知识”是所有博弈参与者之间的“共同知识”。也就是,每个博弈参与者不仅要首先明确自己和其他参与者所有可选的策略,还需知晓各种情况下自己最终的收益或其概率分布,并且每个博弈参与者都知道各个参与者掌握这些信息;更为重要的是,每个博弈参与者都知道所有参与者都是理性的,都知道其他博弈参与者知道所有参与者都是理性的,都知道其他博弈参与者知道其他博弈参与者知道所有博弈参与者都是理性的------。理性的共同知识假设是非合作博弈理论的一个非常重要和关键的假设,是实现交互理性和理性主义的纳什均衡的基本前提,这些,都是动态博弈的范畴。因此说,参与者理性问题对动态博弈的分析影响更大。 三、纳什均衡和精炼纳什均衡存在哪些问题? 答:纳什均衡存在的问题: (1)不是所有博弈都存在纳什均衡如纯策略就不存在混合策略则一定会存在纳什均衡,它是通过概率来计算纳什均衡,在这种均衡下,给定其他参与人的策略选择概率,每个参与人都可以为自己确定选择每一种策略的最优概率。 (2)在论及纳什均衡时,我们假设参与人是完全理性的,而且是假定参与人之间不允许达成任何协议的非合作博弈的均衡解。而现实并非如此。 精炼纳什均衡存在的问题:有限重复博弈的子博弈精炼纳什均衡有如下定理∶令G是阶段博弈,G(T)是重复T次的重复博弈。那么,如果G有唯一的纳什均衡,重复博弈G(T)的唯一子博弈精炼纳什均衡结果是阶段博弈G的纳什均衡重复T次。这个定理成立的条件是单阶段纳什均衡的“唯一性” ,若纳什均衡不是唯一的,上述定理的结论就不一定成立。 四、有限次重复博弈和无限次重复博弈有什么区别?这些区别对我们有什么启发? 答:有限次重复博弈与无限次重复博弈都属于动态博弈,对于有限次博弈,收益是每次收益的简单相加,可以采取子博弈纳什均衡的方法求解,即逆推法;但无限次博弈却不能采取;此外,有限次博弈中博弈的双方都还是关注的是自己短期的利益,而无限次博弈中博弈的双方可能针对某项事情达成协议,达到共谋,为共同的利益而选择自己的行动,达到整体的最优,供应链契约即类似。 五、有限次重复博弈的精炼纳什均衡的最后一次重复必定是第一阶段博弈的一个纳什均衡?答:

博弈论第三章习题

问题1:如果开金矿博弈中第三阶段乙选择打官司后的结果尚不能肯定,即下图中a 、b 数值不确定。试讨论本博弈有哪几种可能的结果。如果本博弈中的“威胁”和“承诺”是可信的,a 或b 应满足什么条件? ①0a <,不借—不分—不打; ②01a <<,且2b >,借—不分—打; ③1a >,且2b >,借—不分—打(,)a b ; ④0a >,且2b <,借—分—(2,2) 问题2:三寡头市场需求函数Q P -=100,其中Q 是三个厂商的产量之和,并且已知三个厂商都有常数边际成本2而无固定成本。如果厂商1和厂商2同时决定产量,厂商3根据厂商1和厂商2的产量决策,问它们各自的产量和利润是多少? 1123111231(100)2(98)q q q q q q q q q π=----=--- 2123221232(100)2(98)q q q q q q q q q π=----=--- 3123331233(100)2(98)q q q q q q q q q π=----=--- 331230,(98)/2q q q q π?=?=--? 代入,11212122(98)/2,(98)/2q q q q q q ππ=--=-- (a ,b ) (0,4)

1212 0,0q q ππ??==??,得***12398/3,49/3q q q ===

***1234802/9,2401/9πππ===。 问题3:设两个博弈方之间的三阶段动态博弈如下图所示。 (1)若a 和b 分别等于100和150,该博弈的子博弈完美纳什均衡是什么? (2)T N L --是否可能成为该博弈的子博弈完美纳什均衡路径,为什么? (3)在什么情况下博弈方2会获得300单位或更高的得益? (1)博弈方1在第一阶段选择R ,在第三阶段选择S ,博弈方2在第二阶段选择M 。 (2)不可能。T N L --带来的利益50明显小于博弈方1在第一阶段R 的得益300;无论a 和b 是什么数值,该路径都不能构成Nash 均衡,不能成为子博弈完美Nash 均衡。 (3)由于T N L --不是本博弈的子博弈完美Nash 均衡,因此博弈方2不可能通过该路径实现300单位的得益,唯一有可能实现300单位及以上的得益的路径为L N S --,要使该路径成为子博弈完美Nash 均衡而且博弈方2得到300单位及以上的得益必须300,300a b >≥。 问题4:企业甲和企业乙都是彩电制造商,都可以选择生产低档产品或高档产品,每个企业在四种不同的情况下的利润如以下得益矩阵所示。如果企业甲先于企业乙进行产品 (a ,b ) 50,300

博弈论 课后习题答案

博弈论课后习题答案 第四部分课后习题答案 1. 参考答案: 括号中的第一个数字代表乙的得益,第二个数字代表甲的得益,所以a表示乙 的得益,而b表示甲的得益。 在第三阶段,如果,则乙会选择不打官司。这时逆推回第二阶段,甲会选择 a,0 不分,因为分的得益2小于不分的得益4。再逆推回第一阶段,乙肯定会选择 不借,因为借的最终得益0比不借的最终得益1小。 在第三阶段,如果,则乙轮到选择的时候会选择打官司,此时双方得益是 (a,b)。a,0 逆推回第二阶段,如果,则甲在第二阶段仍然选择不分,这时双方得益为 (a,b)。b,2 在这种情况下再逆推回第一阶段,那么当时乙会选择不借,双方得益(1,0), 当a,1 时乙肯定会选择借,最后双方得益为(a,b)。在第二阶段如果,则甲会选择 a,1b,2分,此时双方得益为(2,2)。再逆推回第一阶段,乙肯定会选择借,因为 借的得益2大于不借的得益1,最后双方的得益(2,2)。 根据上述分析我们可以看出,该博弈比较明确可以预测的结果有这样几种情况: (1),此时本博弈的结果是乙在第一阶段不愿意借给对方,结束博弈,双方a,0 得益 (1,0),不管这时候b的值是多少;(2),此时博弈的结果仍然012,,,ab且

是乙在第一阶段选择不借,结束博弈,双方得益(1,0);(3),此时博ab,,12 且弈的结果是乙在第一阶段选择借,甲在第二阶段选择不分,乙在第三阶段选择打,最后结果是双方得益 (a,b);(4),此时乙在第一阶段会选择借,甲在第二阶段会选择分,ab,,02且双方得益(2,2)。 要本博弈的“威胁”,即“打”是可信的,条件是。要本博弈的“承诺”,即a,0 “分”是可信的,条件是且。 a,0b,2 注意上面的讨论中没有考虑a=0、a=1、b=2的几种情况,因为这些时候博弈方的选择很难用理论方法确定和预测。不过最终的结果并不会超出上面给出的范围。 2. 参考答案: 静态贝叶斯博弈中博弈方的一个策略是他们针对自己各种可能的类型如何作相应的完整计划。或者换句话说,静态贝叶斯博弈中博弈方的策略就是类型空间到行为空间的一个函数,可以是线性函数,也可以是非线性函数,当博弈方的类型只有有限几种时是离散函数,当博弈方的类型空间是连续区间或空间时则是连续函数。只有一种类型的博弈方的策略仍然是一种行为选择,但我们同样可以认为是其类型的函数。 静态贝叶斯博弈中博弈方的策略之所以必须是针对自己所有可能类型的函数,原因是博弈方相互会认为其他博弈方可能属于每种类型,因此会考虑其他博弈方所有可能类型下的行为选择,并以此作为自己行为选择的根据。因此各个博弈方必须设定自己在所有各种可能类型下的最优行为,而不仅仅只考虑针对真实类型的行为选择。 3. 参考答案:

博弈论各章节课后习题答案 (4)

第四章谈判与协调 1.帕累托占优均衡和纳什均衡的关系是什么? 纳什均衡的基本思想是:每一个局中人选择一个策略,由所有局中人的策略构成了一个策略组合;在其它局中人选定策略不变的情况下,若某一个局中人单独地违背自己已选的策略,那么他的收益只会下降(或收益不会增加)。这样的策略组合构成一个均衡局势,并命名为纳什均衡。纳什均衡有纯策略的纳什均衡和混合策略的纳什均衡。一个博弈中有不止一个纳什均衡时,就构成一个多重纳什均衡问题。在多重纳什均衡下给出一些选择标准就得到一些特定的纳什均衡。其中帕累托占有纳什均衡是根据这样的选择标准选择的均衡。在博弈 中,若均为G 的其纳什均衡,若满足[,{},{}]i i G N S P =12,,,m s s s ????0 i s ?,0()()i i i j P s P s ?? >1,2,,,1,2,,i n j m ==??则称为博弈G 的帕累托占优纳什均衡。可见帕累托占有纳什均衡是纳什均衡中收益最大 0i s ? 的一种均衡。 2.分别找出具有下列性质的2人博弈的例子。 (1)不存在纯策略纳什均衡; (2)至少有两个纳什均衡,并且其中之一是帕累托占优均衡。 (1 )不存在纯策略的纳什均衡:该博弈不存在纯策略的纳什均衡 (2) 该博弈有三个纳什均衡:(战争,战争)、(和平,和平)和一个混合策略纳什均 衡。很显然,(和平,和平)是一个帕累托占优纳什均衡。 2525((,),(,77773.假设在某一产品市场上有两个寡头垄断企业,它们的成本函数分别为: TC 1=0.1q +20q 1+100000TC 2=0.4q +32q 2+20000 2122这两个企业生产一同质产品,其市场需求函数为:Q=4000-10p 。试分别基于古诺模型和纳什谈判模型求解两企业的利润。 解:由和400010Q p =?12 Q q q =+得124000.1() p q q =?+战争 和平国 家 1战争-5,-58,-10和平-10,810,10

“博弈论”习题及参考答案

《博弈论》习题 一、单项选择题 1.博弈论中,局中人从一个博弈中得到的结果常被称为()。 A. 效用 B. 支付 C. 决策 D. 利润 2.博弈中通常包括下面的内容,除了()。 A.局中人 B.占优战略均衡 C.策略 D.支付 3.在具有占优战略均衡的囚徒困境博弈中()。 A.只有一个囚徒会坦白 B.两个囚徒都没有坦白 C.两个囚徒都会坦白 D.任何坦白都被法庭否决了 4.在多次重复的双头博弈中,每一个博弈者努力()。 A.使行业的总利润达到最大 B.使另一个博弈者的利润最小 C.使其市场份额最大 D.使其利润最大 5.一个博弈中,直接决定局中人支付的因素是()。 A. 策略组合 B. 策略 C. 信息 D. 行动 6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时 的博弈具有()。 A.囚徒困境式的均衡 B.一报还一报的均衡 C.占优策略均衡 D.激发战略均衡 7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的策略称为()。 A.一报还一报的策略 B.激发策略 C.双头策略 D.主导企业策略 8.在囚徒困境的博弈中,合作策略会导致()。 A.博弈双方都获胜 B.博弈双方都失败

C.使得先采取行动者获胜 D.使得后采取行动者获胜 9.在什么时候,囚徒困境式博弈均衡最可能实现()。 A. 当一个垄断竞争行业是由一个主导企业控制时 B.当一个寡头行业面对的是重复博弈时 C.当一个垄断行业被迫重复地与一个寡头行业博弈时 D. 当一个寡头行业进行一次博弈时 10.一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种策略是一种()。 A.主导策略 B.激发策略 C.一报还一报策略 D.主导策略 11.关于策略式博弈,正确的说法是()。 A. 策略式博弈无法刻划动态博弈 B. 策略式博弈无法表明行动顺序 C. 策略式博弈更容易求解 D. 策略式博弈就是一个支付矩阵 12.下列关于策略的叙述哪个是错误的(): A. 策略是局中人选择的一套行动计划; B. 参与博弈的每一个局中人都有若干个策略; C. 一个局中人在原博弈中的策略和在子博弈中的策略是相同的; D. 策略与行动是两个不同的概念,策略是行动的规则,而不是行动本身。 13. 囚徒困境说明(): A. 双方都独立依照自己的利益行事,则双方不能得到最好的结果; B. 如果没有某种约束,局中人也可在(抵赖,抵赖)的基础上达到均衡; C. 双方都依照自己的利益行事,结果一方赢,一方输; D、每个局中人在做决策时,不需考虑对手的反应 14. 一个博弈中,直接决定局中人损益的因素是(): A. 策略组合 B. 策略 C. 信息 D. 行动 15. 动态博弈参与者在关于博弈过程的信息方面是() A 不对称的 B 对称的 C 不确定的 D 无序的

《博弈论》期中考试试卷及参考答案

20XX 级经济学专业(1-2班) 《博弈论》期中考试试卷(开卷) 班级 学号 姓名 成绩 1、不能用铅笔答题,违反者按缺考处理; 2、开卷考试,给足够时间答题,请认真完成考试;卷面务必保持清楚整洁,每涂改一处扣10分; 3、每一道题的解务必写出完整的解题过程,没有过程,只有答案不给分; 4、如果发现雷同卷,一律按零分处理。 一、下面的支付矩阵表示一个两人的静态博弈。问当a 、b 、c 、d 、f 、g 、h 之间满足什么条件时,该博弈存在严格优势策略均衡(20分) 参考答案: 1、严格优势策略均衡是由各博弈方的严格优势策略组成的策略组合。(2分) 2、对于博弈方1,如果a >e 且c >g ,则U 是相对于D 的严格优势策略;如果a <e 且c <g ,则D 是相对于U 的严格优势策略;(3分) 3、对于博弈方2,如果b >d 且f >h 则L 是相对于R 的严格优势策略;如果b <d 且f <h ,则R 是相对于L 的严格优势策略。(3分) 4、上述两个博弈方各自有两种严格优势策略的相对支付情况的组合,总共可能构成四种严格优势策略均衡:(12分) 1)如果a >e 且c >g ,b >d 且f >h ,严格优势策略均衡是(U ,L ) 2)如果a >e 且c >g ,b <d 且f <h ,严格优势策略均衡是(U ,R ) 3)如果a <e 且c <g ,b >d 且f >h ,严格优势策略均衡是(D ,L ) 4)如果a <e 且c <g ,b <d 且f <h ,严格优势策略均衡是(D ,R ) (在求解本题时,如果前面三点没有写,但这四条都能写出来,可以按每条5分计算,共20分) 二、一个工人给一个老板干活,工资标准是100元。工人可以选择是否偷懒,老板则选择是否克扣工资。假设工人不偷懒有相当于50元的负效用,老板想克扣工资总有借口扣掉60元工资,工人不偷懒老板有150元产出,而工人偷懒时老板只有80元产出,但老板在支付工资之前无法知道实际产出,这些情况是双方都知道的。请问:(1)如果老板完全能够看出工人是否偷懒,博弈属于哪种类型?请用支付矩阵或博弈树表示该博弈(要求按教材给出的格式来表示,并求出博弈的所有Nash 均衡及博弈的结果(2)如果老板无法看出工人是否偷懒,博弈属于哪种类型?请用支付矩阵或博弈树表示该博弈(要求按教材给出的格式来表示,并求出博弈的均衡解。(共30分) 参考答案 g ,h e ,f c ,d a , b L R U D 博弈方2博弈方1

博弈论试题

Brigham Young University Department of Economics Economics 381 – Intermediate Macroeconomics Dr. Phillips (sections 2 & 4) Winter Semester 2005 Midterm Exam 2 key Mar. 11 - 12, 2005 This exam is closed book and closed notes, though you may use a calculator. Read all questions carefully before answering. Write your answers legibly in the space provided. Keep your answers concise and correct. Points will be deducted for answers which are irrelevant to the question. You may use a testing center calculator to help with the math, if you wish. Section I (multiple choice, 2 points each) Circle the letter of the correct answer. 1. Consumption smoothing refers to (a) the tendency of all consumers to choose the same amount of current consumption. (b) the tendency of consumers to seek a consumption path over time that is smoother than income. (c) the tendency of consumers to seek an income path over time that is smoother than consumption. (d) consumer’s concerns about going heavily into debt. 2. An increase in first-period income results in (a) an increase in first-period consumption, an increase in second-period consumption, and an increase in saving. (b) an increase in first-period consumption, a decrease in second-period consumption, and an increase in saving. (c) a decrease in first-period consumption, an increase in second-period consumption, and an increase in saving. (d) an increase in first-period consumption, an increase in second-period consumption, and a decrease in saving. 3. An increase in the real interest rate is an example of a (a) pure substitution effect. (b) substitution effect and a positive income effect. (c) substitution effect and a negative income effect. (d) substitution effect and an income effect whose sign depends on whether the consumer is initially a borrower or a lender. 4. An increase in lifetime wealth is likely to (a) increase current labor supply and increase current consumption demand. (b) increase current labor supply and decrease current consumption demand. (c) decrease current labor supply and increase current consumption demand. (d) decrease current labor supply and decrease current consumption demand.

博弈论试题集

(一)巴什博奕(Bash Game):只有一堆n个物品,两个人轮流从这堆物品中取物,规定每次至少取一个,最多取m个。最后取光者得胜。 显然,如果n=m+1,那么由于一次最多只能取m个,所以,无论先取者拿走多少个,后取者都能够一次拿走剩余的物品,后者取胜。因此我们发现了如何取胜的法则:如果n=(m+1)r+s,(r为任意自然数,s≤m),那么先取者要拿走s个物品,如果后取者拿走k(≤m)个,那么先取者再拿走m+1-k个,结果剩下(m+1)(r-1)个,以后保持这样的取法,那么先取者肯定获胜。总之,要保持给对手留下(m+1)的倍数,就能最后获胜。 这个游戏还可以有一种变相的玩法:两个人轮流报数,每次至少报一个,最多报十个,谁能报到100者胜。 取石子(一) 时间限制:3000 ms | 内存限制:65535 KB 难度:2 描述 一天,TT在寝室闲着无聊,和同寝的人玩起了取石子游戏,而由于条件有限,他/ 她们是用旺仔小馒头当作石子。游戏的规则是这样的。设有一堆石子,数量为N (1<=N<=1000000),两个人轮番取出其中的若干个,每次最多取M个 (1<=M<=1000000),最先把石子取完者胜利。我们知道,TT和他/她的室友 都十分的聪明,那么如果是TT先取,他/她会取得游戏的胜利么? 输入 第一行是一个正整数n表示有n组测试数据 输入有不到1000组数据,每组数据一行,有两个数N和M,之间用空格分隔。 输出 对于每组数据,输出一行。如果先取的TT可以赢得游戏,则输出“Win”,否则输 出“Lose”(引号不用输出) 最优解: #include using namespace std; int main()

博弈论复习题与答案

博弈论 判断题(每小题1分,共15分) 囚徒困境说明个人的理性选择不一定是集体的理性选择。(√) 子博弈精炼纳什均衡不是一个纳什均衡。(×) 若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。()博弈中知道越多的一方越有利。(×) 纳什均衡一定是上策均衡。(×) 上策均衡一定是纳什均衡。(√) 在一个博弈中只可能存在一个纳什均衡。(×) 在一个博弈中博弈方可以有很多个。(√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。(√) 在博弈中纳什均衡是博弈双方能获得的最好结果。(×) 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(×)上策均衡是帕累托最优的均衡。(×) 因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。 (×) 在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×) 在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(√)不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√) 多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(√) 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t

相关主题