搜档网
当前位置:搜档网 › 高级微观经济学博弈论(1)

高级微观经济学博弈论(1)

高级微观经济学博弈论(1)
高级微观经济学博弈论(1)

Bingyong Zheng

SHUFE Spring2016 1Introduction to game theory

1.1What is Game theory?

1.Why study game theory:Game theory is the branch of microeconomics concerned with the

analysis of optimal decision making in competitive situations in which the actions of each decision maker have signi?cant impact on the fortune of the others.

2.What is a game:A game is a formal representation of a situation in which a number of

individuals interact in a setting of strategic interdependence.To describe a game,we need to know four things:

?Players:who is involved(playing in the game)?

?Rules:How the game is played?

?Outcomes:

?Payo?s:

1.2Rationality and common knowledge

1.Rationality Assumption:

https://www.sodocs.net/doc/a210977452.html,mon knowledge:A standard assumption is that the game(players,strategies,and payo?

functions)is common knowledge among https://www.sodocs.net/doc/a210977452.html,mon knowledge is an important concept in game theory.A fact is common knowledge among players if each player knows the fact,and each player knows everyone else knows,and each knows everyone else knows everyone else knows,and so on.For example,a handshake is common knowledge between the two persons involved.When I shake hand with you,I know you know I know you know,....., that we shake hand.Neither person can convince the other that she does not know that they shake hand.So,perhaps it is not entirely random that we sometimes use a handshake to signal an agreement or a deal.

3.What if we don’t have common knowledge?

Example1:Muddy children puzzle

n children playing together.Each child wants to keep clean,but each would love to see the others get dirty.Now it happens during their play that some of the children,say k(k>1) of them,get mud on their foreheads.Each can see the mud on others but no on his own forehead.No one says a thing.Along comes the father,who says,“At least one of you has mud on your forehead.”The father then asks the following question,over and over:“Does any of you know whether you have mud on your own forehead?”Assuming that all the children are perceptive,intelligent,truthful,and that they answer simultaneously,what will happen?

Example2:The general’s problem

Two divisions of an army,each commanded by a general,camped on two hilltops overlooking

a valley the enemy stays.If both divisions attack the enemy simultaneously they will win

the battle,while if only one division attacks it will be defeated.Neither general will attack unless he is absolutely sure that the other will attack with him:a general will not attack if he receives no messages.The general of the?rst division wishes to coordinate a simultaneously attack(at some time the next day).They can communicate only by means of messengers.

Normally,it takes a messenger one hour to get from on encampment to the other and on this particular night,everything goes smoothly.How long will it takes them to coordinate an attack?

2Strategic form game

2.1A subjective expected-utility maximization approach

An subjective expected-utility approach interpretation of a game:

1.Each player has a subjective probability distribution over all states of the world–more pre-

cisely,the probabilities that her opponents playing s?i for all s?i∈×j=i S j.

2.Each player acts as an expected utility maximizer,choosing a strategy that maximizes her

expected payo?in the game given the probability distribution over the strategies of her

opponents.This is common knowledge.

3.The concept of Nash equilibrium imposes a further restriction,player’s belief is consistent

with the actual play of her opponents.

The above interpretation of subjective expected utility-maximization provides a decision theoret-ical foundation to the traditional de?nition of Nash equilibrium that each player plays optimally given the other players’equilibrium strategies.

An important feature of the subjective expected utility approach is that it does not require ran-domization on the part of the players.Recall that the traditional interpretation of mixed strategies that assumes players explicitly randomize.The probabilistic nature of strategies now re?ects the uncertainty of other players about a player’s choice.Thinking about the traditional Chinese “Scissor-rock-cloth”game.

2.2Strategical form game

The capacity expansion game between Honda and Toyota

Toyota

Build Do not build

Honda Build16,1620,15

Do not build15,2018,18

1.Players:Toyota,Honda.

2.Rules:Two?rms simultaneously choose to expand or not.

Strategies for each?rm:Build,Do not build.

3.4outcomes:(Build,Build),(Build,Do not build),(Do not build,Build),(Do not build,Do

not build).

4.Payo?s:

5.Nash equilibrium of this game:(Build,Build).

2.3Strategies

1.De?nition:A pure strategy s i of player i speci?es the actions that a player will take under

any conceivable circumstances that the player might face.

2.A strategy is a complete contingency plan that says what a player will do at each of her

information sets if she is called on to play there

3.A player’s strategy may include plans for actions that her own strategy makes irrelevant.

4.According to Rubinstein(1991)and Reny(1992),a player’s strategy can be partitioned

into two parts,a plan that describes a rational play for i,and a prediction about i’s future behavior should i deviates from his plan.

?A plan for player i speci?es a choice for player i only when he is called upon to move,

and does not specify what he would do at an information set of his that can not be

reached according to this plan.

?In order that others are able to specify what they would do were i not to follow through

his plan(something i must know in order to evaluate the soundness of this plan in the

?rst place),it must provide others with a prediction about i’s future behavior should

i deviate.

5.Given the SEUM approach discussed before,one natural interpretation for the speci?cation

of choices at information sets that won’t be reached given a player’s strategy is that they are beliefs of his opponents about what he would do in case he does not follow his strategy,i.e., the information sets were reached.The belief of his opponents is important as their choices at those information sets are based on this belief.Furthermore,what the player’s opponents would do at those information sets rationalize his choice at at an upstream information set.

Hence,this de?nition of strategy is not so odd when you interpret it as the way a player determines his strategy.

6.Pure strategy and mixed strategy

A mixed strategyσi∈?(S i)speci?es probabilities to two or more pure strategies.For

example,the traditional Chinese game,rock,scissor and cloth.

player2

scissor rock cloth

Player1scissor0,0-1,11,-1

rock1,-10,0-1,1

cloth-1,11,-10,0

Example2.A game of“match the coin”:Both players,Tom and Jack,choose whether to place the coin Head up or Tail up.Jack wins if two“Head”or two“Tail”appear,and loses otherwise.

Jack

Head Tail

Tom Head-1,11,-1

Tail1,-1-1,1

2.3.1Dominant strategy

1.Dominant strategy:A strategy s i is dominant for player i if for all s?i∈S?i and s′i∈S i/s i

u i(s i,s?i)>u i(s′

,s?i).

i

A strategy is a dominant strategy for a player if it is better than other strategies,no matter

what the others will choose.

In any Nash equilibrium,players who have a dominant strategy play the dominant strategy.Thus,it is easy to?nd the Nash equilibrium of games in which some of the players have a dominant strategy.

2.“Confess”is a dominant strategy for prisoner1and prisoner2.

Prisoner1

Confess Not confess

Prisoner2Confess-5,-50,-10

Not confess-10,0-1,-1

3.Dominant strategies are rarity rather than norm.There is no dominant strategies in most

interesting games.

2.3.2Dominated strategy

1.A pure strategy s i∈S i is weakly dominated if there is another strategy s′i∈S i such that

for all s?i∈S?i,

,s?i)≥u i(s i,s?i),

u i(s′

i

with strict inequality for some s?i.

∈S i such that

A strategy s i is strictly dominated for player i if there is another strategy s′

i for all s?i∈S?i

,s?i)>u i(s i,s?i).

u i(s′

i

A strategy is strictly dominated when the player has another strategy that gives her a

higher payo?no matter what the other player plays.

2.Allowing mixed strategy:

?A strategyσi is strictly dominated for player i if there is another strategyσ′i∈?(S i)/σi

such that for allσ?i∈?(S?i)

,σ?i).

u i(σi,σ?i)

i

?A pure strategy s i is strictly dominated for player i if and only if there existsσi∈?(S i)

such that

u i(s i,s?i)

for all s?i.

3.A mixed strategy that assigns positive probability to a pure strategy that is strictly domi-

nated is also strictly dominated.

4.Modi?es capacity expansion game between Toyota and Honda

Toyota

large small not build

Honda large0,012,818,9

small8,1216,1620,15

not build9,1815,2018,18

“large”is a dominated strategy for both?rm as it can do better by choosing“small”, regardless of what the other?rm is going to do.

5.A player will not play a strictly dominated strategy in Nash equilibrium.

2.4Nash equilibrium

2.4.1De?nition and interpretation

1.De?nition:A strategy pro?le s?=(s?

1,...,s?

n

)is a Nash Equilibrium(NE)if for all i∈N

and for all s′

i

∈S i

U i (

s?

i

,s??i

)

≥U i

(

s′

i

,s??i

)

.

2.The central concept of noncooperative game theory is Nash equilibrium.A Nash equilibrium

is a pro?le of strategies such that for each player in the game,given the strategy chosen by the other players,the strategy is a best response for the player,that is,the strategy gives the player the highest payo?.

3.How to interpret the concept of Nash equilibrium.

(a)In most of the early literature the idea of equilibrium was that it said something about

how players would play the game or about how a game theorist might recommend that they play the game.However,this interpretation runs into trouble in many cases.For example,how do we interpret mixed strategy Nash equilibrium?How to motivate the re?nements of Nash equilibrium?

(b)Recently,there has been a shift to thinking of equilibria as representing not recommen-

dations to players of how to play the game but rather the expectations of the others as to how a player will play.Further,if the players all have the same expectations about

the play of the other players we could as well think of an outside observer having the

same information about the players as they have about each other.

4.While the?rst interpretation of the equilibrium can be problematic in case of mixed strat-

egy equilibrium,the second interpretation can accommodate mixed strategies without any trouble.In this scenario,the mixed strategy of a player does not represent a conscious ran-domization on the part of that player,but rather the uncertainty in the minds of the others as to how that player will act.Hence,the second interpretation of Nash equilibrium has become the preferred interpretation among game theorists.

Thus the focus of the equilibrium analysis becomes,not the choices of the players,but the assessments of the players about the choices of the others.The basic consistency condition that we impose on the players’assessments is this:A player reasoning through the conclu-sions that others would draw from their assessments should not be led to revise his own assessment.

2.4.2Find NE in two-player games

In games with dominant and dominated strategies

1.Most games have?nite and ODD number of NE.

Example:

L M R

T3,30,23,0

B0,03,20,3

2.If both players have a dominant strategy,then playing dominant strategies is the unique

Nash equilibrium in the game.

3.If one player has a dominant strategy,this strategy will be this player’s NE strategy.The

other player’s NE strategy is the best response to her opponent’s dominant strategy.

4.If players have dominated strategies,delete the dominated strategies from the game and

work with a smaller game.

Example

Player2

A B C

Player1A5,815,1010,5

B10,1520,915,0

C20,2010,1010,8

5.NE must be a mutual best-response,that,given player1plays NE strategy,player2can

not do better by playing some other strategies,similarly,given player2plays this strategy, player1can not do better by changing strategies.A NE is a strategy pro?le in which both players are playing the best-response given the other player’s strategy.

2.4.3Three player game

1.A simple example

Player2

U D

1A(1,1,0)(2,-2,5) B(1,-2,-1)(0,3,1)

Player2

U D

A(1,1,-2)(2,-2,5) B(2,2,-1)(2,3,7)

Player3plays L Player3plays R 2.Another example

U V W L3,0,22,-1,01,-2,0 1M3,2,11,4,-10,0,-2 R1,1,100,2,1-2,0,3

Player3plays A

U V W

L2,1,13,0,02,-2,-1 M5,4,21,3,43,0,-2 R1,1,10,2,0-2,0,2 Player3plays B

U V W

L2,1,-13,0,-12,-2,-3 M5,4,-11,3,-23,0,-4 R1,1,-100,2,-1-2,0,-2 Player3plays C

Player1’s dominated strategy R,player2’s dominated strategy W.Player3’s dominated strategy C.The pure strategy NE in this game(L,U,A),(M,U,B).

2.4.4Strategic Stability of NE

1.Being a NE is a necessary condition for an obvious way to play the game,if an obvious way

to play the game exists.But

?Being NE is not su?cient for a strategy pro?le to be the obvious way to play a given

game.

?Not every game admits an obvious way to play the game

2.Some questions to be answered:

?How can we re?ne NE,the necessary condition to get the prediction of the game,an

obvious way to play the game.

NE can involve weakly dominated strategies,we should add to our necessary condition

that the solution should be a NE in strategies that are undominated,even weakly

?What are the means by which we are to identify“obvious way to play a game?”

?What can one say about games that do not admit a“solution”

When the game does not admit an“obvious way to play,”looking at its NE can give

precisely the wrong answer.The concept of NE is of no use when the game admits no

“solution”

3.On occasion the requirement of Nash equilibrium can be too demanding at times.This

leads to two less restrictive concepts:rationalizability,and correlated equilibrium.Some new solution concepts are thus advanced:rationalizability,correlated equilibrium

4.Rationalizability(Pearce1984Econometrica)

?Rationalizable strategies:

?A strategyσi is a best response for player i to her rivals’strategiesσ?i if

,σ?i).

u i(σi,σ?i)≥u i(σ′

i

∈?(S i)

for allσ′

i

?Strategyσi is never a best response if there is noσ?i for whichσi is a best response.

?The strategies in?(S i)that survive iterated deletion removal of strategies that are

never a best response are known as player i’s rationalizable strategies.

Player2

b1b2b3b4

a10,72,57,00,1

Player1a25,23,35,20,1

a37,02,50,70,1

a40,00,-20,010,-1

5.At other times,the requirement of NE is not strong enough to rule out multiple equilibria

or implausible predictions.Two lines of research to address these di?culties:?Equilibrium selection:concerned with narrowing the prediction to a single prediction.

See A General Theory of Equilibrium Selection in Games/Harsany and Selten,1988.

?Re?nement of NE:concerned with establishing necessary conditions for reasonable

predictions.

2.5Iterated Deletion of Strictly Dominated Strategies

1.Now in situations where players do not have a chance to talk or where there is no history to

rely on,Nash equilibrium may not be a good prediction.So in this case,we may prefer a solution concept that does not make strong assumptions about players knowing what each other is going to do.

2.A rational player should never choose a strictly dominated strategies because there exists

another strategies that is strictly better.Note that if a player has a dominant strategies, then all other strategies are dominated.

3.Consider the following game(Gibbons pp.6):

Player2

Player1

L M R U1,01,20,1 D0,30,12,0

4.Note that R is strictly dominated by M for Player2.Now,if Player1knows that Player2is

rational,then Player1knows that Player2will never choose R.If R is eliminated,then D becomes dominated by U.Now,if Player2knows Player1knows that Player2is rational, then Player2knows that Player1will not choose D.In that case,Player2should choose M.

5.If it is common knowledge that both players are rational,we can continue this process

inde?nitely.

6.Note that Nash and IDSDS are based on di?erent logic.IDSDS does not require that the

players know that the equilibrium is going to be played,so it requires less coordination.

However,common knowledge of rationality is itself a very strong assumption.

7.For two-player games,rationalizable strategies are those remaining after the iterative deletion

of strictly dominated strategies.

8.For more than two player games,this is no longer true.

See,for example.

L R U90 D00

L R

U09

D90

L R

U00

D09

L R

U60

D06

A B C D

In this example,D is not dominated,but never a best response for player3.

2.6Existence of NE

1.Theorem1(Theorem7.2,Jehle and Reny).Every?nite strategic form game has at least

one NE.

Proof.See Jehle and Reny pp.278.

2.Theorem2.NE exists if the strategy set of each player is a compact and convex subset of

an Euclidean space and if the utility function of each player is continuous in the strategy pro?le and quasi-concave in one’s own strategy.

Proof.Step1:the maximizer

b i(σ?i)=arg max

σi∈?(S i)

u i(σi,σ?i)

is nonempty,convex-valued and upper hemicontinuous.

Step2:by Kukutani’s?xed point theorem,a non-empty,convex-valued upper hemicontin-uous correspondence b i(σ?i)mapping from?(S)to itself,there must exists a?xed point.

3Normal-form perfect equilibrium

1.The problem with NE is,that,many games have multiple equilibria.The natural question

then arises,can we go any further and rule out any equilibria as self-enforcing assessment of the game.Indeed,on occastion irrational assessments by two di?erent players might each make the other look rational.

2.As an example,consider the following game

b1b2

a13,30,0

a2-5,-50,-5

But is(a2,b2)a good prediction of the game?Not likely.

3.An?-perfect equilibrium of the normal form game is a totally mixed strategyσ≡(σ1,...,σN),

if for all i and for all s i,s′

i

∈S i,

u i(s i,σ)>u i(s′

i ,σ)thenσi(s′

i

)≤?.

4.A perfect equilibrium of a normal form game is a limit(?→0)of?-perfect equilibria.

5.For two-player game,any NE in which no player plays dominated strategies is perfect.

6.For more than two-player game,the above statement is not true.There are NE with no

players playing dominated strategies that is not perfect.

Player2

L R Player1T(1,1,1)(1,0,1)

B(1,1,1)(0,0,1)

Player2

L R Player1T(1,1,0)(0,0,0)

B(0,1,0)(1,0,0)

Player3plays l Player3plays r

?(B,L,l)is a NE with no weakly dominated strategies.

?However,for any small probabilities player2assigns to R and player3to r,the expected payo?for player1from T is greater than that from B.Thus,there exists no ?-perfect equilibrium in which the totally mixed strategy pro?le assigns more than?to B.

7.Perfect equilibrium does not eliminate all unreasonable outcomes in some games.Adding a

domianted strategy may enlarge the set of perfect equilibria.

Consider the following example.

L2M2 L11,10,0 M10,00,0

L2M2R2 L11,10,0-1,-2 M10,00,00,-2 R1-2,-1-2,0-2,-2

博弈论练习题2答案

博弈论练习题2答案

111111111111111111 博弈论练习题(四) 一、什么是子博弈精炼纳什均衡? 答:将纳什均衡中包含的不可置信的威胁策略剔除出去。它要求参与者的决策在任何时点上都是最优的。由于剔除了不可置信的威胁,在许多情况下,精炼纳什均衡也就缩小了纳什均衡的个数。只有当参与人的策略在每一个子博弈中都构成纳什均衡叫做精炼纳什均衡。或者说,组成精炼纳什均衡的策略必须在每一个子博弈中都是最优的。 二、参与人的理性问题对动态博弈分析的影响是否比静态博弈的影响更大?为什么? 答:正确,博弈论要求个体具有始终追求自身利益最大化的理性意识和理性能力的“自我”个体理性,这是静态博弈的范畴。除此之外,还要求相关的参与者具有层次较高的“交互理性”,要求不同个体之间在理性和行为方面具有一种“默契”。即,人们的自身利益的最大化不仅取决于自己的选择,还取决于与之相关的其他人的选择与行为,那么为了实现自己的最大利益,个体的理性决策就必须考虑他人的理性选择与行为。作

为博弈论的基础,交互理性是其基本的理性要求。博弈论还要求有关博弈的结构、各个博弈参与者的得益函数以及各个博弈参与者的理性等“知识”是所有博弈参与者之间的“共同知识”。也就是,每个博弈参与者不仅要首先明确自己和其他参与者所有可选的策略,还需知晓各种情况下自己最终的收益或其概率分布,并且每个博弈参与者都知道各个参与者掌握这些信息;更为重要的是,每个博弈参与者都知道所有参与者都是理性的,都知道其他博弈参与者知道所有参与者都是理性的,都知道其他博弈参与者知道其他博弈参与者知道所有博弈参与者都是理性的------。理性的共同知识假设是非合作博弈理论的一个非常重要和关键的假设,是实现交互理性和理性主义的纳什均衡的基本前提,这些,都是动态博弈的范畴。因此说,参与者理性问题对动态博弈的分析影响更大。 三、纳什均衡和精炼纳什均衡存在哪些问题?答:纳什均衡存在的问题: (1)不是所有博弈都存在纳什均衡如纯策略就不存在混合策略则一定会存在纳什均衡,它是通

博弈论第七章习题

第七章习题 一、判断下列表述是否正确,并作简单分析 (1)海萨尼转换可以把不完全信息静态博弈转换为不完美信息博弈,说明有了海萨尼转换,不完全信息静态博弈和一般的不完美信息动态博弈是等同的,不需要另外发展分析不完全信息静态博弈的专门分析方法和均衡概念。 答:错误。即使海萨尼转换把不完全信息静态博弈转换为不完美信息动态博弈,也是一种特殊的有两个阶段同时选择的不完美信息动态博弈,对这种博弈的分析进行专门讨论和定义专门均衡的概念有利于提高分析的效率。 (2)完全信息静态博弈中的混合策略可以被解释成不完全信息博弈的纯策略贝叶斯纳什均衡。 答:正确。完全信息静态博弈中的混合策略博弈几乎总是可以解释成一个有少量不完全信息的近似博弈的一个纯策略Bayes—Nash均衡。夫妻之争的混合策略Nash均衡可以用不完全信息夫妻之争博弈的Bayes—Nash均衡表示就是一个例证。 (3)证券交易所中的集合竞价交易方式本质上就是一种双方报价拍卖。 答:正确。我国证券交易中运用的集合竞价确定开盘价的方式就是一种双方报价拍卖。与一般双方报价拍卖的区别只是交易对象,标的不是一件而是有许多件。 (4)静态贝叶斯博弈中之所以博弈方需要针对自己的所有可能类型,都设定行为选择,而不是只针对实际类型设定行为选择,是因为能够迷惑其他博弈方,从而可以获得对自己更有利的均衡。

答:错误。不是因为能够迷惑其他博弈方,而是其他博弈方必然会考虑这些行为选择并作为他们行为选择的依据。因为只根据实际类型考虑行为选择就无法判断其他博弈方的策略,从而也就无法找出自己的最优策略。其实,在这种博弈中一个博弈方即使自己不设定针对自己所有类型的行为选择,其他博弈方也会替他考虑。因为设定自己所有类型下的行为,实际上是要弄清楚其他博弈方对自己策略的判断。 (5)“鼓励—响应”的直接机制能保证博弈方都按他们的真实类型行为并获得理想的结果。 答:错误。“鼓励—响应”机制也就是说真话的直接机制,实际上只保证博弈方揭示,也就是说出自己的真实类型。 博弈方不直接选择行为,也不保证根据真实类型行为,更谈不上一定能实现最理想的结果。因为直接机制的结果常常是带有随机选择机制的,并不一定理想。实际上对所有博弈方都理想的结果在静态贝叶斯博弈中本身不一定存在。 二、双寡头古诺模型,倒转的需求函数为 ()P Q a Q =-, 其中12Q q q =+为市场总需求,但a 有h a 和l a 两种可能的情况,并且厂商1知道a 究竟是h a 还是l a , 而厂商2只知道h a a =的概率是θ, l a a =的概率是1θ-,这种信息不对称情况双方都是了解的。双方的总成本仍然是i i i c q cq =。如果两厂商同时选择产量,问双方的策略空间是什么?本博弈的贝叶斯纳什均衡是什么? 解:设厂商1已知h a a =时的产量为11()h q a q =,已知l a a =时的产量是11()l q a q =;再假设厂商2的产量是 2q ,这两个函数关系就是两个厂商的策略空间。 11211()h h h h h a q q q cq π=---

博弈论练习题答案 张照贵

博弈论练习题(一) 一、下面哪些问题适用博弈来模型化∶ 1、石油输出国组织(OPEC)成员国选择其年产量; 2、通用汽车公司向USX购买钢材; 3、两厂商,一家制造螺钉,一家制造螺帽,是用公制还是英制; 4、公司董事会为其总经理(CEO)设立一项期股安排; 5、联合果品公司决定招募工人; 6、一电力公司估计了未来10年对电力的需求后,决定是否购置一套新的发电机组。 问题1和3可以用博弈来模型化 二、博弈论与经济学的关系是什么?经济学的变化趋势是什么? 答: (1)博弈论与经济学的关系: 1、博弈论在经济学中的应用最广泛、最成功。 2、经济学家对博弈论的贡献越来越大。 3、经济学和博弈论研究的模式是一样的。经济学和博弈论都强调个人理性,即在给定的约束条件下追求效用最大化。 (2)经济学发展的几个趋势 博弈论成为主流经济学的基石,反映了经济学发展的几个趋势∶ 1、经济学研究的对象越来越转向个体。 2、经济学越来越转向人与人关系的研究,特别是人与人之间行为的相互影响及作用,人们之间利益的一致与冲突,竞争与合作的研究。 3、经济学越来越重视对信息的研究,特别是信息不对称对个人选择及制度安排的影响。 三、博弈论的构成要素有哪些? 答:广义上讲博弈论则主要由以下五大要素构成: 一,决策主体(Player):又称局中人或博弈方,指的是博弈中能独立决策、独立行动并承担决策结果的个人或组织。 二,策略空间(Strategy space):又称策略集,是指供参与者选择的策略和行动空间。 三,效用(Utility):也就是博弈者之间相互争夺的利益。博弈双方或多方都是围绕一定利益展开的,因此博弈胜负的评判结果主要是靠策略选择后的得失来衡量。 四,次序(Orders):即各博弈方在决策时有先后之分,因为博弈方在决策选择上要不时地调整改善,一定要十分注重次序轻重的问题。如果决策的次序和实施时间不同,则博弈的结果必会有所差别。 五,博弈均衡:博弈虽然是为了利益和胜利,但并非是利益尽占,而是要遵循均衡理论。 四、二人博弈有何特点? 答:双人博弈(即有且只有两个参与人的博弈,称为双人博弈),有如下一些特点∶ 1.两参与人之间的关系并不总是相互对抗的,有时会出现利益一致的情况; 2.信息多的一方不能保证得益也较多; 3.个人理性并不一定导致集体理性。 五、如何理解完全信息与不完全信息,完美信息与不完美信息?

(数学建模教材)7第七章对策论

第七章 对策论 §1 引言 社会及经济的发展带来了人与人之间或团体之间的竞争及矛盾,应用科学的方法来 解决这样的问题开始于 17 世纪的科学家,如 C.,Huygens 和 W.,Leibnitz 等。现代对 策论起源于 1944 年 J.,V on Neumann 和 O.,Morgenstern 的著作《Theory of Games and Economic Behavior 》。 对策论亦称竞赛论或博弈论。是研究具有斗争或竞争性质现象的数学理论和方法。 一般认为,它既是现代数学的一个新分支,也是运筹学中的一个重要学科。对策论发展 的历史并不长,但由于它所研究的现象与人们的政治、经济、军事活动乃至一般的日常 生活等有着密切的联系,并且处理问题的方法又有明显特色。所以日益引起广泛的注意。 在日常生活中,经常看到一些具有相互之间斗争或竞争性质的行为。具有竞争或对 抗性质的行为称为对策行为。在这类行为中。参加斗争或竞争的各方各自具有不同的目 标和利益。为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并 力图选取对自己最为有利或最为合理的方案。对策论就是研究对策行为中斗争各方是否 存在着最合理的行动方案,以及如何找到这个合理的行动方案的数学理论和方法。 §2 对策问题 对策问题的特征是参与者为利益相互冲突的各方,其结局不取决于其中任意一方的 努力而是各方所采取的策略的综合结果。 先考察一个实际例子。 例 1(囚徒的困境) 警察同时逮捕了两人并分开关押,逮捕的原因是他们持有大 量伪币,警方怀疑他们伪造钱币,但没有找到充分证据,希望他们能自己供认,这两个 人都知道:如果他们双方都不供认,将被以持有大量伪币罪被各判刑 18 个月;如果双 方都供认伪造了钱币,将各被判刑 3 年;如果一方供认另一方不供认,则供认方将被从 宽处理而免刑,但另一方面将被判刑 7 年。将嫌疑犯 A 、 B 被判刑的几种可能情况列 于表 1。 表 1 表 1 中每对数字表示嫌疑犯 A 、B 被判刑的年数。如果两名疑犯均担心对方供认并希 望受到最轻的惩罚,最保险的办法自然是承认制造了伪币。 从这一简单实例中可以看出对策现象中包含有的几个基本要素。 2.1 对策的基本要素 (i )局中人 在一个对策行为(或一局对策)中,有权决定自己行动方案的对策参加者,称为局 中人。通常用 I 表示局中人的集合.如果有 n 个局中人,则 I = {1,2,L , n }。一般要求 一个对策中至少要有两个局中人。在例 1 中,局中人是 A 、B 两名疑犯。 (ii )策略集 一局对策中,可供局中人选择的一个实际可行的完整的行动方案称为一个策略。参 加对策的每一局中人 i , i ∈ I ,都有自己的策略集 S i 。一般,每一局中人的策略集中 至少应包括两个策略。 -154- 嫌疑犯 B 供认 不供认 嫌疑犯 A 供认 不供认 (3,3) (0,7) (7,0) (1.5,1.5)

博弈论复习题及标准答案

囚徒困境说明个人的理性选择不一定是集体的理性选择。(√) 子博弈精炼纳什均衡不是一个纳什均衡。(×) 若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。( ) 博弈中知道越多的一方越有利。( ×) 纳什均衡一定是上策均衡。(×) 上策均衡一定是纳什均衡。(√) 在一个博弈中只可能存在一个纳什均衡。(×) 在一个博弈中博弈方可以有很多个。(√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。 (√ ) 在博弈中纳什均衡是博弈双方能获得的最好结果。(×) 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(×)上策均衡是帕累托最优的均衡。 (×) 因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。 (×) 在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×) 在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(√ ) 不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√ ) 多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(√) 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t

博弈论基础复习

《博弈论基础》主要知识点 一、名词解释(5×2=10分) 策略型博弈它是由三个部分组成,即局中人、策略和各种策略组合中所得到的利益。 纳什均衡指参与博弈的每一局中人在给定其他局中人策略的条件下选择上策所构成的一种策略组合。 混合策略局中人的混合策略是其纯策略空间上的一种概率分布,表示局中人实际博弈时根据这种概率分布在纯策略中随机选择加以实施。 扩展型博弈博弈存在着局中人行动的先后次序,是对具有动态结构的决策形式进行研究的规范分析工具。 博弈树对于任何一种双人完备博弈,都可以用一个博弈树来描述,并通过博弈树搜索策略寻找最佳解。博弈树类似于状态图和问题求解搜索中使用的搜索树。 完美信息博弈是指一次只有一个局中人在行动,而且他在行动时知道博弈的所有以往行动历史的一类特殊博弈。 子博弈指由原扩展型博弈中的一个决策节点与它的所有后续节点组成的博弈。行为策略是指每一个参与人在每一个信息集上随机的选择行动。 逆向归纳法逆向归纳法是求解子博弈精炼纳什均衡的最简便方法。在求解子博弈精炼纳什均衡时,从最后一个子博弈开始逆推上。 冷酷策略又称触发策略。指参与人在开始时选择合作,在接下来的博弈中,如果对方合作则继续合作,而如果对方一旦背叛,则永远选择背叛,永不合作。 类型 :一般地,将一个参与人所拥有的所有私人信息称为他的类型。 信号博弈是研究具有信息传递作用的信号机制的一般博弈模型,其基本特征是两个博弈方,分别称为信号发出方和信号接收方。 分离均衡信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者以概率1选择不同的信号,接收者完全可以通过信号来准确判断出发送者的类型。 混同均衡信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者选择了相同的信号,接收者无法从信号中得到新的信息,无法对先验信念进行修正。 特征函数特征函数型博弈对每一种可能联盟给出相应的联盟总和收益,也就是给出了一种集合函数,称为特征函数。 联盟

博弈论谢识予第四五章参考标准答案

博弈论谢识予第四五章参考答案

————————————————————————————————作者:————————————————————————————————日期: 2

第四章参考答案 2、火车站和机场餐饮商业服务的顾客往往都是一次性的,回头客、常客比较少,这些经济交易具有一次性博弈的特征,它们的价格总是较高而质量又会差一些,顾客也会尽量不在这些地方购买商品和消费。在一般商业区和居民区的餐饮商业服务则回头客和常客较多,有明显的重复博弈特征,在居民区购买商品和消费的老顾客一般能得到比较公平、优惠的价格,还能得到较好的服务,甚至有些还可以信用消费(赊账),因此消费者一般会比较放心地消费。这就是现实生活中重复博弈和一次性博弈效率不同的典型例子之一。 3、从研究对象和问题特征看,有限次重复博弈研究的主要是有明确结束时间的(合作、竞争等)关系,无限次重复博弈研究的主要是没有明确结果时间,或者较长期的关系。 从分析方法的角度,动态博弈和重复博弈分析中常用的逆推归纳法在无限次 16 重复博弈中无法直接运用,因为没有最后一次重复。因此无限次重复博弈分析的主要方法是构造法,即根据特定效率意义等构造了博弈完美纳什均衡。此外,也可以运用某些技巧解决问题,如教材中利用三阶段讨价还价博弈分析无限阶段讨价还价博弈的技巧。 从博弈的结果看,无限次重复博弈的效率往往高于有限次重复博弈,有些在有限次重复博弈中无法实现的效率较高的结果,在无限次重复博弈中有可能实现。例如囚徒的困境型博弈的无限次重复博弈和有限次重复博弈就体现了这种差别。两类重复博弈民间定理的差异也说明了这一点。 最后,在重复次数不多的有限次重复博弈中不一定要考虑得益贴现问题,在我限次重复博弈问题中这是必须考虑的。 上述区别在理论方面最主要的启发是重视有限次和无限次重复博弈的区别,区分研究这两类博弈问题是非常重要的,在实践方面的主要启发是促进和保持经济关系的长期稳定性,对于提高社会经济效率等常常有非常重要的意义。6、用画线法容易找出该博弈的两个纯策略纳什均衡(T,L)和(M,R)。这两个纳什均衡的得益都帕累托劣于(B,S)。一次性博弈中效率较高的(B,S)不可能实现。但该博弈的结构表明存在双方合作的利益,在两次重复博弈中也有构造惩罚机制的条件,因此我会考虑运用试探合作的触发策略争取部分实现(B,S),提高博弈的效率。 我作为博弈方1会采用这样的触发策略:第一次重复采用B;第二次重复时,如果前一次的结果是(B,S),则采用M,如果前一次的结果是其他,则采用T。 如果另一个博弈方有同样的分析能力,或者比较有经验,那么他(或她)也会采用相似的触发策略:在第一次重复时采用S;第二次重复时,如果前一次的结果是(B,S),则采用R,否则采用L。 双方采用上述触发策略构成一个子博弈完美纳什均衡,因此是稳定的。这时候前一次重复实现了(B,S),提高了博弈的效率。 当然,上述触发策略也是有风险的,因为当另一个博弈方不理解和没有采用上述策略时,我的得益会较低。当然如果考虑到人们具有学习进步的能力,而且缺乏分析和学习能力,采用效率较低策略的博弈方长期中会逐步被淘汰掉,那么采用上述触发策略的合理性就得到了进一步的支持。

经济博弈论第1次作业

博弈论第1次作业 1、两个人分4只乒乓球,每个人同时独立地提出自己想得到的球数。设参与人1想得到s 1只,参与人2想得到s 2只球,分配的规则是:如果s 1 + s 2 ≤4,那么每个参与人均能得到自己想要的数量;如果s 1 + s 2 >4,那么两个参与人什么也得不到。 (1)写出参与人1,2的战略空间S 1,S 2; (2)画出该博弈的双变量收益矩阵; (3)用划线法找出该博弈的全部纯战略纳什均衡。 2、精神病医生A 、B 同时在一条很长的公路边选择各自的诊所位置,这条公路用从0到1的区间表示。公路0到1/4这个区间属于俄勒冈州,从1/4到1这个区间属于加利福尼亚州。医生A (参与人1)同时拥有俄勒冈州和加利福尼亚州的行医执照,而医生B (参与人2)只有俄勒冈州的行医执照。假设病人沿这条公路是均匀分布的,每个病人都就近看病,每个医生的收益就是到他诊所就诊的病人比例。设医生A (参与人1)的战略空间(选择诊所的位置)为{}10,1/8,1/4,3/8,1/2,5/8,3/4,7/8,1 S =;医生B (参与人2)的战略空间为{}20,1/8,1/4S =。 (1) 试画出博弈的双变量收益矩阵; (2) 利用划线法找出该博弈的纯战略纳什均衡。 3、在下图所示的战略式表述的博弈中,有没有占优战略均衡?有没有重复剔除严格劣战略的占优均衡?有没有纳什均衡?如果有,请写出相应的均衡。 参与人2 参与人1 L M R U M D 4、下图是两人博弈的战略式表述形式,其中参与人1的战略空间S 1={U,D},参与人2的战略空间S 2={L,R}。

参与人2 L M 参与人1 U D 这里a ,b ,c ,d ,e ,f ,g ,h 为参数。 (1) 设S*=(U,L )是此博弈的严格占优战略均衡,问:上述参数之间应满 足哪些条件? (2) 设S*=(U,R )是此博弈的重复剔除严格劣战略的占优均衡,问:上述 参数之间应满足哪些条件?(用两种剔除顺序讨论) (3) 设S*=(D ,R )是此博弈的纳什均衡,问:上述参数之间应满足哪些 条件? (4) 设S 1*=(U ,L )和S 2*=(D ,R )是此博弈的纳什均衡,问:上述参数 之间应满足哪些条件?这时两个参与人有无严格劣战略? 5、求下图所示战略式表述的博弈的混合战略纳什均衡。 参与人2 L R 参与人1 U D 6 B A L R U D 7、A 、B A 企业可以获得18万元利润,B 企业可以获得10万元利润;若A 企业做广告,B 企业不做广告,A 企业可以获得30万元利润,B 企业可以获得4万元利润;若A 企业不做广告,B 企业做广告,A 企业可以获得13万元利润,B 企业可以获得16万元利润;若A 、B 两企业都不做广告,A 企业可以获得35万元利润,B 企业可以获得8万元利润。 试求:(1)画出A 、B 企业的支付矩阵。(2)求出该博弈的纯策略纳什均衡。 8、两个厂商生产一种完全同质的商品,该商品的市场需求函数为P Q -=100,设厂商1和厂商2都没有固定成本。若他们在相互知道对方边际成本的情况下,同时作出产量决策是分别生产20单位和30单位。问这两个厂商的边际成本各是多少?各自的利润是多少?

博弈论习题及参考答案

《博弈论》习题 一、单项选择题1.博弈论中,局中人从一个博弈中得到的结果常被称为()。 A. 效用 B. 支付 C. 决策 D. 利润 2.博弈中通常包括下面的内容,除了()。 A.局中人 B.占优战略均衡 C.策略 D.支付 3.在具有占优战略均衡的囚徒困境博弈中()。 A.只有一个囚徒会坦白 B.两个囚徒都没有坦白 C.两个囚徒都会坦白 D.任何坦白都被法庭否决了 4.在多次重复的双头博弈中,每一个博弈者努力()。 A.使行业的总利润达到最大 B.使另一个博弈者的利润最小 C.使其市场份额最大 D.使其利润最大 5.一个博弈中,直接决定局中人支付的因素是()。 A. 策略组合 B. 策略 C. 信息 D. 行动 6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时的博弈具有()。 A.囚徒困境式的均衡 B.一报还一报的均衡 C.占优策略均衡 D.激发战略均衡 7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的策略称为()。 A.一报还一报的策略 B.激发策略 C.双头策略 D.主导企业策略 8.在囚徒困境的博弈中,合作策略会导致()。 博弈双方都失败 B.博弈双方都获胜A. C.使得先采取行动者获胜 D.使得后采取行动者获胜 9.在什么时候,囚徒困境式博弈均衡最可能实现()。 A. 当一个垄断竞争行业是由一个主导企业控制时 B.当一个寡头行业面对的是重复博弈时 C.当一个垄断行业被迫重复地与一个寡头行业博弈时 D. 当一个寡头行业进行一次博弈时 10.一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种策略是一种()。 A.主导策略 B.激发策略 C.一报还一报策略 D.主导策略 11.关于策略式博弈,正确的说法是()。 A. 策略式博弈无法刻划动态博弈

博弈论谢识予第四五章参考答案

第四章参考答案 2、火车站和机场餐饮商业服务的顾客往往都是一次性的,回头客、常客比较少,这些经济交易具有一次性博弈的特征,它们的价格总是较高而质量又会差一些,顾客也会尽量不在这些地方购买商品和消费。在一般商业区和居民区的餐饮商业服务则回头客和常客较多,有明显的重复博弈特征,在居民区购买商品和消费的老顾客一般能得到比较公平、优惠的价格,还能得到较好的服务,甚至有些还可以信用消费(赊账),因此消费者一般会比较放心地消费。这就是现实生活中重复博弈和一次性博弈效率不同的典型例子之一。 3、从研究对象和问题特征看,有限次重复博弈研究的主要是有明确结束时间的(合作、竞争等)关系,无限次重复博弈研究的主要是没有明确结果时间,或者较长期的关系。 从分析方法的角度,动态博弈和重复博弈分析中常用的逆推归纳法在无限次 16 重复博弈中无法直接运用,因为没有最后一次重复。因此无限次重复博弈分析的主要方法是构造法,即根据特定效率意义等构造了博弈完美纳什均衡。此外,也可以运用某些技巧解决问题,如教材中利用三阶段讨价还价博弈分析无限阶段讨价还价博弈的技巧。 从博弈的结果看,无限次重复博弈的效率往往高于有限次重复博弈,有些在有限次重复博弈中无法实现的效率较高的结果,在无限次重复博弈中有可能实现。例如囚徒的困境型博弈的无限次重复博弈和有限次重复博弈就体现了这种差别。两类重复博弈民间定理的差异也说明了这一点。 最后,在重复次数不多的有限次重复博弈中不一定要考虑得益贴现问题,在我限次重复博弈问题中这是必须考虑的。 上述区别在理论方面最主要的启发是重视有限次和无限次重复博弈的区别,区分研究这两类博弈问题是非常重要的,在实践方面的主要启发是促进和保持经济关系的长期稳定性,对于提高社会经济效率等常常有非常重要的意义。 6、用画线法容易找出该博弈的两个纯策略纳什均衡(T,L)和(M,R)。这两个纳什均衡的得益都帕累托劣于(B,S)。一次性博弈中效率较高的(B,S)不可能实现。但该博弈的结构表明存在双方合作的利益,在两次重复博弈中也有构造惩罚机制的条件,因此我会考虑运用试探合作的触发策略争取部分实现(B,S),提高博弈的效率。 我作为博弈方1会采用这样的触发策略:第一次重复采用B;第二次重复时,如果前一次的结果是(B,S),则采用M,如果前一次的结果是其他,则采用T。如果另一个博弈方有同样的分析能力,或者比较有经验,那么他(或她)也会采用相似的触发策略:在第一次重复时采用S;第二次重复时,如果前一次的结果是(B,S),则采用R,否则采用L。 双方采用上述触发策略构成一个子博弈完美纳什均衡,因此是稳定的。这时候前一次重复实现了(B,S),提高了博弈的效率。 当然,上述触发策略也是有风险的,因为当另一个博弈方不理解和没有采用上述策略时,我的得益会较低。当然如果考虑到人们具有学习进步的能力,而且缺乏分析和学习能力,采用效率较低策略的博弈方长期中会逐步被淘汰掉,那么采用上述触发策略的合理性就得到了进一步的支持。

《经济博弈论》期末考试复习资料

《经济博弈论》期末考试复习资料 第一章导论 1.博弈的概念: 博弈即一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,并从中各自取得相应结果的过程。它包括四个要素:参与者,策略,次序和得益。 2.一个博弈的构成要素: 博弈模型有下列要素:(1)博弈方。即博弈中决策并承但结果的参与者.包括个人或组织等:(2)策略。即博弈方决策、选择的内容,包括行为取舍、经济活动水平或多种行为的特定组合等。各博弈方的策略选择范围称策略空间。每个博弈方各选一个策略构成一个策略组合。(3)进行博弈的次序:次序不同一般就是不同的博弈,即使博弈的其他方面都相同。(4)得益。各策略组合对应的各博弈方获得的数值结果,可以是经济利益,也可以是非经济利益折算的效用等。 3.合作博弈和非合作博弈的区别: 合作博弈:允许存在有约束力协议的博弈;非合作博弈:不允许存在有约束力协议的博弈。主要区别:人们的行为互相作用时,当事人能否达成一个具有约束力的协议。 假设博弈方是两个寡头企业,如果他们之间达成一个协议,联合最大化垄断利润,并且各自按这个协议生产,就是合作博弈。 如果达不成协议,或不遵守协议,每个企业都只选择自己的最优产品(价格),则是非合作博弈。 合作博弈:团体理性(效率高,公正,公平) 非合作博弈:个人理性,个人最优决策(可能有效率,可能无效率) 4.完全理性和有限理性: 完全理性:有完美的分析判断能力和不会犯选择行为的错误。 有限理性:博弈方的判断选择能力有缺陷。 区分两者的重要性在于如果决策者是有限理性的,那么他们的策略行为和博弈结果通常与在博弈方有完全理想假设的基础上的预测有很大差距,以完全理性为基础的博弈分析可能会失效。所以不能简单地假设各博弈方都完全理性。 5.个体理性和集体理性: 个体理性:以个体利益最大为目标;集体理性:追求集体利益最大化。 第一章课后题:2、4、5 2.设定一个博弈模型必须确定哪几个方面? 设定一个博弈必须确定的方面包括:(1)博弈方,即博弈中进行决策并承担结果的参与者;(2)策略(空间),即博弈方选择的内容,可以是方向、取舍选择,也可以是连续的数量水平等;(3)得益或得益函数,即博弈方行为、策略选择的相应后果、结果,必须是数量或者能够折算成数量;(4)博弈次序,即博弈方行为、选择的先后次序或者重复次数等;(5)信息结构,即博弈方相互对其他博弈方行为或最终利益的了解程度;(6)行为逻辑和理性程度,即博弈方是依据个体理性还是集体理性行为,以及理性的程度等。

博弈论复习题及答案

一、名词解释(每题7分,共28分) 1、逆向选择:逆向选择源于事前的信息不对称,经典例子就是“柠檬市场”——二手车市场,它使得市场资源逐渐流向低质量的产品或要素,最后形成劣货驱逐良货的局面,这种现象称之为“逆向选择”。 2、策略互动:所谓策略互动,就是参与人之间的策略相互影响、相互作用和相互制约。用策略性思维来分析问题,从中找出合理策略,实现目标最优。 3、纳什均衡:对于博弈方而言,互为最优的策略选择就是纳什均衡。 4、信号发送:是指信息优势方不断发出信息的行为,就叫信号发送。 5、博弈论:研究人们如何进行决策,以及这种决策如何达到均衡(合理策略)的问题。每个博弈者在决定采取何种行动时,不但要根据自身的利益和目的行事,还必须考虑到他的决策行为对其他人的可能影响,以及其他人的反应行为的可能后果,通过选择最佳行动计划,来寻求收益或效用的最大化。 二、简要回答问题(每题10分,共40分) 1、博弈的基本要素有哪些?基本特点是什么? 答:博弈的基本要素有:参与人、策略、行动顺序、信息、收益等五个要素。博弈的基本特点则是需尽可能考虑到博弈对方的决策选择以及对自身的影响,并从中选择出对自身最有利的方案决策,从而达到收益和效用最大化。 2、什么是性别战博弈?请求出其中的纳什均衡? 答:性别战博弈是不可调和的博弈,双方只有一方选择满足另外一方的要求才能达成均衡,也就是混合策略纳什均衡;故性别战博弈的纳什均衡会有两种情况,分别是:男生陪女生看电影以及女生陪男生看足球的两种选择。 3、猎鹿博弈反映的基本思想是什么? 答:反应的基本思想是需要沟通和互相协调,因为只有合作才能猎到所需猎物。

博弈论基础作业及答案

博弈论基础作业及答案Last revision on 21 December 2020

博弈论基础作业 一、名词解释 纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡 贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识 见PPT 二、问答题 1.举出囚徒困境和智猪博弈的现实例子并进行分析。 囚徒困境的例子:军备竞赛;中小学生减负;几个大企业之间的争相杀价等等; 以中小学生减负为例:在当前的高考制度下,给定其他学校对学生进行减负,一个学校最好不减负,因为这样做,可以带来比其他学校更高的升学率。给定其他学校不减负,这个学校的最佳应对也是不减负。否则自己的升学率就比其他学校低。因此,不论其他学校如何选择,这个学校的最佳选择都是不减负。每个学校都这样想,所以每个学校的最佳选择都是不减负,因此学生的负担越来越重。 请用同样的方法分析其他例子。 智猪博弈的例子:大企业开发新产品;小企业模仿;股市中,大户搜集分析信息,散户跟随大户的操作策略 以股市为例:给定散户搜集资料进行分析,大户的最佳选择是跟随。而给定散户跟随,大户的最佳选择是自己搜集资料进行分析。但是不论大户是选择分析还是跟随,散户的最佳选择都是跟随。因此如果大户和散户是聪明的,并且大户知道散户也是聪明的,那么大户就会预见到散户会跟随,而给定散户跟随,大户只有自己分析。 请用同样的方法分析其他例子。 2.请用博弈论来说明“破釜沉舟”和“穷寇勿追”的道理。 破釜沉舟是一个承诺行动。目的是要断绝自己的退路,让自己无路可退,让自己决一死战变得可以置信。也就是说与敌人对决时,只有决一死战,这样才可以取得胜利。否则,如果不破釜沉舟,那么遇到困难时,就很有可能退却,也就无法取得胜利。穷寇勿追就是要给对方一个退路,由于有退路,对方就不会殊死抵抗。否则,对方退无可退,只有坚决抵抗一条路,因而必然决一死战。自己也会付出更大的代价。

博弈论的基础知识与应用

博弈论的基础知识与应用(转) 1 基础知识 博弈论是一种独特的处于各学科之间的研究人类行为的方法。与博弈论有关的学科包括数学、经济学以及其他社会科学和行为科学。博弈论(如同计算科学理论和许多其他的贡献一样)是由约翰.冯.诺伊曼(John von Neumann)创立的。博弈论领域第一本重要著作是诺伊曼与另一个伟大的数理经济学家奥斯卡.摩根斯坦(Oskar Morgenstern)共同写成的《博弈论与经济行为》(The Theory of Games and Economic Behavior)。当然,摩根斯坦把新古典经济学的思想带入了合作中,但是诺伊曼也同样意识到那些思想并对新古典经济学做出了其他的贡献。 ■一个科学的隐喻 由于诺伊曼的工作,在更广阔的人类行为互动的范围内,“博弈”成为了一个科学的隐喻。在人类的互动行为中,结局依赖于两个或更多的人们所采取的交互式的战略,这些人们具有相反的动机或者最好的组合动机(mixed motives)。在博弈论中常常讨论的问题包括:1)当结局依赖于其他人所选择的战略以及信息是完全的时候,“理性地”选择战略意味着什么? 2)在允许共同得益或者共同损失的“博弈”中,寻求合作以实现共同得益(或避免共同损失)是否“理性”?或者,采取侵略性的行动以寻求私人利益而不顾共同得益或共同损失,这是否是“理性”的? 3)如果对2)的回答是“有时候是”,那么在什么样的环境下侵略是理性的,在什么样的情况下合作是理性的? 4)在特定情况下,正在持续的关系与单方退出这种关系是不同的吗? 5)在理性的自我主义者的行为互动中,合作的道德规则可以自然而然地出现吗? 6)在这些情况下,真正的人类行为与“理性”行为是否相符? 7)如果不符,在那些方面不符?相对于“理性”,人们更倾向于合作?或者更倾向于侵略?抑或二者皆是? 因而,博弈论研究的“博弈”包括: 破产 门口的野蛮人(Barbarians at the Gate) 网络战(Battle of the Networks) 货物出门,概不退换(Caveat Emptor) 征召(Conscription) 协调(Coordination) 逃避(Escape and Evasion) 青蛙呼叫配偶(Frogs Call for Mates) 鹰鸽博弈(Hawk versus Dove) Mutually Assured Destruction 多数决定原则(Majority Rule) Market Niche 共同防卫(Mutual Defense) 囚徒困境(Prisoner’s Dilemma) 补贴小商业Subsidized Small Business 公共地悲剧Tragedy of the Commons 最后通牒Ultimatum

博弈论第四章习题

第四章习题 一、如果T次重复齐威王田忌赛马,双方在该重复博弈中的策略是什么?博弈结果如何? 答:因为这是零和博弈,结论比较具体。重复Nash 均衡,均以1/6的概率选择各个策略,期望收益分别为1和-1。 因为这是竞争性的零和博弈,无论是有限次重复博弈还是无限次的重复博弈,均不能达成合作的条件。 二、举出现实生活中的一个重复博弈与一次性博弈效率不同的例子。 答:火车站和机场餐饮业的服务的顾客往往是一次性的,回头客和常客也比较少,价格高,质量差,一次性博弈。效率也比较低。 商业区和居民区的餐饮业和商业服务业,回头客和常客比较多,比较注重信誉,质优、价廉,重复博弈。效率也比较高。 三、有限次重复博弈和无限次重复博弈有什么区别?这些区别对我们有什么启发?

答:动态博弈的逆向归纳法可以用于有限次重复博弈,但不能用于无限次重复博弈,主要用逆向归纳法。 无限次重复博弈的效率往往高于有限次重复博弈。当重复次数较少不一定考虑贴现问题,但无限次重复博弈必须考虑贴现问题。 启发:重视有限次与无限次的区别,区分和研究这两类博弈,在实践方面重要启发是促进和保持经济的长期稳定和可持续发展,提高社会经济效率是非常有意义的。 四、判断下列表述是否正确,并作简单讨论: (1)有限次重复博弈的子博弈完美纳什均衡每次重复采用的都是原博弈的纳什均衡。 答:不一定。对于有两个以上纯策略纳什均衡的条件下就不一定。如“触发策略”就不是。 (2)有限次重复博弈的子博弈完美纳什均衡的最后一次重复必定是原博弈的一个纳什均衡。 答:是,根据子博弈完美纳什均衡的要求,最后一次必须是原博弈的一个纳什均衡。 (3)无限次重复博弈均衡解的得益一定优于原博

博弈论第七章习题复习课程

博弈论第七章习题

第七章习题 一、判断下列表述是否正确,并作简单分析 (1)海萨尼转换可以把不完全信息静态博弈转换为不完美信息博弈,说明有了海萨尼转换,不完全信息静态博弈和一般的不完美信息动态博弈是等同的,不需要另外发展分析不完全信息静态博弈的专门分析方法和均衡概念。 答:错误。即使海萨尼转换把不完全信息静态博弈转换为不完美信息动态博弈,也是一种特殊的有两个阶段同时选择的不完美信息动态博弈,对这种博弈的分析进行专门讨论和定义专门均衡的概念有利于提高分析的效率。 (2)完全信息静态博弈中的混合策略可以被解释成不完全信息博弈的纯策略贝叶斯纳什均衡。 答:正确。完全信息静态博弈中的混合策略博弈几乎总是可以解释成一个有少量不完全信息的近似博弈的一个纯策略Bayes—Nash均衡。夫妻之争的混合策略Nash均衡可以用不完全信息夫妻之争博弈的Bayes—Nash均衡表示就是一个例证。 (3)证券交易所中的集合竞价交易方式本质上就是一种双方报价拍卖。 答:正确。我国证券交易中运用的集合竞价确定开盘价的方式就是一种双方报价拍卖。与一般双方报价拍卖的区别只是交易对象,标的不是一件而是有许多件。 (4)静态贝叶斯博弈中之所以博弈方需要针对自己的所有可能类型,都设定行为选择,而不是只针对实际类型设定行为选择,是因为能够迷惑其他博弈方,从而可以获得对自己更有利的均衡。 答:错误。不是因为能够迷惑其他博弈方,而是其他博弈方必然会考虑这些行为选择并作为他们行为选择的依据。因为只根据实际类型考虑行为选择就无法判断其他博弈方的策略,从而也就无法找出自己的最优策略。其实,在这种博弈中一个博弈方即使自己不设定针对自己所有类型的行为选

博弈论 课后习题答案

博弈论课后习题答案 第四部分课后习题答案 1. 参考答案: 括号中的第一个数字代表乙的得益,第二个数字代表甲的得益,所以a表示乙 的得益,而b表示甲的得益。 在第三阶段,如果,则乙会选择不打官司。这时逆推回第二阶段,甲会选择 a,0 不分,因为分的得益2小于不分的得益4。再逆推回第一阶段,乙肯定会选择 不借,因为借的最终得益0比不借的最终得益1小。 在第三阶段,如果,则乙轮到选择的时候会选择打官司,此时双方得益是 (a,b)。a,0 逆推回第二阶段,如果,则甲在第二阶段仍然选择不分,这时双方得益为 (a,b)。b,2 在这种情况下再逆推回第一阶段,那么当时乙会选择不借,双方得益(1,0), 当a,1 时乙肯定会选择借,最后双方得益为(a,b)。在第二阶段如果,则甲会选择 a,1b,2分,此时双方得益为(2,2)。再逆推回第一阶段,乙肯定会选择借,因为 借的得益2大于不借的得益1,最后双方的得益(2,2)。 根据上述分析我们可以看出,该博弈比较明确可以预测的结果有这样几种情况: (1),此时本博弈的结果是乙在第一阶段不愿意借给对方,结束博弈,双方a,0 得益 (1,0),不管这时候b的值是多少;(2),此时博弈的结果仍然012,,,ab且

是乙在第一阶段选择不借,结束博弈,双方得益(1,0);(3),此时博ab,,12 且弈的结果是乙在第一阶段选择借,甲在第二阶段选择不分,乙在第三阶段选择打,最后结果是双方得益 (a,b);(4),此时乙在第一阶段会选择借,甲在第二阶段会选择分,ab,,02且双方得益(2,2)。 要本博弈的“威胁”,即“打”是可信的,条件是。要本博弈的“承诺”,即a,0 “分”是可信的,条件是且。 a,0b,2 注意上面的讨论中没有考虑a=0、a=1、b=2的几种情况,因为这些时候博弈方的选择很难用理论方法确定和预测。不过最终的结果并不会超出上面给出的范围。 2. 参考答案: 静态贝叶斯博弈中博弈方的一个策略是他们针对自己各种可能的类型如何作相应的完整计划。或者换句话说,静态贝叶斯博弈中博弈方的策略就是类型空间到行为空间的一个函数,可以是线性函数,也可以是非线性函数,当博弈方的类型只有有限几种时是离散函数,当博弈方的类型空间是连续区间或空间时则是连续函数。只有一种类型的博弈方的策略仍然是一种行为选择,但我们同样可以认为是其类型的函数。 静态贝叶斯博弈中博弈方的策略之所以必须是针对自己所有可能类型的函数,原因是博弈方相互会认为其他博弈方可能属于每种类型,因此会考虑其他博弈方所有可能类型下的行为选择,并以此作为自己行为选择的根据。因此各个博弈方必须设定自己在所有各种可能类型下的最优行为,而不仅仅只考虑针对真实类型的行为选择。 3. 参考答案:

博弈论基础作业及答案

博弈论基础作业 一、名词解释 纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡 贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识 见PPT 二、问答题 1.举出囚徒困境和智猪博弈的现实例子并进行分析。 囚徒困境的例子:军备竞赛;中小学生减负;几个大企业之间的争相杀价等等; 以中小学生减负为例:在当前的高考制度下,给定其他学校对学生进行减负,一个学校最好不减负,因为这样做,可以带来比其他学校更高的升学率。给定其他学校不减负,这个学校的最佳应对也是不减负。否则自己的升学率就比其他学校低。因此,不论其他学校如何选择,这个学校的最佳选择都是不减负。每个学校都这样想,所以每个学校的最佳选择都是不减负,因此学生的负担越来越重。 请用同样的方法分析其他例子。 智猪博弈的例子:大企业开发新产品;小企业模仿;股市中,大户搜集分析信息,散户跟随大户的操作策略 以股市为例:给定散户搜集资料进行分析,大户的最佳选择是跟随。而给定散户跟随,大户的最佳选择是自己搜集资料进行分析。但是不论大户是选择分析还是跟随,散户的最佳选择都是跟随。因此如果大户和散户是聪明的,并且大户知道散户也是聪明的,那么大户就会预见到散户会跟随,而给定散户跟随,大户只有自己分析。 请用同样的方法分析其他例子。 2.请用博弈论来说明“破釜沉舟”和“穷寇勿追”的道理。 破釜沉舟是一个承诺行动。目的是要断绝自己的退路,让自己无路可退,让自己决一死战变得可以置信。也就是说与敌人对决时,只有决一死战,这样才可以取得胜利。否则,如果不破釜沉舟,那么遇到困难时,就很有可能退却,也就无法取得胜利。穷寇勿追就是要给对方一个退路,由于有退路,对方就不会殊死抵抗。否则,对方退无可退,只有坚决抵抗一条路,因而必然决一死战。自己也会付出更大的代价。