当前位置：搜档网 › 论博弈论中的策略思维

论博弈论中的策略思维

李凌王翔

(上海社会科学院经济研究所 200020) (上海师范大学金融学院 200234)

内容摘要:本文从博弈论的起源谈起,简要回顾了博弈论在诺贝尔经济学奖上取得的成就及其同真实生活之间的联系,从合作、模仿、创新、拍卖、战争和群居等实例表明博弈论中的策略思维是如何影响人们的行为的,又是如何使得博弈达到均衡的。同时,围绕策略思维的批判也不断完善着博弈论自身的分析范式,从传统博弈论向演化博弈论的转向昭示着理论演进的动力、方向和多学科研究的广阔前景。

关键词:博弈论策略思维诺贝尔经济学奖

中图分类号:F224.32 文献标识码:A 文章编号:1005-1309(2010)01-0035-007

博弈论源于历史上一些颇为有趣的游戏,但同时也是一门学问艰深的理论。博弈论在经济活动方面的研究可追溯到1944年美国数学家冯诺依曼(John V on N eu m ann)和美国经济学家摩根斯坦(OskarM orgenstern)合著的博弈论与经济行为!(?Theory o fGa m es and Econo m ic B ehavior#),书中描述了经济主体的行为特征,提出了单人博弈、双人博弈和多人博弈等基本模型,包含了丰富的策略思维和博弈的解概念,构建了一个完备的用数学和逻辑学描述经济科学的理论体系及方法论基础,有些命题如讨价还价,至今仍是博弈论研究前沿的热点问题。二战后,纳什(John F.Nash Jr.)、泽尔腾(R einhard Se lten)和海萨尼(John H aisanyi)等人围绕博弈论的解概念不断进行精炼,并将其卓有成效地应用于理性经济人的行为分析,揭示了博弈论与经济均衡的内在联系,形成完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈和不完全信息动态博弈等传统博弈论的分析框架及其内在的相互转化,大量经济现象,如寡头竞争和产业垄断等都可以通过传统博弈论的分析框架得到合理预测,这三位学者也因此共同分享了1994年的诺贝尔经济学奖。然而,传统博弈论过分依赖共同知识和行为人理性的假设,现实中信息不对称现象对此提出了挑战。美国哥伦比亚大学的维克瑞(W illia m V ickrey)教授和英国剑桥大学的莫里斯(Ja m es A.M irrlees)教授首创了不对称信息条件下的激励经济理论,前者开创了拍卖理论而后者则是公共财政理论的先驱,他们由此荣膺1996年诺贝尔经济学奖;美国加利福尼亚大学伯克利分校的阿克洛夫(G eorge A.A lerlof)教授、斯坦福大学的斯宾塞(A.M ichael Spence)教授和哥伦比亚大学的斯蒂格利茨(Joseph E.Stig litz)教授,同样凭借在不对称信息市场方面作出的贡献,获得了2001年的诺贝尔经济学奖,同时也宣告信息经济学是一门在特定的信息结构下运用博弈论的科学。2005年度瑞典皇家科学院将诺贝尔经济学奖授予奥曼(Robert John Aum ann)和谢林(Tho m as Cro m b i e Schelli n g),以表彰他们通过博弈论的分析增强世人对合作与冲突的理解;2007年诺贝尔经济学奖授予赫维克兹(Leon i d H ur w icz)、普林斯顿大学的马斯金(E ric S.M ask i n)和芝加哥大学的梅尔森(Roger B.M yerson),以

收稿日期:2009-10-15

表彰他们在机制设计理论方面的开拓性工作,机制设计理论为博弈论的运用搭建了一个更加广阔的平台,同时与经济政策的关系也更为密切。至此,共有13位经济学家和数学家与诺贝尔经济学奖结下不解之缘。

那么博弈论为什么能在经济学领域产生如此巨大的影响呢?又何以在经济分析中独辟蹊径,形成了能与(随机)一般均衡理论相对立的另一种经济学研究范式?这恐怕还得益于博弈论的起源和其中蕴含的策略思维。博弈论从本质上讲是一种游戏理论,在给定游戏的特定规则(信息结构)下,游戏参与人要想赢得游戏就必须对其他参与人的心理和可能采取的行动进行反复揣摩,并据此决定和调整自己的行为,这就是制定策略或对策的过程。为此,?博弈论#一般也称为?对策论#或?游戏理论#。加之博弈论的游戏情节一般也源于人们的真实生活,是生活环境的抽象和概念化,因此,博弈的结果不仅仅是游戏胜败的表现,而且更是生活哲理的凝结,它为人们深刻理解和准确把握各类社会经济现象提供了一份独特的视角,同时对制定社会规则和经济政策具有现实的指导意义。

本文试图从一些常见的实例介绍和展示博弈论中策略思维的演进过程,这些实例都是我们能在生活中观察到的,并且假设读者已经具备一定的博弈论和拍卖理论的基础知识。

一、?囚徒困境#:合作还是不合作

考虑这样一种情形,小偷甲和乙联手作案,私入民宅被警方逮住,但未获证据。警方将两人分别置于两所房间分开审讯。若一人招供但另一人不招,则招供者立即释放,不招供者判入狱10年;若二人都招供则各判刑8年;若两人都不招供则因未获证据但私入民宅而各拘留1年(见表1)。试问甲和乙应该如何抉择自己的行为?理性行为人的想法是这样的:对甲来说,无论乙是选择?招#还是?不招#,选择?招#都会比选择?不招#来得更好。因此,?不招#是相对于?招#的严格劣策略,所以,甲会选择?招#。同理,根据对称性,乙也会选择?招#,于是纳什均衡解便是甲乙两人都招供,各判8年。这个例子表明,运用?剔除严格劣策略#的方法可以找到问题的均衡解。虽然甲乙两人都选择?不招#是集体最优的,但是这个结果不会出现,或者说,甲乙双方都存在偏离这一结果的激励,个体理性与集体理性之间存在着冲突。假设从两人都不招供出发,只要其中一人变卦,他就能谋取更多的利益。为此,即便甲乙两人都有不招供的约定在先,这样的约定也只能是?不可置信的承诺#而已,故而纳什均衡解具有内在稳定性。

表1囚徒困境博弈支付矩阵

招供不招供招供-8,-80,-10

不招供-10,0-1,-1 表2修路博弈支付矩阵

修不修修1,1-1,3

不修3,-10,0

下面我们让模型活动起来,也就是说,考虑甲乙两人刑满释放后重新作案,却又被警方逮住,重复上述过程,以此往复。这样的情形称为重复博弈,重复博弈的每次博弈称作阶段博弈。分析阶段博弈和分析一次性博弈的情形十分类似,理性行为人在行动前,依旧会根据各种方案收益与成本的比较,作出最优选择。但不可忽略的是,行为人过去的行为信息将作为共同知识影响行为人当下的决策。在囚徒困境的重复博弈中,有两种著名的策略,一种叫?冷酷#策略(gri m strategy),另一种叫?针锋相对#策略(tic for tac strategy)。所谓?冷酷#策略是指对于事先两人均不招供的攻守同盟,一旦有人招供,则对方在以后的任一阶段博弈中,都将选择招供,以示对对方违约的惩罚,对方也将丧失改正错误的机会;而?针锋相对#策略是指行为人在本阶段选择对方前一阶段的行为选择,相

对于?冷酷#策略,?针锋相对#策略允许行为人存在违约的激励,因而它不会是精炼均衡。模型表明合作潜在地具有?囚徒困境#的逻辑结构,因而我们可借此分析日常生活中的许多合作与不合作现象。

政府提供公共品便是极好的一例。设想有两户相邻的住户,需要一条好路从居住地通往公路。修一条路的成本为4,每个住户能从修好的路上获利为3。如果两家住户共同出资联合修路,并平均分摊修路成本,则每家住户获得净利为1;当只有一家住户单独出资修路时,修路者获利为-1,?搭便车#者,即不出资但仍可以使用修好的路的另一住户获利为3(不考虑产权问题)(见第36页表2)。通过?剔除严格劣策略#方法,可以得到,两家住户都不会出资修路。为了解决这条新路的建设问题,需要政府强制性地分别向每家征税2单位,然后投入4单位资金修路,并使两家住户都得到1单位的利益。这就是我们看到的为什么大多数路、桥等公共设施都是由政府出资修建的原因。同样的道理,国防、教育、社会保障,环境卫生等都由政府承担资金投入,而私人投资的积极性一般都不高。

?囚徒困境#重复博弈还能用来解释企业(或者银行和企业)之间的合作问题。当一次性违约的收益大于失信所必须付出的代价时,企业就存在偏离合同规定行事的激励。这种内生的激励表明,?损人利己#也是行为人的理性选择。如果企业之间致力于长期合作,就应当设法改变合作机制,降低合作企业发生机会主义行为的概率。除了健全社会诚信体系之外,一种行之有效的方法便是采取?冷酷#策略,以提高失信成本。然而传统博弈论对理性的极端认识又束缚了它对解释现实的能力,随着对供应链、企业联盟、虚拟企业和关系银行等中间性组织研究的不断深入,研究的重心逐步从对行为的约束转移到对关系契约的规范上,聚焦那些在合作中起关键作用的、可自我实施(se lf enforce m ent)的隐性契约。

二、智猪博弈:创新还是模仿

?囚徒困境#中参与人地位是对等的,如果参与人地位不对等,又会发生怎样的情况的呢?假设猪圈中有一头大猪和一头小猪,在猪圈的一端设有一个按钮,每按一下,位于猪圈另一端的食槽中就会有10单位的猪食进槽,但按一下按钮会耗去相当于2单位猪食的成本。如果大猪按钮取食,小猪在一旁等待,则大猪能吃到9单位食物而小猪仅能吃到1单位食物;如果两猪同时按钮取食,则大猪吃7单位,小猪吃3单位食物;如果小猪按钮取食,大猪在一旁等待,则大猪吃6单位而小猪吃4单位食物(见表3)。这个博弈没有?剔除劣策略均衡#,因为大猪没有劣策略。但是,小猪的劣策略是?按#,因为无论大猪作何选择,小猪选择?等待#是比选择?按#更好一些的策略。所以,小猪会剔除?按#,而选择?等待#;大猪知道小猪会选择?等待#,从而自己的最优选择是?按#,所以纳什均衡解就是(按,等待)。

表3智猪博弈支付矩阵小猪大猪

按等待按

5,14,4等待9,-10,0 在现实经济生活中,有许多?智猪博弈#的例子,它反映的是一种参与人地位不对等的博弈结构,这种不对等可以是参与人拥有的信息和支付函数,也可以是参与人所采取的策略和行动。比如在股票市场上,大户是大猪,他们进行技术分析,收集信息、预测股价走势,而大量散户就是小猪,他

们几乎不花成本去进行技术分析,而是跟着大户(基金)的投资策略进行股票买卖,这就是股票市场上著名的

?散户跟大户#现象。在股份公司中,大股东是大猪,他们收集信息、监督经理,拥有决定经理任免的投票权,而小股东是小猪,他们不直接花精力去监督经理,投票权重也往往无足轻重,但他们却可以从大股东的监督中受益。

技术创新市场上,大企业是大猪,它们投入大量资金进行

技术创新,开发新产品,而中小企业是小猪,它们不会进行大规模的技术创新,而是采取?跟随策略#,等待大企业的新产品形成新的市场后,仿制大企业的新产品展开销售。

三、拍卖机制:不对称信息下的买与卖

在?囚徒困境#和?智猪博弈#中,参与人的信息是公开且对称的,或者说参与人之间不存在不对称信息,但是在更多的情形下,参与人之间的信息不是公开的,市场上的尔虞我诈往往无法避免。以拍卖市场为例,考虑一件古董需要拍卖,有许多人参加竞争性拍卖。这件古董在每个买主心中有一个估价。但是,卖主不知道买主的估价,买主当然也不会老老实实地将其对古董的估价告诉卖主,不同买主之间也不知道互相之间的估价。因此,有关标的和竞标的信息都是不对称的。假定采用?英式拍卖#,买主们轮流出价,直到开出最高价的买主拿走古董并支付这个价格。但遗憾的是,如果按这种拍卖方法,古董并不能按买主心中的最高的估价卖出。比如,当买主中的最高估价为10万元,第二高估价为8万元时,当估价最高的买主开出9万元时,便可买走其估价为10万元的古董而只支付9万元。由于这是公开竞价,所以会出现围标问题,即买主们合谋压价。为了避免围标,一种常用的方法是?一级密封价格拍卖法#,买主每人将其开出的价格写入一个信封,密封后交给卖主。卖主拆开所有信封,将古董卖给信封中出价最高的人,并要求支付这个价格。但是?一级密封价格拍卖法#却不能诱使买主按照其真实估价进行出价,这是因为,买主总可以报一个略低于其真实估价的价格获得标的物,从而赚取其中差价。

经济学家维克瑞发明的?二级密封价格拍卖法#,既可避免围标,又可诱使买主们报出真实估价。他的方法是这样的,先要求每个买主将出价写入一个信封,密封后交给卖主,卖主拆开信封后宣布将古董卖给出价最高的人,但只需支付开出的第二高的价格。譬如,出价最高的为10万元,第二高的为8万元,古董就卖给开出10万元的人,但他只需支付给卖主8万元。对每个买主来说,他不知道其他买主的估价,但给定其他买主的估价,他一旦获胜,支付的第二高的价格是固定的,不会随他开出的价格而改变;但他开出的价格愈高,获胜的可能就愈大;但是,他不能开出比他的价值估价更高的价格。因为一旦存在别的人开出的价格比他的价值估价还要高,当他获胜时,就必须以高出他的价值估价的价格购买古董,对他来说是得不偿失的。所以,每个人都会如实地按心中的估价开出价格。如果所有人的估价是一样的,古董就以真实的最高价值卖出。维克瑞拍卖法可以诱使买主说出真话,因而这种方法也被成为维克瑞机制。上世纪七十年代美国联邦政府运用维克瑞招标法进行公共工程招标,为联邦政府节省了大笔开支。

到目前为止,经济学家对拍卖机制的研究获得了丰硕而卓越的成果,不仅形成了以?英式拍卖#、?荷兰式拍卖#、?一级密封价格拍卖法#和?二级密封价格拍卖法#等四种拍卖方式为核心的基础理论,并围绕不同的拍卖方式探讨和比较投标者及卖主的收益,而且还在投标者风险厌恶、投标者之间具有共同信息、非对称估价分布,以及存在由非对称估价分布导致的二级交易市场(resa l e)的情况下探讨和比较上述问题,从而颠覆了基础理论的前提假设,特别是对二级交易市场的研究,对解释我国经济转轨过程中国有企业的资产流失现象具有重要的启示意义。在市场及之设计方面,一种富有想象力的研究思路是,假定存在某种特殊的?机器#可以通过支付规则和分配规则来直接替代参与人报价策略函数的生成过程,当然参与人的报价也都必须遵循博弈论对理性经济人的假定,也就是说,策略函数的生成结果总是可以被预期的,那么这样的?机器#就能使得人类本身变得更加单纯,策略被一组规则替代,或者说,最优策略就是按市场规则行事,从这个意义上讲,一个好的市场经济就是要不仅要让好人做好事,而且还要让坏人也做好事。政府的职责就在于为民众提供一系列激励相容约束下的好的市场机制,比如能始终确保投标者说实话(tr u t h telli n g)的VCG机制,以及能同时满足效率、激励相容及预算平衡(budget ba lance)的AGV机制,后者在各

国的政府采购和公共建设中被大量采用。

四、战争与冲突:为世界和平破题

奥曼和谢林两位学者的工作进一步发展了博弈理论,并开始涉及社会学领域中的一些主要问题。他们认为使用博弈论有望重塑关于人类交互作用的分析范式,从社会交互作用剖析和理解战争和冲突的本质,以及可能采取的通往和平的策略。

谢林1960年的著作冲突的策略!(?The Strategy o f Conflict#)从经济学的角度将博弈论作为统一的分析框架应用于社会科学问题。他认为:一个政党可以通过公开恶化自身的选择权来巩固自己的地位;报复能力远比抵抗进攻能力来的有用;不确定性的报复比确定条件下的报复更有效率、更加可靠。这些解决冲突、避免战争的中肯创见已被事实证明,一个经典应用是在国际关系领域。谢林在冲突的策略!中运用博弈论分析了国家之间的讨价还价行为。他指出:?偶然事件不会引发战争,只有决定才会导致战争的爆发。#如果一国认为另一国会突然发动袭击,那么一场双方都不情愿的战争就有可能爆发。突然袭击的优势和动机在于对方缺乏反击的能力,因此,防止突然袭击的首要目标是军事安全而不是人员安全。进一步说,防止突然袭击需要可信的二次还击能力。在冲突的策略!出版之后四十五年里,谢林继续开展了一系列新颖而有效的研究。比如,他在相互依存和自我控制两方面的研究就值得一提,主要观点集中体现在其1978年的著作微观动机与宏观行为!(?M i c ro m oti v es and M acrobehav ior#)。例如谢林在书中指出,?如果某个社会的弱势群体被主流人群认为不具备担任重要职责的能力,那么人们就不会雇佣他们担任重要的职责;他们因此也没有担任重要职责的机会;而缺乏担任重要职责的锻炼,他们也就越发地让人觉得无能。%%,如果大学学生与老师之间关系比较疏远,或者老师在场时他们就感觉别扭,老师可能就会尽量回避与学生们在一起,从而更会使学生产生这种情绪。#

与谢林叙事性风格完全不同的是,奥曼则从数学的角度出发,在其诸多贡献之中,关于长期合作的研究,无疑具有最深刻的冲击和影响。他认为长期合作关系的维系远比一次简单的际遇来得容易,为此,他提出了完整详尽的无限期重复博弈理论,并严格论证了何种结果能够在长时期的关系中得到维持。无限期重复博弈理论阐明了众多机构存在的理由,比如商业协会、组织犯罪、工资谈判以及国际贸易协议等。奥曼所提出的一些真知灼见也有助于解释价格战或贸易战等经济冲突,以及为什么一些团体组织能够非常成功地管理公共资源等。除了长期合作领域内的建树外,奥曼在其他方面的研究成果同样非常显著。比如共同知识、完全竞争的经济模型和值集函数等。首先,博弈参与人对对方策略集、信息集和偏好的了解程度是他们在博弈过程中策略的选择的关键变量,然而由此引发的一个问题是,怎样的认识假设意味着理性行为人能够达到均衡?长期以来,博弈论研究者对这一基本问题始终保持沉默,经济学家在进行均衡分析时对此也没作过多考虑。奥曼在1976年的论文?同意分歧#(ag ree i n g to d isagree)中,将李维斯(Le w is D.)于1969年提出的共同知识的概念引入博弈论,圆满地回答了这一问题,同时还促进了?交互认识论#(interacti v e ep iste m o l o gy)的发展。关于完全竞争的经济模型,奥曼认为:只要仅存在有限参与者,个别参与者对经济的影响在数学上就不能被忽视。奥曼把参与人闭连续集的概念引入到这一经济模型中,指出适合于完全竞争的数学模型必须包括无限多个参与者,从而拓宽了微观经济理论的解释能力。另外,奥曼在值集函数领域也作出的许多基础性贡献,如奥曼可衡量选择定理和值集函数积分结果等,在经济学、数学和运筹学等许多学科领域内都有着广阔的应用前景,如一般均衡分析、最优配置、非线性规划、控制论、测度理论和不动点定理等。

尽管谢林和奥曼关于冲突和合作的作品在上个世纪五十年代末期出现后就得到了普遍承认,但他们的洞察力仍过了很长时间才得以充分展示。这种延迟一方面反映了他们所作贡献的新奇创

意,另一方面也反映了他们后来各项工作的困难与艰辛。&终于,博弈论发展成为经济学和其他许多社会科学领域中一种被普遍接受的分析工具和通用性语言。谢林和奥曼所创建的博弈理论或者说交互决策理论为解决合作和冲突这一古老问题提供了最优路径。

五、演化博弈论:尘埃是如何落定的

作为经济学和生物学交叉融合的产物,演化博弈论汲取了哈耶克(Friedrich August von H ayek)深邃而复杂的思想,修正了传统博弈论中对理性经济人似乎超人般无所不能的超理性假设,强调习惯、习俗、规则、遗忘、冲动、热情、非理性预期和犯错误的概率等被传统博弈论所忽视的内容、这在一定程度上动摇了传统博弈论的理论基石。它的合理性在于,指出经济人并非超理性的,而是基于个人习惯、习俗和惯例等一些生活常规、社会秩序和非正式约束下的?异质低度理性#,在多数时间里,他们在所掌握的信息基础上相当理智地行动,也就是说,当适应性过程有足够时间展开的话,是演化力量而不是个人理性在社会制度变迁中起着关键性的决定作用。这实际上继承并发展了由演化经济学所极力倡导的与新古典经济学相对的时间与历史在经济演化中的重要地位,强调制度变迁在均衡形成过程的重要作用。

因此,演化博弈论对均衡概念的理解也与传统博弈论有本质的区别,打个比方来说,如果说传统博弈论描述的是一旦尘埃落定世界看上去会是怎样的,那么演化博弈论则对尘埃是如何落定的更感兴趣,并把这一过程视为随机力量产生的持续冲击,所以当把随机过程引入博弈论之后,许多结论都可能发生变化。如果把传统博弈论看作是抽象掉了过程的演化博弈论,或者干脆就是演化博弈论的一种特例,那么以探讨和研究?进化稳定策略#(evo l u tionaril y stab l e strategy,ESS)形成机制的演化博弈论可以研究的内容更加广泛,演化博弈论对正统博弈论基本假设的突破,扩展和丰富了博弈论的解释范围和解释能力,并使之成为潜在的诺奖研究领域。相信诺奖评委会也一定会同意这样的断言,即演化博弈论有助于揭示由众多个体的简单非协调行为的加总而产生的社会结构有多复杂。

例如在谈及?制度#时,演化博弈论将制度定义为恰当的高维博弈中的均衡,而对于在道德伦理上可接受的行为规范而言也同样如此,这样言表的潜台词是,如果偏离了规范,是要受到惩罚的。就像在一个靠左行驶的国度中,靠右行驶的代价就是车毁人亡。但这并不意味着制度和规范是一尘不变的,是可以超越历史的,均衡有时在独癖性冲击(i d i o syncratic shock)下的确发生了改变。如法国大革命之后,关于?民主#的呼声要求拿破仑他的军队采用向右行使的新的规范?,并逐渐传播到他所占领的一些国家中,在此后的两百年内,随着道路资源使用频率的增加,局部性的规范逐渐演变成地区性的,葡萄牙、西班牙和奥地利等国家渐进但又稳定地变更了行车规则,直至整个欧洲大陆,而此时关于行驶的最佳策略无疑是靠右行驶。

再比如在美国的城市里,经验研究发现黑人和白人总是居住在属于自己的社区内,而从不混杂居住。用传统博弈论对此几乎无从解释,但演化博弈论却能给出一些有益的提示。假定一个选择邻居种族的偏好以及偏好产生错误的概率,就可以通过计算机模拟出整个城市人群居住格局的演变过程,其在本质上构成一个适应性博弈。研究表明,黑人和白人的分开居住有其内在的生物学基础,黑人和白人在文化理念和邻居种族的偏好方面的差异性导致了不同种族人群分开居住的结果,这对社区治理和城市发展都具有深刻的政策指导意义。

&?何德旭、王朝阳、应寅锋.博弈论下的冲突与合作[J].理论前沿.2005,(24)

在此之前,法国及欧洲其他许多地区的马车靠左行使的规范使得行人只得靠右行走,所以靠左行走就与特

权阶级相联系而靠右走则被认为是?民主#。

六、结语

博弈论来源于生活,却又如此的完美和不平凡,她的完美不在于拥有华丽而复杂的数学表达,而在于凝炼深邃而透彻的策略思维,伴随着人类智慧的最佳发挥。其实,博弈论的理论模型一般都可以在现实生活中找到它们的原型,而生活中的一些经验法则、习俗和习惯又都可以在博弈论中找到相似的元素,人类智慧的结晶实际上是博弈论在具体生活实例中的体现,而学术研究前沿恰恰又能在具体的生活法则中得到最好的验证。

当然,博弈论自身也面临着许多问题,一个极端苛求的质疑来自对传统博弈论(不包含演化博弈论)完全理性假设的不信任,但无论如何我们都必须承认,正是在这个极端苛求的质疑下,博弈论解释了从生活到战争,从合作到纷争的种种人类活动,而且学科自身发展的完善同时也要求博弈论能够朝着更富有解释力的方向演进。可以相信,在结合了生物学、脑科学以及计算科学在内的演化博弈论的出现,必将在一定程度上推动博弈论理论研究的不断深入,其解释力和预判能力也必将超越传统博弈论而上升为一种新的研究工具和认识范畴。(

参考文献:

1.K rishna,V.,A uc ti on T heo ry[M].A cade m i c P ress,200

2.H afa lir,I.and V.K r i shna,2006,A symm etr i c A ucti ons w ith R esa l e[J].m i m eo,P enn State U n i versity.

3.M il gro m,P.,Putti ng A ucti on T heory to W o rk[M].Cambr i dge U n i versity P ress,200

4.N eu m ann,J.V.and O.M orgenstern,T heo ry o fG ames and Econo m ic Behav i or[M].P r i nceton U niversity P ress, 1944.

5.Sche lli ng,T.C.,T he Strategy o f Conflict[M].H arvard U n i versity Press,1960.

6.Sche lli ng,T.C.,M i c romo ti ves and M acrobehav i o r[M].W.W.N o rt on,1978.

7.Y ong,H.P.,Ind i v i dua l Stra tegy and So cial Struct ure:A n evo l u tionary theory o f i nstituti ons[M].P ri nceton U n i versity P ress,1998.

8.张维迎,博弈论和信息经济学[M].上海,三联书店,1996.

Strategic Thoughts i n Ga m e Theory

L iL i n g1 W ang X iang2

(1.I nstitute o fE cono m ics,Shangha iA cade m y o f Soc ial Sc i e nces200020;

2.F i n ance Co llege,Shangha iNor m a lUn i v ersity200234)

Abstract:Fro m the o ri g i n of the ga m e theory,the essay d isc usses about the Nobe lPrizes caugh t by it and conc l u des that nothing but t h e strategy i n the ga m e is the sole sp irit of the theory w ithout a doubt.So m e ill u strations,as cooperati o n,i m itation,i n novation,aucti o n,fi g hti n g and gregarious behav i o r,are put for w ar d to m ake it c lear that parties take acti o ns follo w i n g the strateg ic thoughts and reach the equ ilibri u m.M eanwh ile,the criticis m on the strategy thoughts has a lso been m aking the ga m e theory m ore perfecti o n.The transfer fr o m the traditi o na l ga m e theory to the evo l u ti o nary ga m e theo r y expresses t h e sense t h atm u lti subject research m ay be the m a i n directi o n i n the near future.

K eyw ords:G a m e Theory,Strateg i c Thoughts,the Nobe l Pr izes

(完整版)博弈论知识点总结

博弈论知识总结博弈论概述： 1、博弈论概念：博弈论：就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。博弈论研究的假设： 1、决策主体是理性的，最大化自己的收益。 2、完全理性是共同知识 3、每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念与预期 2、和博弈有关的变量：博弈参与人：博弈中选择行动以最大化自己受益的决策主体。行动：参与人的决策选择战略：参与人的行动规则，即事件与决策主体行动之间的映射，也是参与人行动的规则。信息：参与人在博弈中的知识，尤其是其他决策主体的战略、收益、类型（不完全信息）等的信息。完全信息：每个参与人对其他参与人的支付函数有准确的了解；完美信息：在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动，否则为不完美信息。不完全信息：参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息，即存在着有关其他参与人的不确定性因素。支付：决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。从经济学的角度讲，博弈是决策主体之间的相互作用，因此和传统个人决策存在着区别： 3、博弈论与传统决策的区别： 1、传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下，最大化自己效用，研究工具是无差异曲线。可表示为：maxU(P ,I)，其中P 为市场价格，I 为消费者可支配收入。 2、其他消费者对个人的综合影响表示为一个参数——市场价格，所以在市场价格既定下，消费者效用只依赖于自己的收入和偏好，不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式：战略式博弈和扩展式博弈战略式博弈：是博弈问题的一种规范性描述，有时亦称标准式博弈。战略式博弈是一种假设每个参与人仅选择一次行动或战略，并且参与人同时进行选择的决策模型，因此，从本质上来讲战略式博弈是一种静态模型，一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合： 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合上的效用函数Ui(s1,s2,…,sn). 扩展式博弈：是博弈问题的一种规范性描述。与战略式博弈侧重博弈结果的描述相比，扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。包含要素： 1、参与人集合 {1,2,...,}n Γ={1,2,...,}n Γ=11(,...,,...,)n i i n i s s s s ==∏

策略博弈(第二版)

《策略博弈》（第二版）书名：《策略博弈》（第二版）书号：978-7-300-10135-4 著译者：阿维纳什·迪克西特苏珊·斯克丝著蒲勇健译开本：16 开出版时间：2009.02 定价：65.00元 ◆作者简介◆ 阿维纳什·迪克西特（Avinash.Dixit）教授是美国当代最负盛名的经济学家之一，1968年获美国麻省理工学院经济学博士学位，1977年当选计量经济学会院士，自1981年起一直在普林斯顿大学任经济学教授，同时被世界多所知名大学聘为客座教授，曾在加州伯克利大学、牛津大学任教。他于1992年当选为美国艺术和科学研究院院士，2001年任计量经济学会会长，2002年任美国经济学联合会副会长，2005年当选国家科学院院士，曾在加州伯克利大学、牛津大学任教。研究领域广泛，在微观经济理论、博弈论、国际贸易、产业组织、增长和发展理论、公共经济学以及新制度经济学等多个领域有重要建树，近年来主要致力于政策制定中的政治经济学的研究。他著作甚丰，除在《美国经济评论》、《经济学季刊》、《政治经济学杂志》、《经济研究评论》等顶级专业期刊上发表多篇学术论文外，他还撰写了一系列著作，其中大部分均已成为经济学相关研究领域的名著或经典教科书。迪克西特教授的代表著作《策略思维》、《经济政策的制定》、《不确定条件下的投资》、《法律缺失与经济学》均由中国人民大学出版社出版。 ◆内容简介◆ 《策略博弈》（第二版）是其在《策略思维》基础上进一步完善写作和案例上之后的通俗博弈论力作。如果说《策略思维》是20世纪80年代国际上最为流行的通俗博弈论教科书之一，那么《策略博弈》就是20世纪90年代以来国际上最为流行的通俗博弈论教科书之一。知识渊博的迪克西特在本书中通过运用标准的博弈论方法，通过对日常生活中的智慧、经济活动中的竞争与合作、政治活动中的技巧、军事活动及战争中的策略等的演绎，比较系统但又很简要地介绍了博弈论的有关基础知识，语言生动诙谐，故事精彩有趣，使得读者在漫游于引人入胜的故事情景之中的同时也可以通过博弈论的精致分析工具去了解其所以然。 ◆名家推荐◆ 迪克西特与斯克丝认识到了在大学课程计划的开始阶段教授博弈论概念的可能性；这是一个非常大的进步，值得赞许。通过使用《策略博弈》这本书，每一个地方的学生——正

(完整word版)博弈论给我的心得

博弈论给我的心里体会潘慧明 201202034049 12金融数学我是大学第二学期开始选修学习《博弈论》的，并且以前对它停留在表面意思。而在我的进一步对《博弈论》的学习下，我懂得了这门课程在我们的生活中无处不在，在未学习这门课程之前我对身边发生的一些事情无法用一个专业的学说来概述，经过这个学期的学习后，我才知道我身边发生的很多事情都可以用这门课程概述。那么什么是“博弈论”？所谓的“博弈论”——就是研究决策主体的行为发生直接相互作用时的决策及这种决策的均衡问题。并且学习后我还有个感受就是：博弈论有两个比较enlightening的观点，一是more information can hurt you(掌握更多的信息可能是一件坏事)，二是more options can hurt you（拥有更多的选择可能是一件坏事）.虽然博弈论主要用于研究经济问题,但是我觉得这些原理在我们现实生活中同样是适用的。而且经过这段时间的学习，我现在对《博弈论》有了些比较肤浅的认识。诚然，一门学问想在短时间内有所深入理解是不现实的。生活之中到处充满着博弈，有人说没有，那是因为缺少发现博弈现象的眼睛。因此在生活中我们要懂得学以致用，要会灵活的去使用这门学科。人生就是在弈棋，学会博弈。虽说博弈不是万能的，但没有博弈现象存在的生活是万万不能的。社会生活中，共赢是一种优良的博弈方式。双赢策略其实是一种很高的智慧，帮助别人的同时接受别人的帮助，双方最终将获得独自奋战所不能拥有的东西。放弃内心的宁予外贼不予家奴的思想。中国人对竞争的理解大多不是“你死”就是“我活”，胜利的含义似乎就是阻止别人成功，可是这“胜利”是那么虚假，经不起风吹雨打，经不起时间考验。拥抱双赢，拥抱明天。双赢强调的是博弈双方的利益都要兼顾，就是所谓的“赢者不全赢，输者不全输”。但是双方都得到了满意的结果。这些双赢的事例，在商务上经常可以看到的。如：商务上的谈判，完完全全的运用到了《博弈论》的知识与原理来分析问题，并且从而找到最佳的均衡点，也就是最好的解决方法。在所有的对抗和较量中，其胜负成败常常取决于三个基本的因素：机会或者说运气、体能和智能。头脑技能是一种策略技巧，或者说是在谋略方面的造诣。既然世间大多数对抗都与头脑技能有关，因此人们试图获得成功，就有必要研究在对抗局势中如何策略性地选择自己的行动。而今，博弈论就是一门专门研究互动局势下人们的策略行为的学问。事实上，每

《经济博弈论》期末考试复习

《经济博弈论》期末考试复习资料第一章导论 1.博弈的概念：博弈即一些个人、队组或其他组织，面对一定的环境条件，在一定的规则下，同时或先后，一次或多次，从各自允许选择的行为或策略中进行选择并加以实施，并从中各自取得相应结果的过程。它包括四个要素：参与者，策略，次序和得益。 2.一个博弈的构成要素：博弈模型有下列要素：(1)博弈方。即博弈中决策并承但结果的参与者．包括个人或组织等：(2)策略。即博弈方决策、选择的内容，包括行为取舍、经济活动水平或多种行为的特定组合等。各博弈方的策略选择范围称策略空间。每个博弈方各选一个策略构成一个策略组合。(3)进行博弈的次序：次序不同一般就是不同的博弈，即使博弈的其他方面都相同。(4)得益。各策略组合对应的各博弈方获得的数值结果，可以是经济利益，也可以是非经济利益折算的效用等。 3.合作博弈和非合作博弈的区别：合作博弈：允许存在有约束力协议的博弈；非合作博弈：不允许存在有约束力协议的博弈。主要区别:人们的行为互相作用时，当事人能否达成一个具有约束力的协议。假设博弈方是两个寡头企业，如果他们之间达成一个协议，联合最大化垄断利润，并且各自按这个协议生产，就是合作博弈。如果达不成协议，或不遵守协议，每个企业都只选择自己的最优产品（价格），则是非合作博弈。合作博弈：团体理性（效率高，公正，公平）非合作博弈：个人理性，个人最优决策（可能有效率，可能无效率） 4.完全理性和有限理性: 完全理性：有完美的分析判断能力和不会犯选择行为的错误。有限理性：博弈方的判断选择能力有缺陷。区分两者的重要性在于如果决策者是有限理性的，那么他们的策略行为和博弈结果通常与在博弈方有完全理想假设的基础上的预测有很大差距，以完全理性为基础的博弈分析可能会失效。所以不能简单地假设各博弈方都完全理性。 5.个体理性和集体理性：个体理性：以个体利益最大为目标；集体理性：追求集体利益最大化。第一章课后题：2、4、5 2.设定一个博弈模型必须确定哪几个方面? 设定一个博弈必须确定的方面包括:(1)博弈方，即博弈中进行决策并承担结果的参与者;(2)策略(空间)，即博弈方选择的内容，可以是方向、取舍选择，也可以是连续的数量水平等;(3)得益或得益函数，即博弈方行为、策略选择的相应后果、结果，必须是数量或者能够折算成数量;(4)博弈次序，即博弈方行为、选择的先后次序或者重复次数等;(5)信息结构，即博弈方相互对其他博弈方行为或最终利益

博弈论与决策思维

《博弈论与决策思维》感想这次很荣幸的去听了郑教授的《博弈论与决策思维》讲座，非常感谢浙江大学东方财智能给我提供的这次机会，听完这个课程之后，内心深处感受颇深，第一次觉得博弈思维是如此的精湛，更令人感叹的是郑教授教了我们在生活当中如何运用博弈思维来处理一些棘手的事。与我以前听过的所有精彩的课程相比，我只想说一句：教授不愧是教授，教授与老师的讲课方式与方法是截然不同的！在整个博弈论课程演讲的过程中，郑教授都是用一些有趣的例子来引导大家在课堂上的互动，从而通过在例子上总结出来的一些启示来告诉大家，在生活当中遇到一些进退两的困境时，我们应当如何巧妙地运用博弈思维来思考问题，并让那些问题能得到妥善的处理。如果就像宣读课本一样把那些道理说给大家听，把那些PPT画面一页页放给大家看的话，那效果肯定就犹如过眼云烟，但是郑教授说的每一点重点我们都会牢牢紧记！比如：田忌赛马，这是大家都知道的故事。大家都只知道田忌之所以赢了齐王是因为他改变了策略，然而改变策略视需要前提条件的：第一就是对方愚蠢，第二就是对方的信息的公知的。所以在现实生活中我们应该用全局、动静思维来考虑问题！博弈分为很多种：换位思考、信任危机、收益问题、隐性激励、推理方式、、、、、其中有一点我记得最清楚的就是隐性激励。说的大概就是一个公司的上层不能什么事都必须是亲力亲为，应该对有些事松松手或者对于有些事假装不清楚，让下属自己拿主意，让他们以后做事能越来越有自信，在这个过程中能逐渐成长起来，正好验证了那句话“水至清则无鱼，人至察则无徒”！不仅人与人之间存在博弈，物品之间也同样存在博弈，只不过换了一种说法。物品间的竞争是替代，合作就是互补。而市场决定着物品之间的关系，所以说博弈是无处不在的。郑教授所讲的博弈内容远不止这么点，用一句话来概括：只可意会不可言传。只有亲自去听了之后才会有那种突然觉自己的智慧一下子就升华了的感觉。学会博弈论会让你活的更有智慧！

博弈论习题

、选择题 A. 策略是局中人选择的一套行动计划； B. 参与博弈的每一个局中人都有若干个策略； C. 一个局中人在原博弈中的策略和在子博弈中的策略是相同的； D. 策略与行动是两个不同的概念，策略是行动的规则，而不是行动本身。 A. 双方都独立依照自己的利益行事，则双方不能得到最好的结果； B. 如果没有某种约束，局中人也可在（抵赖，抵赖）的基础上达到均衡； C. 双方都依照自己的利益行事，结果一方赢，一方输； D 每个局中人在做决策时，不需考虑对手的反应 A. 策略式博弈无法刻划动态博弈； B. 策略式博弈无法表明行动顺序； C. 策略式博弈更容易求解； D. 策略式博弈就是一个支付矩阵。 B. 混合策略是博弈方根据一组选定的概率，在两种或两种以上可能的行为中随机选择的策略； C. 有些博弈不存在纯策略纳什均衡，但存在混合策略的纳什均衡； D. 有些博弈既存在纯策略纳什均衡，也存在混合策略的纳什均衡。博弈论》习题 1. 博弈论中，局中人从一个博弈中得到的结果常被称为（）： A. 效用； B. 损益； C. 决策； D. 利润 2. 下列关于策略的叙述哪个是错误的（）： 3. 囚徒困境说明（）： 4. 一个博弈中，直接决定局中人损益的因素是（）： 5、 A. 策略组合； B. 策略； C. 信息； D. 行动。策略式博弈，正确的说法是（）： 6. 下列有关策略和纳什均衡的叙述正确的有（）： A. 纯策略是博弈方采取“要么做，要么不做” 的策略形式； 7、古诺模型体现了寡头企业的（）决策模型。 A 成本价格产量质量

8、伯特兰德模型体现了寡头企业的什么决策模型。 A 成本价格产量质量 9、用囚徒困境来说明两个寡头企业的情况，说明了：（ A、每个企业在做决策时，不需考虑竞争对手的反应 B、一个企业制定的价格对其它企业没有影响 C、企业为了避免最差的结果，将不能得到更好的结果 D、一个企业制定的产量对其它企业的产量没有影响 10、子博弈精炼纳什均衡（）： A.不是一个一般意义上的纳什均衡； B.和纳什均衡没有什么关系； C.要求某一策略组合在每一个子博弈上都构成一个纳什均衡； D.要求某一策略组合在原博弈上都构成一个纳什均衡。 11. 下列关于重复博弈的叙述哪些是正确的（）： A.重复博弈又称为序贯博弈； B.影响重复博弈均衡结果的主要因素是博弈重复的次数和信息的完备性； C.如果博弈重复无限次，则局中人采取的针锋相对策略意味着任何一方参与人的一次性不合作将触发永远的不合作； D.在有限次重复博弈中，若阶段博弈纳什均衡的唯一性存在，则每个阶段出现的都是一次性博弈的均衡结果。 12. 在动态博弈战略行动中（）： A. 首先作出选择并采取相应行动的局中人往往可以获得更多的收益； B. 斯塔克博格模型与古诺模型对垄断厂商行为的分析方法及结论相同； C. 一般而言，只有当局中人从实施某一威胁所能获得的总收益大于不实施该威胁所获得的总收益时，该威胁才是可信的； D. 承诺是当事人使自己的威胁策略变得可信的行动，但它也是有风险的。 13、市场交易中普遍存在的讨价还价属于哪种博弈。（ A 完全信息静态博弈完全信息动态博弈 C 不完全信息静态博弈不完全信息动态博弈 14、下面哪种模型是一种动态的寡头市场博弈模型（ A 古诺模型伯川德模型

1.3.7 博弈论分析方法的主要特征

博弈论分析方法的主要特征博弈论已形成一套完整的思想体系和方法论体系。其分析方法具有下列特征： 1. 研究对象的普遍性和应用范围的广泛性人们的行为之间存在相互作用与相互依赖，不同的行为主体及其不同的行为方式所形成的利益冲突与合作，已成为一种普遍现象，这使博弈论的研究对象具有普遍性。一切涉及到人们之间利益冲突与一致的问题、一切关于竞争或对抗的问题都是博弈论的研究对象。现实社会中广泛存在的合作与非合作博弈、完全信息与不完全信息博弈的事实，使博弈论的研究内容和应用范围十分广泛，涉及到政治学、社会学、伦理学、经济学、生物学、军事学等诸多领域，在经济学中的应用尤为突出。 2. 研究方法的模型化、抽象化以及涉及学科的综合性一是运用数学模型来描述所研究的问题，使博弈论的分析更为精确。二是研究方法具有抽象化的特征，由于博弈论分析大量使用了现代数学，使它所描述和分析的过程及所揭示的结论都带有抽象、一般化的特点。三是博弈论分析方法所体现的模式化特征，博弈论为人们提供了一个统一的分析框架或基本范式，从而使博弈论能够分析和处理其它数学工具难以处理的复杂行为，成为对行为主体间复杂过程进行建模的最适合的工具。

四是博弈论方法所涉及的学科的综合性。在博弈论分析中，不仅要应用现代数学的大量知识，还涉及到经济学、管理学、心理学和行为科学等学科。 3. 研究方法的实证性与研究结论的真实性博弈论中的最佳策略是经济学意义上的最优化，它只回答是什么导致博弈均衡，均衡的结果是什么，所遵循的基本原则是科学结论的客观性和普遍性。从实践上看，博弈论突破了传统的完全竞争、完全信息假定，更加强调决策者的个人理性，强调不完全信息、不完全竞争条件下的经济分析，强调决策个体之间的相互影响和相互作用等外部性，强调通过规则、机制和制度的设计和优化在个人理性得到满足的基础上达到个人理性和集体理性的一致，等等。作为一门方法论科学，除了提供分析和解决博弈问题的独特和新颖的具有战略思维的思想方法以外，还提供了更加贴近现实的分析工具并填补了传统经济分析的许多空白。从这个意义上说，博弈论方法具有实证的特征，使研究结果更具有真实性。

博弈论复习题及答案(DOC)

囚徒困境说明个人的理性选择不一定是集体的理性选择。（√）子博弈精炼纳什均衡不是一个纳什均衡。（×）若一个博弈出现了皆大欢喜的结局，说明该博弈是一个合作的正和博弈。（）博弈中知道越多的一方越有利。（×）纳什均衡一定是上策均衡。（×）上策均衡一定是纳什均衡。（√）在一个博弈中只可能存在一个纳什均衡。（×）在一个博弈中博弈方可以有很多个。（√）在一个博弈中如果存在多个纳什均衡则不存在上策均衡。（√）在博弈中纳什均衡是博弈双方能获得的最好结果。（×）在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。（×）上策均衡是帕累托最优的均衡。（×）因为零和博弈中博弈方之间关系都是竞争性的、对立的，因此零和博弈就是非合作博弈。（×）在动态博弈中，因为后行动的博弈方可以先观察对方行为后再选择行为，因此总是有利的。（×）在博弈中存在着先动优势和后动优势，所以后行动的人不一定总有利，例如：在斯塔克伯格模型中，企业就可能具有先动优势。囚徒的困境博弈中两个囚徒之所以会处于困境，无法得到较理想的结果，是因为两囚徒都不在乎坐牢时间长短本身，只在乎不能比对方坐牢的时间更长。（×）纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。（√）不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡，作为原博弈构成的有限次重复博弈，共同特点是重复博弈本质上不过是原博弈的简单重复，重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。（√）多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径：两阶段都采用原博弈同一个纯战略纳什均衡，或者轮流采用不同纯战略纳什均衡，或者两次都采用混合战略纳什均衡，或者混合战略和纯战略轮流采用。（√）如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡，那么可能（但不必）存在重复博弈G(T)的子博弈完美均衡结局，其中对于任意的t

博弈论与策略行为

博弈论与策略行为 G a m e T h e o r y a n d S t r a t e g y B e h a v i o r 蔡继明教授/主任清华大学政治经济学研究中心 Center for Political Economy at Tsinghua University CPET

目录第一讲：导论一、博弈论的研究对象第二讲：占优战略与社会两难第三讲：纳什均衡和双人博弈第四讲：三人博弈与n人博弈第五讲：纯战略和混合战略第六讲：博弈的合作解第七讲：序贯博弈与子博弈完美均衡第八讲：重复博弈第九讲：企业经营决策的博弈分析第十讲：企业内部组织分析第十一讲：政府行为分析第一讲导论博弈论是研究理性的决策主体在其行为发生直接的相互作用时的策略选择及策略均衡的理论。博弈分析的关键步骤是找出在别人选择既定的情况下自己的最优反应策略（给自己带来最大收益的策略）。二、博弈论的产生和发展博弈又称博戏，是一门古老的游戏。 1. 博弈在中国《学弈》（《孟子 ?告子》）：弈秋，通国之善弈也。使弈秋侮二人弈，其一人专心致志，惟弈秋之为听；一人虽听之，一心以为有鸿鹄将至，思援弓缴而射之。虽与之俱学，弗若之矣。为是其智弗若与？吾曰：非然也。《世本》说，“乌曹作博”，乌曹乃是夏代著名之能工巧匠。千百年来，博弈更是与人们的生活紧紧相连，从博棋到牌戏，从斗戏到彩票，中华民族的历史长河中就这样形成了别具风情的博弈文化从孙子兵法到三十六计从田忌赛马到孙庞斗智从运筹帷幄到韬光养晦从曹刿论战到论持久战

博弈论知识点总结完整版

博弈论（一）：基本知识 1.1定义:博弈论，又称对策论，是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论，是研究竞争的逻辑和规律的数学分支。即，博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用，以及不同决策主体之间的均衡。 1.2基本要素：参与人、各参与人的策略集、各参与人的收益函数，是博弈最重要的基本要素。 1.3博弈的分类：博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议（binding agreement）。倘若不能，则称非合作博弈（Non-cooperative game）。合作博弈强调的是集体主义，团体理性，是效率、公平、公正；而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大，强调个人理性、个人最优决策，其结果有时有效率，有时则不然。目前经济学家谈到博弈论主要指的是非合作博弈，也就是各方在给定的约束条件下如何追求各自利益的最大化，最后达到力量均衡。博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息，是否了解两个角度进行。把两个角度结合就得到了4种博弈： a、完全信息静态博弈，纳什均衡，Nash(1950) b、完全信息动态博弈，子博弈精炼纳什均衡，泽尔腾（1965） c、不完全信息静态博弈，贝叶斯纳什均衡，海萨尼（1967-1968） d、不完全信息动态博弈，精炼贝叶斯纳什均衡，泽尔腾（1975）Kreps, Wilson(1982) Fudenberg, Tirole(1991) 1.4课程主要内容：完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈 1.5博弈模型的两种表示形式：策略式表述(Strategic form), 扩展式表述（Extensive form） 1.6占优均衡： a、占优策略：在博弈中如果不管其他参与人选择什么策略，一个参与人的某个策略给他带来的支付值始终高于其他策略，或至少不劣于其他策略，则称该策略为该参与人的严格占优策略或占优策略。对于所有的s-i，si*称为参与人 i的严格占优战略，如果满足： ui(si*,s-i)>ui(si',s-i) ?s-i, ?si' ?si* b、占优均衡：一个博弈的某个策略组合中，如果对应的所有策略都是各参与人的占优策略，则称该策略组合为该博弈的一个占优均衡。 1.7重复剔除严劣策略均衡： a、“严劣”和“弱劣”的含义：设s i’和s i’’是参与人i可选择的两个策略，若对其他参与人的任意策略组合s-i, 均成立 u i(s i’, s-i) < u i(s i’’, s-i), 则说策略s i’严劣于策略s i’’。上面式子中，若将“<”改为“≤”，则说策略s i’弱劣于策略s i’’。 b、定义：重复剔除严格策略就是各参与人在其各自策略集中，不断剔除严劣策略…如果最终各参与人仅剩下一个策略，则该策略组合就被称为重复剔除严劣策略均衡。（二）：纳什均衡（Nash Equilibrium） 2.1纳什均衡定义：对于一个策略式表述的博弈G={N,S i, u i,i∈N}，称策略组合s*=(s1, …s i, …, s n)是一个纳什均衡，如果对于每一个i ∈N, s i*是给定其他参与人选择s-i*={s1*, … ,s i-1*, s i+1*, … ,s n*} 情况下参与人i 的最优策略（经济理性策略），即：u i(s i*, s-i*)

什么是博弈论博弈论的思考

什么是博弈论博弈论的思考博弈论原是数学运筹中的一个支系，其研究运用了种种数学工具，大量的数学模型成了博弈论和我们普通人的生活之间的一条难以逾越的鸿沟。面对这条鸿沟，很多人的反应是耸耸肩膀走开，少数人会企图通过学习数学来渡过。但是这两种反应都忽略了一个很浅显的道理：如同一个不会编程的人照样可以成为电脑应用高手，没有高深的数学知识，我们同样通过博弈论的学习成为生活中的策略高手。孙膑没有学过高等数学，但是这并不影响他通过运用博弈策略来帮助田忌赢得赛马。有时候，科学并不一定意味着繁琐的计算与测量，而是一种有浓厚艺术气息的思维方式。比如书中所讲述的一报还一报策略。美国密西根大学一位叫做罗伯特?爱克斯罗德组织了一场计算机模拟竞赛：任何想参加这个计算机竞赛的人都扮演“囚徒困境”案例中一个囚犯的角色。他们把自己的策略编入计算机程序，进行捉对博弈。他们每个人都要在合作与背叛之间做出选择。但与囚徒困境案例中有个不同之处：他们不只玩一遍这个游戏，而是以单循环赛的方式玩上200次。第一轮游戏有14个程序参加，其中包含了各种复杂的策略。竞赛的桂冠属于一种被称为“一报还一报”的策略。这种神奇的一报还一报策略说起来很简单，简单到有些 __：第一步合作，此后每一步都重复对方上一步的行为。如此简单的程序之所以反复获胜，

是因为它实行了以其人之道还治其人之身的原则，并且用如下特质使它能够最有效地鼓励其他程序同它长期合作：善良、可激怒、宽容、简单、不妒忌别人的成功。在静态的群体中竞赛是这样一种状况，那么，在一个动态的进化的群体中，这种合作策略能否产生、发展、生存下去呢？群体是会向合作的方向进化，还是向不合作的方向进化？如果大家开始都不合作，能否在进化过程中产生合作？为了回答这些疑问，爱克斯罗德重新设计了一个实验，假设63个对策者中，谁在第一轮中的得分高，他在第二轮的群体中所占比例就越高，而且是他的得分的正函数。这样，群体的结构就会在进化过程中改变，由此可以看出群体是向什么方向进化的。实验结果很有趣。一报还一报策略原来在群体中占1/63，经过1000代的进化，结构稳定下来时，它占了24%。因此，以合作系数来测量，群体是越来越合作的。这个结论还可以引申为：共同演化会使一报还一报的合作风格在充满背信弃义劣行的世界上蔚然成风。我们可以用以上实验结果来对照一下商界的一句经典老话：商场如战场。商场如战场，就是说商业竞争的对手就是敌人，而对待敌人的办法在人类几千年来的历史上似乎只有一个，那就是把它干掉――或者通过消灭，或者通过吞并。胜利的定义是唯一的，那就是敌人必须一败涂

“博弈论”习题及参考答案

《博弈论》习题一、单项选择题 1.博弈论中，局中人从一个博弈中得到的结果常被称为（）。 A. 效用 B. 支付 C. 决策 D. 利润 2.博弈中通常包括下面的内容，除了（）。 A.局中人 B.占优战略均衡 C.策略 D.支付 3.在具有占优战略均衡的囚徒困境博弈中（）。 A.只有一个囚徒会坦白 B.两个囚徒都没有坦白 C.两个囚徒都会坦白 D.任何坦白都被法庭否决了 4.在多次重复的双头博弈中，每一个博弈者努力（）。 A.使行业的总利润达到最大 B.使另一个博弈者的利润最小 C.使其市场份额最大 D.使其利润最大 5.一个博弈中，直接决定局中人支付的因素是（）。 A. 策略组合 B. 策略 C. 信息 D. 行动 6.对博弈中的每一个博弈者而言，无论对手作何选择，其总是拥有惟一最佳行为，此时的博弈具有（）。 A.囚徒困境式的均衡 B.一报还一报的均衡 C.占优策略均衡 D.激发战略均衡 7.如果另一个博弈者在前一期合作，博弈者就在现期合作；但如果另一个博弈者在前一期违约，博弈者在现期也违约的策略称为（）。 A.一报还一报的策略 B.激发策略 C.双头策略 D.主导企业策略 8.在囚徒困境的博弈中，合作策略会导致（）。 A.博弈双方都获胜 B.博弈双方都失败

C.使得先采取行动者获胜 D.使得后采取行动者获胜 9.在什么时候，囚徒困境式博弈均衡最可能实现（）。 A. 当一个垄断竞争行业是由一个主导企业控制时 B.当一个寡头行业面对的是重复博弈时 C.当一个垄断行业被迫重复地与一个寡头行业博弈时 D. 当一个寡头行业进行一次博弈时 10.一个企业采取的行为与另一个企业在前一阶段采取的行为一致，这种策略是一种（）。 A.主导策略 B.激发策略 C.一报还一报策略 D.主导策略 11.关于策略式博弈，正确的说法是（）。 A. 策略式博弈无法刻划动态博弈 B. 策略式博弈无法表明行动顺序 C. 策略式博弈更容易求解 D. 策略式博弈就是一个支付矩阵 12.下列关于策略的叙述哪个是错误的（）： A. 策略是局中人选择的一套行动计划； B. 参与博弈的每一个局中人都有若干个策略； C. 一个局中人在原博弈中的策略和在子博弈中的策略是相同的； D. 策略与行动是两个不同的概念，策略是行动的规则，而不是行动本身。 13. 囚徒困境说明（）： A. 双方都独立依照自己的利益行事，则双方不能得到最好的结果； B. 如果没有某种约束，局中人也可在（抵赖，抵赖）的基础上达到均衡； C. 双方都依照自己的利益行事，结果一方赢，一方输； D、每个局中人在做决策时，不需考虑对手的反应 14. 一个博弈中，直接决定局中人损益的因素是（）： A. 策略组合 B. 策略 C. 信息 D. 行动 15. 动态博弈参与者在关于博弈过程的信息方面是（） A 不对称的 B 对称的 C 不确定的 D 无序的

博弈论与策略思维课后练习

博弈论与策略思维课后练习判断题： 1、理性的参与人应该选择劣策略。[题号：Qhx008231] A、对 B、错您的回答：B 正确答案：B 题目解析：理性的参与人应该选择占优策略，不应该选择劣策略。 2、石头剪刀布是序列博弈。[题号：Qhx008227] A、对 B、错您的回答：B 正确答案：B 题目解析：石头剪刀布是同步博弈。 3、三个火枪手游戏中甲提高生存策略的办法是放空枪。[题号：Qhx008224] A、对 B、错您的回答：A 正确答案：A 题目解析：甲通过改变策略，即放空枪有效提高了生存率。 4、海萨尼建立了“子博弈精炼纳什均衡”的概念。[题号：Qhx008226] A、对 B、错您的回答：B 正确答案：B

题目解析：海萨尼把不完全信息纳入到博弈论方法体系中；泽尔腾的贡献在于将博弈论由静态向动态的扩展，建立了“子博弈精练纳什均衡”的概念。 5、协调博弈只有一个纳什均衡。[题号：Qhx008229] A、对 B、错您的回答：B 正确答案：B 题目解析：协调博弈中至少有两个纳什均衡，具体是哪个均衡组合，需要博弈方协调。单选题： 1、“要想在现代社会做一个有文化的人，你必须对博弈论有一个大致了解”这是（）的名言。[题号：Qhx008236] A、坎贝尔 B、纳什 C、萨缪尔森 D、海萨尼您的回答：C 正确答案：C 题目解析：萨缪尔森的这句话意思为，你也许没必要深入学习博弈论高深的数学模型和推导，但它背后所包含的思维方法等是人类智慧的结晶，你应该要有所掌握。 2、情侣博弈是用（）来寻找纳什均衡的。[题号：Qhx008244] A、占优策略法 B、最优反应法 C、逆向归纳法 D、劣策略重复剔除法您的回答：B 正确答案：B 题目解析：占优策略法、最优反应法以及劣策略重复剔除法是寻找纳什均衡的三种方法，逆向归纳法主要用来推导有限重复博弈的结果。

博弈论习题参考答案(2)

《博弈论》习题参考答案（第2次作业）一、选择题 1.B 2.C 3.A 4.A 5.B 6.ABCD 7.C 8.B 9.C 二、判断正误并说明理由 1.F 上策均衡是比纳什均衡更严格的均衡概论 2.T 上策均衡是比纳什均衡更严格的均衡概论 3.T 博弈类型按局中人数多少分为单人博弈、双人博弈和多人博弈 4.F 博弈双方偏好存在差异的条件下，一个博弈模型中可能存在2个纳什均衡，如性别战 5.T 零和博弈指参与博弈各方在严格竞争下，一方收益等于另一方损失，博弈各方收益与损失之和恒为零，所以双方不存在合作可能性 6.T 上策均衡是通过严格下策消去法（重复剔除下策）所得到的占优策略，只能有一个纳什均衡 7.F 纳什均衡是上策的集合，指在给定的别人策略情况下，博弈方总是选择利益相对较大的策略，并不保证结果是最好的。 8.F 局中人总是以自己的利益最大化选择自己的策略，并不以对方收益的变化为目标 9.T 纳什均衡是上策的集合，指在给定的别人策略情况下，没有人会改变自己的策略而减低自己的收益 10.F 局中人总是以自己的利益最大化选择自己的策略，并不以对方收益的变化为目标 11.F 局中人总是以自己的利益最大化选择自己的策略，并不以对方收益的变化为目标 12.T 虽然斯塔格伯格模型各方利润总和小于古诺模型，但是领导者的利润比古诺模型时高

三、计算与分析题 1、（1）画出A 、B 两企业的损益矩阵。（2）求纯策略纳什均衡。（做广告，做广告） 2、画出两企业的损益矩阵求纳什均衡。（1）画出A 、 B 两企业的损益矩阵（2）求纳什均衡。两个：（原价，原价），（涨价，涨价） 3、假定某博弈的报酬矩阵如下：甲乙左右上下 (1)如果（上，左）是上策均衡，那么，a>?, b>?, g? 答：a>e, b>d, f>h, ge, b>d 4、答：（1 ）将这一市场用囚徒困境的博弈加以表示。（2）解释为什么均衡结果可能是两家公司都选择竞争性策略。答：若新华选择“竞争”，则北方也会选择“竞争”（60000>0）；若新华选择

博弈论——换一种方式思考问题

博弈论——换一种方式思考问题花了一个月的时间研究了下博弈论，收获很多，于是又花了一个礼拜写了这篇算是读后感的日志，希望能激起大家对博弈论的兴趣，尤其是几个经典博弈，真的很有意思。 ? 博弈论的内涵什么是博弈论？简单的说，就是“互动的决策论”，指在充分考虑对方的决策后做出的决策。“博弈论”的英文是“Game Theory”，所以博弈论最贴切的直译是“游戏理论”。现代博弈理论由匈牙利大数学家冯·诺伊曼于20世纪20年代开始创立，对于冯·诺伊曼我们更为熟知的头衔是“计算机之父”，其实，他还有另一个身份，就是“博弈论之父”。1944年，他与经济学家奥斯卡·摩根斯特恩合作出版的巨著《博弈论与经济行为》，标志着现代系统博弈理论的初步形成。诺伊曼与摩根斯特恩认为，博弈论就是运用数学的方法研究有利益冲突的双方在竞争性活动中制定最优化策略的理论。但是诺伊曼所解决的只有二人零和博弈，1949年，21岁的纳什写下一篇著名的论文《多人博弈的均衡点》，提出了纳什均衡的概念和解法。这是整个现代博弈论中最重要的思想之一。相信很多人都知道纳什，因为那部经典的奥斯卡最佳影片《美丽心灵》，他传奇的人生，坚强的毅力，深深的打动了我。他在普林斯顿大学深造时，冯·诺伊曼正好在普林斯顿任教，那个时候的普林斯顿还聚集了众多著名的科学大师，包括罗伯特?奥本海默、诺曼·斯蒂恩罗德以及爱因斯坦，据说纳什曾经造访过爱因斯坦，向他讲述自己对于重力的看法。在一个小时的讨论之后，爱因斯坦对纳什说：“年轻人，你应该来学一点物理。” 1950年和1951年纳什的两篇关于非合作博弈论的重要论文，彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解，并证明了均衡解的存在性，即著名的纳什均衡。表面上看，博弈论似乎是数学家玩的游戏，而事实上，博弈论首先是我们思考现实世界的一套逻辑，其次才是把这套逻辑严密化的数学形式，博弈论的目的在于巧妙的策略，而不是解法。我们学习博弈论的目的，不是为了享受博弈论的分析过程，而在于赢得更好的结局。说到底，博弈论只是一个分析问题的工具，用这个工具来简化问题，使问题的分析清晰明了就够了。 ? 博弈论的基本概念首先我们需要了解的是纳什均衡。在某个房地产开发中，假定市场需求有限，只能满足某种规模的开发量，A、B两个开发商都想开发这一规模的房地产，如果A选择开发，则B 的最优策略是不开发，同样，如果B选择开发，则A的最优策略是不开发。这时无论对A 还是B，都不存在一种策略优于另一种策略，也不存在严格劣策略（不论其它人采取的策略，某人采取对自己不利的策略）。研究这类问题的均衡解，需要引入纳什均衡。在纳什均衡中，每个参与人都确信，在给定其它参与人的策略情况下，己方选择了最优策略。所以在纳什均衡点上，每个参与者的策略都是最好的，此时没人愿意先改变或主动改变自己的策略。在博弈论中，博弈行为都可以分为两类，即零和博弈与非零和博弈。零和博弈是一种完全对抗，强烈竞争的对局。参与者的总收益为零，因此一个参与者的所得必然是另一个参与者的损失。而非零和博弈，是各参与者的目标不完全对立，参与者只按本身的厉害关系单方面做出决策，有时为了共同利益而合作，有时为了个人利益而对立，收益的总和是可变的，参与者可以同时有所得和有所失。

第五章-博弈论与竞争策略

第五章博弈论与竞争策略第一节第二节第三节博弈论的基本概念完全信息静态博弈重复博弈和序列博弈在现实经济社会，完全垄断和完全竞争的市场结构十分少见。厂商在市场中既有一定的垄断势力，又面临很大的竞争压力。厂商之间具有相关性和依存性。因此，可以用博弈论的方法解释和说明厂商的竞争行为和策略。博弈论是70年代中期以来微观经济学发展的一个重要方面。1994年的诺贝尔经济学奖被授予博弈论专家：纳什（Nash）、泽尔腾（Selten）和海萨尼（Harsanyi），他们都对博弈论在经济学中的应用作出了贡献。 70年代以来，博弈论已经发展成为现代经济学的基础重要基础之一，改变了传统经济学的结构，这主要有两个方面的原因： 1．传统经济学着重研究市场机制和价格制度，分析完全竞争市场中的最优决策，不考虑决策者之间的相互影响。但是，现实经济运行中市场是不完全竞争的，行为主体之间的决策具有相互影响。 2．完全竞争市场是以完全信息为条件的，这在现实经济运行中也难以保证。在信息不对称条件下，考虑行为主体相互影响的非价格制度可以用博弈论分析。当然，应用博弈论解决竞争策略问题也是有条件的。除了掌握博弈论方法外，关键是正确估计各参与者的策略空间和收益函数。第一节博弈论的基本概念一．博弈论及其特点 1．博弈和博弈论博弈是指具有不同利益和目标的多个行为主体共同参加并相互影响的事态发展过程中的策略决策。博弈论（Game Theory）也称对策论，它是一种分析博弈过程和结果的数学方法，研究具有理性的多个行为主体的决策和行动直接相互作用和影响时，事态发展过程的决策和均衡问题。广泛应用于政治、军事、经济、外交和日常生活的许多领域。 2．特点：（1）参与者具有各自的目标：（2）参与者都是理性行为者；（3）参与者之间具有相关性；（4）事态发展的结果取决于全部参与者的共同行为；（5）参与者要根据对其他参与者的判断决定自己的行动，因而是对策。可见，博弈论是与优化论不同的决策理论。优化论是一种单人决策理论；博弈论所揭示的规律是一种多人决策理论。二．博弈论的基本概念在博弈论中，博弈的基本要素被概括为以下概念： 1）参与者Players （玩家）：即参加博弈过程的行为和决策主体，也是利益主体。在一个博弈中，最少要有两个参与者。 2）策略Strategies （战略或策略行为）：即参与者在某个博弈时点，根据其掌握的有关博弈信息而选择的决策变量和行动计划，一个参与者的全部可行策略称为他的策略空间。接上页 3）收益Payoff（支付、得益）和收益函数：收益是指在既定策略组合条件下参与者的得失情况。每个参与者的收益取决于全部参与者所采取的策略，称为收益函数。 4）结局 outcome（结果）：指博弈的结果，指既定策略组合条件下全部参与者所得收益的集合。 5）均衡 Equilibrium （均势）：指达到稳定的策略组合或结局。 6）博弈规则：指参与者、策略、结局之间的联系。它是由博弈的环境和参与者之间的相互影响决定的。例：可口可乐与百事可乐（参与者）的价格决策：双方都可以保持价格不变或者提高价格（策略）博弈的目标和得失情况体现为利润的多少（收益）利润的大小取决于双方的策略组合（收益函数）博弈有四种策略组合，其结局是：（1）如果双方都不涨价，各得利润10单位；（2）如果可口可乐不涨价，百事可乐涨价，可口可乐利润100，百事可乐利润-30；（3）如果可口可乐涨价，百事可乐不涨价，可口可乐利润-20，百事可乐利润30；

博弈论06 混合策略4

博弈论石头剪子布游戏石头剪子布游戏石头剪子布游戏石头剪子布游戏石头剪子布游戏石头剪子布游戏求混合策略的收益等值法求混合策略的收益等值法

田忌赛马田忌赛马出自《史记》卷六十五：《孙子吴起列传第五》，是中国历史上有名的揭示如何善用自己的长处去对付对手的短处、从而在竞技中获胜的事例。田忌赛马齐使者如梁，孙膑以刑徒阴见，说齐使。齐使以为奇，窃载与之齐。齐将田忌善而客待之。忌数与齐诸公子驰逐重射。孙子见其马足不甚相远，马有上、中、下辈。于是孙子谓田忌曰：“君弟重射，臣能令君

胜。”田忌信然之，与王及诸公子逐射千金。及临质，孙子曰：“今以君之下驷与彼上驷，取君上驷与彼中驷，取君中驷与彼下驷。”既驰三辈毕，而田忌一不胜而再胜，卒得王千金。于是忌进孙子于威王。威王问兵法，遂以为师。田忌赛马田忌赛马的均衡田忌赛马的均衡田忌赛马的均衡情侣博弈混合策略均衡

情侣博弈有两个纯策略纳什均衡，同时情侣博弈是协调博弈，博弈中的两个局中人具有策略一致性，如果一方知道了另一方的选择，则会选择与对方一致的策略，换句话说，两个局中人都不害怕对方猜到自己的选择。但由于该博弈有两个纳什均衡，而情侣双方对两个纳什均衡的偏好各不相同，因此当俩人从自身最大利益出发独立同时决策时，仍然无法确定博弈的结果是那个纯策略组合，因此需要考虑局中人采用混合策

略的可能性。情侣博弈混合策略均衡如果男方不想让女方利用自己的选择占上风，则自己的概率选择应使情侣博弈混合策略均衡男方的(3/4,1/4)和女方的(1/4,3/4)构成一个混合策略纳什均衡。在该均衡下，双方的期望收益都是0.5，显然不如双方能协调一致、或者一方迁就另一方