搜档网
当前位置:搜档网 › 微观经济学之博弈模型与竞争策略

微观经济学之博弈模型与竞争策略

范里安《微观经济学:现代观点》(第9版)课后习题详解-(博弈论的应用)【圣才出品】

第30章博弈论的应用 1.在一个双人博弈纳什均衡中,每一个参与人都在针对什么作出最优的反应?在一个占优策略均衡中,每一个参与人又都在针对什么作出最优的反应? 答:(1)在纳什均衡中,每个参与人都对其他选手的最优反应作出了自己的最优反应。 (2)在一个占优策略均衡中,每个参与人的选择都是对其他选手所有选择的最优反应。特别地,占优均衡一定是纳什均衡,但纳什均衡却未必是占优均衡。 2.在有关混合策略的章节中,考虑行参与人和列参与人的最优反应。它们会产生最优反应函数吗? 答:行参与人和列参与人没有最优反应函数。如图30-1所示,这两条曲线分别体现了行参与人和列参与人对应于对方选择时的最优反应。曲线的交点就是纳什均衡。在这种情况下,博弈存在三个均衡,其中,两个是纯策略均衡,一个是混合策略均衡。当行参与人选择r=2/3时,列参与人存在无穷多个最优反应,而不是像函数的数学定义所要求的那样,只有一个最优反应。

图30-1 最优反应曲线 3.在一个合作博弈中,如果博弈双方作出相同的选择,那么,结果对于他们两个对这都令人满意。这个结论是否正确? 答:这个说法不正确。 这是因为合作博弈的结果取决于博弈的收益,而非两个人是否选择相同的策略。比如在汽车博弈中,如果双方都选择直线驾驶,他们将陷入最糟糕的境况。 4.本章正文指出,在均衡状态,行参与人在62%的时间内会得分。这个数值是如何得到的? 答:博弈的均衡策略为“行参与人按0.7的概率踢向左方,而列参与人以0.6的概率扑向左方”,由于射门方向和扑救方向共有四种组合,从而得到每种组合的概率分布如表30-1所示。 表30-1不同组合的概率分布

博弈论浅谈

博弈论浅谈 在查找博弈论课题资料的过程中,不禁发现自己已经深深地被这门数学分支吸引住了。我想,这门学问的魅力主要在于它的实用性,数学中很少有一个方面能够被如此广泛地应用到实际生产实践、解释自然界的现象当中。而博弈论无疑是这其中一个既吸引数学家也吸引着数学“门外汉”的“大众科学”了。 博弈论又称对策论,主要研究斗争性或竞争性现象的理论解决方法,是现代数学的分支,也是运筹学的一部分。博弈论会考虑竞争过程中的个体的预测行为和实际行为,并研究它们的优化以达到最优化策略。一般以1928年数学家、计算机专家冯·诺依曼证明了博弈论的基本原理这一事件作为博弈论正式诞生的标志。发展至今已经渐趋完善,此过程中有许多优秀的学者如冯·诺伊曼、约翰·纳什等为之作了卓越贡献。由于博弈论与经济学类相关甚紧,博弈论中某一理论的研究常常会带来经济学领域的一大突破,正如1994年约翰·纳什作为数学家获诺贝尔经济学奖所体现的一样,这种跨学科的效应在博弈论学中淋漓尽致地体现了出来。 “博弈论”该词在现代社会可以说是脍炙人口,在各种大型讲演和授课中经常能听到,但我个人觉得这个词的翻译不如它的英文源词“Game Theory”一样直白。“Game Theory”如果理解为“游戏的理论”更能够清晰地向一位不了解博弈论的人介绍这门科学。至于上升

到“博弈”的层次当然也是有其原因的。“Games”在当代早已将其内涵和外延延伸至社会科学、自然科学的方方面面,已经不仅仅停留在“游戏”的层面上。广义上来说,一个结构中的群体之间的相互作用构成一个博弈。狭义一点,社会中人群之间或集团之间的合作、承诺、互相利用等也是博弈论的体现。从理论上讲,博弈论是研究理性的行动者相互作用的形式理论,因为博弈论的基本假定是博弈各方的行动者具有推理能力,在具体策略选择时的目的是使自己的利益最大化。博弈论研究的是理性的博弈方之间如何进行策略选择的。由此可知,大到社会的发展、生物的繁衍,小至下棋打牌都可以看作是博弈。这么说来博弈论对于我们来说一点也不陌生,这些不正是与我们息息相关的日常事务?中国人对博弈论自古代就有深入的了解,甚至有将其理论系统化。比如《三十六计》就将当时军事上使用的计谋等集中收集到了一起,这种“计谋”其实就是指导人们的博弈理论。 作为数学的一个分支,且不论博弈论对自然科学的重要性,它还对社会科学有着重要的意义,是社科研究范式中的一种核心工具,以至于我们可称博弈论是“社会科学的数学”,或者说是关于社会的数学。而实际上它正深入到经济学、政治学、社会学等等,被各门社会科学所应用。它还深刻地改变着人们的思维,如人们熟知的“囚徒困境”“海盗分宝石”等问题已经作为经济学、心理学的经典案例;成功企业中的高管与智囊团因善于博弈、制定正确的发展战略而使公司利于不败之地;政府公务员在制订法律、颁布政策时也需要不断利用博弈理论,站在人民的角度看问题从而进一步完善规章制度以促进外

《博弈论原理模型与教程》第06章扩展式博弈第01节.

《博弈论:原理、模型与教程》 第二部分完全信息动态博弈 第6章扩展式博弈 (已精细订正!) 对博弈问题的规范性描述是科学、系统地分析博弈问题的基础。 前面介绍了一种常用的博弈问题描述方式—战略式博弈,虽然这种博弈模型结构简单,只要给出博弈问题的三个基本构成要素(即参与人、参与人的战略集及参与人的支付),就可完成对博弈问题的建模。 但是,由于战略式博弈假设每个参与人仅选择一次行动或行动计划(战略),并且参与人同时进行选择,因此从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 虽然战略式博弈也可以对动态博弈问题进行建模,但是从所得到的模型中只能看到博弈的结果,而无法直观地了解到博弈问题的动态特性。 本章将介绍一种新的博弈问题描述方式—扩展式博弈。从扩展式博弈模型中,不仅可以看到博弈的结果,而且还能直观地看到博弈的进程。在介绍扩展式博弈构成的基础上,还将对扩展式博弈的战略和解进行讨论。 6.1 扩展式博弈(文字描述、博弈树描述) 所谓扩展式博弈(extensive form game),是博弈问题的一种规范性描述。与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中所遇到决策问题的序列结构的详细分析。 一般而言,要了解一个博弈问题的具体进程,就必须弄清楚以下两个问题: (1)每个参与人在什么时候行动(决策、选择); (2)每个参与人行动时,他所面临决策问题的结构,包括参与人行动时可供他选择的行动方案及所了解的信息(集)。 [注: 行文中频繁出现的“行动”一词,有两义: 其一,动词的“行动”,指选择、决策。 其二,名词的“行动”,指策略、战略、谋略、行动方案、方案。] 上述两个问题构成了参与人在博弈过程中所遇到决策问题的序列结构。对于一个博弈问题,如果能够说清楚博弈过程中参与人的决策问题的序列结构,那么就意味着知道了博弈问题的具体进程。

纳什博弈论的原理与应用的论文

纳什博弈论的原理与应用的论文 1950年和1951年纳什的两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡。从而揭示了博弈均衡与经济均衡的内在联系。纳什的研究奠定了现代非合作博弈论的基石,后来的博弈论研究基本上都沿着这条主线展开的。然而,纳什天才的发现却遭到冯·诺依曼的断然否定,在此之前他还受到爱因斯坦的冷遇。但是骨子里挑战权威、藐视权威的本性,使纳什坚持了自己的观点,终成一代大师。要不是30多年的严重精神病折磨,恐怕他早已 站在诺贝尔奖的领奖台上了,而且也绝不会与其他人分享这一殊荣。 纳什是一个非常天才的数学家,他的主要贡献是1950至1951年在普林斯顿读博士学位时做出的。然而,他的天才发现———非合作博弈的均衡,即“纳什均衡”并不是一帆风顺的。 1948年纳什到普林斯顿大学读数学系的博士。那一年他还不到20岁。当时普林斯顿可谓人杰地灵,大师如云。爱因斯坦、冯·诺依曼、列夫谢茨(数学系主任)、阿尔伯特·塔克、阿伦佐·切奇、哈罗德·库恩、诺尔曼·斯蒂恩罗德、埃尔夫·福克斯……等全都在这里。博弈论主要是由冯·诺依曼(1903—1957)创所立的。他是一位出生于匈牙利的天才的数学家。他不仅创立了经济博弈论,而且发明了计算机。早在20世纪初,塞梅鲁(zermelo)、鲍罗(borel)和冯·诺伊曼已经开始研究博弈的准确的数学表达,直到1939年,冯·诺依曼遇到经济学家奥斯卡·摩根斯特恩(oskar morgenstern),并与其合作才使博弈论进入经济学的广阔领域。 1944年他与奥斯卡·摩根斯特恩合著的巨作《博弈论与经济行为》出版,标志着现代系统博弈理论的的初步形成。尽管对具有博弈性质的问题的研究可以追溯到19世纪甚至更早。例如,1838年古诺(cournot)简单双寡头垄断博弈;1883年伯特兰和1925年艾奇沃奇思研究了两个寡头的产量与价格垄断;2000多年前中国著名军事家孙武的后代孙膑利用博弈论方法帮助田忌赛马取胜等等都属于早期博弈论的萌芽,其特点是零星的,片断的研究,带有很大的偶然性,很不系统。冯·诺依曼和摩根斯特恩的《博弈论与经济行为》一书中提出的标准型、扩展型和合作型博弈模型解的概念和分析方法,奠定了这门学科的理论基础。合作型博弈在20世纪50年代达到了巅峰期。然而,诺依曼的博弈论的局限性也日益暴露出来,由于它过于抽象,使应用范围受到很大限制,在很长时间里,人们对博弈论的研究知之甚少,只是少数数学家的专利,所以,影响力很有限。正是在这个时候,非合作博弈———“纳什均衡”应运而生了,它标志着博弈论的新时代的开始!纳什不是一个按部就班的学生,他经常旷课。据他的同学们回忆,他们根本想不起来曾经什么时候和纳什一起完完整整地上过一门必修课,但纳什争辩说,至少上过斯蒂恩罗德的代数拓扑学。斯蒂恩罗德恰恰是这门学科的创立者,可是,没上几次课,纳什就认定这门课不符合他的口味。于是,又走人了。然而,纳什毕竟是一位英才天纵的非凡人物,他广泛涉猎数学王国的每一个分支,如拓扑学、代数几何学、逻辑学、博弈论等等,深深地为之着迷。纳什经常显示出他与众不同的自信和自负,充满咄咄逼人的学术野心。1950年整个夏天纳什都忙于应付紧张的考试,他的博弈论研究工作被迫中断,他感到这是莫大的浪费。殊不知这种暂时的“放弃”,使原来模糊、杂乱和无绪的若干念头,在潜意识的持续思考下,逐步形成一条清晰的脉络,突然来了灵感!这一年的10月,他骤感才思潮涌,梦笔生花。其中一个最耀眼的亮点就是日后被称之为“纳什均衡”的非合作博弈均衡的概念。纳什的主要学术贡献体现在1950年和1951年的两篇论文之中(包括一篇博士论文)。1950年他才把自己的研究成果写成题为“非合作博弈”的长篇博士论文,1950年11月刊登在美国全国科学院每月公报上,立即引起轰动。说起来这全靠师兄戴维·盖尔之功,就在遭到冯·诺依曼贬低几天之后,他遇到盖尔,告诉他自己已经将冯·诺依曼的“最小最大原理”(minimax solution)推到非合作博弈领域,找到了普遍化的方法和均衡点。盖尔

博弈论经典例子

博弈论经典例子 篇一:《博弈论三大经典案例》 经典的囚徒困境 1950年,由就职于兰德公司的梅里尔弗拉德(MerrillFlood)和梅尔文德雷希尔(MelvinDresher)拟定出相关困境的理论,后来由顾问阿尔伯特塔克(AlbertTucker)以囚徒方式阐述,并命名为"囚徒困境"。经典的囚徒困境如下: 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 若一人认罪并作证检举对方(相关术语称"背叛"对方),而对方保持沉默,此人将即时获释,沉默者将判监xx年。若二人都保持沉默(相关术语称互相"合作"),则二人同样判监半年。若二人都互相检举(互相"背叛"),则二人同样判监2年。 用表格概述如下: 甲沉默(合作) 乙沉默(合作)二人同服刑半年甲认罪(背叛)甲即时获释;乙服刑xx 年乙认罪(背叛)甲服刑xx年;乙即时获释二人同服刑2年 如同博弈论的其他例证,囚徒困境假定每个参与者(即"囚徒")都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为"严格劣势",理性的参与者绝不会选择。另外,没有任何

其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 若对方沉默、背叛会让我获释,所以会选择背叛。若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 二人面对的情况一样,所以二人的理性思考都会得出相同的结论选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是"困境"所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。由囚徒困境可以写出类似的员工困境: 一名经理,数名员工;前提,经理比较苛刻; 如果所有员工都听从经理吩咐,则奖金等待遇一样,不过所有人

博弈论的基础知识与应用

博弈论的基础知识与应用(转) 1 基础知识 博弈论是一种独特的处于各学科之间的研究人类行为的方法。与博弈论有关的学科包括数学、经济学以及其他社会科学和行为科学。博弈论(如同计算科学理论和许多其他的贡献一样)是由约翰.冯.诺伊曼(John von Neumann)创立的。博弈论领域第一本重要著作是诺伊曼与另一个伟大的数理经济学家奥斯卡.摩根斯坦(Oskar Morgenstern)共同写成的《博弈论与经济行为》(The Theory of Games and Economic Behavior)。当然,摩根斯坦把新古典经济学的思想带入了合作中,但是诺伊曼也同样意识到那些思想并对新古典经济学做出了其他的贡献。 ■一个科学的隐喻 由于诺伊曼的工作,在更广阔的人类行为互动的范围内,“博弈”成为了一个科学的隐喻。在人类的互动行为中,结局依赖于两个或更多的人们所采取的交互式的战略,这些人们具有相反的动机或者最好的组合动机(mixed motives)。在博弈论中常常讨论的问题包括:1)当结局依赖于其他人所选择的战略以及信息是完全的时候,“理性地”选择战略意味着什么? 2)在允许共同得益或者共同损失的“博弈”中,寻求合作以实现共同得益(或避免共同损失)是否“理性”?或者,采取侵略性的行动以寻求私人利益而不顾共同得益或共同损失,这是否是“理性”的? 3)如果对2)的回答是“有时候是”,那么在什么样的环境下侵略是理性的,在什么样的情况下合作是理性的? 4)在特定情况下,正在持续的关系与单方退出这种关系是不同的吗? 5)在理性的自我主义者的行为互动中,合作的道德规则可以自然而然地出现吗? 6)在这些情况下,真正的人类行为与“理性”行为是否相符? 7)如果不符,在那些方面不符?相对于“理性”,人们更倾向于合作?或者更倾向于侵略?抑或二者皆是? 因而,博弈论研究的“博弈”包括: 破产 门口的野蛮人(Barbarians at the Gate) 网络战(Battle of the Networks) 货物出门,概不退换(Caveat Emptor) 征召(Conscription) 协调(Coordination) 逃避(Escape and Evasion) 青蛙呼叫配偶(Frogs Call for Mates) 鹰鸽博弈(Hawk versus Dove) Mutually Assured Destruction 多数决定原则(Majority Rule) Market Niche 共同防卫(Mutual Defense) 囚徒困境(Prisoner’s Dilemma) 补贴小商业Subsidized Small Business 公共地悲剧Tragedy of the Commons 最后通牒Ultimatum

博弈论

博弈论 是一种处理竞争与合作问题的数学决策方法;研究竞争中参加者为争取最大利益应当如何做出决策的数学方法;根据信息分析及能力判断,研究多决策主体之间行为相互作用及其相互平衡,以使收益或效用最大化的一种对策理论;研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。 博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论著作。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。近代对于博弈论的研究,开始于策墨洛(Zermelo),波雷尔(Borel)及冯·诺伊曼(von Neumann)。 1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。1950~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般

化奠定了坚实的基础。纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的学科。 博弈的分类根据不同的基准也有所不同。一般认为,博弈主要可以分为合作博弈和非合作博弈。它们的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。从行为的时间序列性,博弈论进一步分为两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。通俗的理解:"囚徒困境"就是同时决策的,属于静态博弈;而棋牌类游戏等决策或行动有先后次序的,属于动态博弈。按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。完全博弈是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。如果参与人对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的准确信息,在这种情况下进行的博弈就是不完全信息博弈。目前经济学家们现在所谈的博弈论一般是指非合作博弈,由于合作博弈论比非合作博弈论复杂,在理论上的成熟度远远不如非合作博弈论。非合作博弈又分为:完全信

范里安《微观经济学:现代观点》【教材精讲+考研真题解析】第28章 博弈论 【圣才出品】

第28章博弈论 28.1本章要点 ●纳什均衡 ●囚徒困境 ●序贯博弈 28.2重难点解读 博弈论关注的是对策略互动的一般性分析,它可以应用于研究营业博弈、政治谈判和经济行为等。 一、博弈的收益矩阵 假设两人进行简单的博弈,参与人A在纸上记下“上”或“下”。同时,参与人B独立地在另一张纸上记下“左”或“右”。他们最终获得的收益如表28-1所示。

表28-1博弈的收益矩阵 占优策略:不论其他参与人如何选择,每个参与人都有一个最优策略(there is one optimal choice of strategy for each player no matter what the other player does.)。如果在某个博弈中,每个参与人都有一个占优策略,那么,可以预期这个占优策略组合就是该博弈的均衡结果。 二、纳什均衡 纳什均衡:如果其他参与人不改变自己的策略,任何一个参与人都不会改变自己策略的均衡状态。即如果给定B的选择,A的选择是最优的,并且给定A的选择,B的选择也是最优的。那么,这样一组策略就是一个纳什均衡,即给定其他人的选择,每个参与人都作出了最优的选择(each person is making the optimal choice,given the other person’s choice)。一个纳什均衡可以看作关于每个参与人的策略选择的这样一组预期,这些预期使得当任何一个人的选择被揭示后,没有人愿意改变自己的行为,如表28-2所示。 表28-2一个纳什均衡

纳什均衡的评价: 第一,一个博弈可能会存在一个以上的纳什均衡。表28-2中,策略组合(下,右)与(上,左)都是纳什均衡。 第二,有一些博弈根本不存在纳什均衡,如表28-3所示。 表28-3不存在(纯策略)纳什均衡的博弈 三、混合策略 纯策略:每个参与人只选择一种策略并始终坚持这个选择。 混合策略:参与人随机化按照概率选择策略。 混合策略纳什均衡:给定其他参与人的策略选择概率,每个参与人都为自己确定了选择每一种策略的最优概率。 表28-3所示的例子中,可以证明,如果参与人A以3/4的概率选择策略“上”,以1/4的概率选择策略“下”,参与人B以1/2的概率选择策略“左”,以1/2的概率选择策略“右”,那么,这个混合策略组合就构成一个纳什均衡。

博弈论的基本概念

博弈论的基本概念 ?博弈论是研究两人或多人谋略和决策的理论。 ?博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的的学科。 ?参与者:参与者是指一个博弈中的决策主体,通常又称为参与人或局中人。 参与人的目的是通过合理悬着自己的行动,以便取得最大化的收益。参与者可以是自然人,也可以是团体。 ?信息:信息是指参与者在博弈过程中能了解和观察到的知识。信息对参与者是至关重要,每一个参与者在每一次进行决策之前必须根据观察到的其他参与者的行动和了解到的有关情况作出自己的最佳选择。完全信息是指所有参与者各自选择的行动的不同组合所决定的收益对所有参与者来说是共同知识。

?策略:策略是参与者如何对其他参与者的行动作出反应的行动规则,它规定参与者在什么时候选择什么行动。通常用s i表示参与者i的一个特定策略,用S i表示参与者i的所有可选择的策略的集合(又成为而i的策略空间)。如果n个参与者没人选择一个策略,那么s=(s1,s2,…,s n)称为一个策略组合。 ?收益:收益是在一个特定的策略组合下参与者能得到的确定的效用。通常用u i表示参与者i的收益,它是策略组合的函数。 ?均衡:均衡是所有参与者的最优策略组合,记为s*。 几个经典的博弈实例 ?例一囚徒困境两个共同作案的犯罪嫌疑人被捕,并受到指控。除非至少一人认罪,否则警方无充分证据将他们按最论刑。警方把他们隔离审讯,并对他们说明不同行动所带来的后果。如果两人都采取沉默的抗拒态度,因警方证据不足,两人将均被判为轻度犯罪入狱一个月;如果双方都坦白,根据案情两人将被判入狱六个月;如果一个招认而另一个拒不坦白,招认者因由主动认罪立功的表现将立即释放,而另一人将被判入狱九个月。

高鸿业,微观经济学,第七版,课后答案,西方经济学18第十章博弈论初步

第十章 博弈论初步 第一部分 教材配套习题本习题详解 一、简答题 1.什么是纳什均衡?纳什均衡一定是最优的吗? 解答:(1)所谓纳什均衡,是参与人的一种策略组合,在该策略组合上, 任何参与人单独改变策略都不会得到好处。 (2)不一定。如果纳什均衡存在,纳什均衡可能是最优的,也可能不是最优的。例如,在存在多个纳什均衡的情况下,其中有一些纳什均衡就不是 最优的;即使在纳什均衡是唯一时,它也可能不是最优的,因为与它相对应的支付组合可能会小于与其他策略组合相对应的支付组合。如:囚徒 困境。 2.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下, 纯策略的纳什均衡最多可有几个?为什么? 解答:在只有两个参与人 (如 A和 B)且每个参与人都只有两个策略可供选择的情况下,纯策略的纳什均衡最多可有四个。例如,当A与B的支付矩阵可分别表示如下时,总的支付矩阵中所有四个单元格的两个数字均有下划线,从而,总共有四个纳什均衡。 A 的支付矩阵=??????22211211a a a a B 的支付矩阵=??? ???2221 1211b b b b 例如:a 11=a 12=a 21=a 22,b 11=b 12=b 21=b 22就会得到以上四个纳什均衡。 具体事例为: 73737373?? ?? ??

3.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,纯策略的纳什均衡可能有三个。试举一例说明。 解答:在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,纯策略的 纳什均衡可能有4个、3个、2个、1个和0个五种情况,所以可能有3个。例如,当参与 人A与B的支付矩阵可分别表示如下时,总的支付矩阵中恰好有三个单元格的两个数字均有下划线,从而,总共有三个纳什均衡。 A 的支付矩阵= ??? ???22211211a a a a B 的支付矩阵=11122122b b b b ???????? A 、 B 共同的支付矩阵=1111121222222121a b a b a b a b ?? ?????? 具体事例为: 76157323?? ?? ?? 4.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,如何找到所 有的纯策略纳什均衡? 解答:可使用条件策略下划线法。具体步骤如下:首先,把整个博弈的支付矩阵分解 为两个参与人的支付矩阵;其次,在第一个 (即位于整个博弈矩阵左方的)参与人的支付矩阵中,找出每一列的最大者,并在其下画线;再次,在第二个 (在位于整个博弈矩阵上 方的)参与人的支付矩阵中,找出每一行的最大者,并在其下画线;然后,将已经画好线的两个参与人的支付矩阵再合并起来,得到带有下划线的整个博弈的支付矩阵;最后,在带有下划线的整个的支付矩阵中,找到两个数字之下均画有线的支付组合。由该支付组合 代表的策略组合就是博弈的纳什均衡。 5.设有A、B两个参与人。对于参与人A的每一个策略,参与人B的条件策略有无 可能不止一个?试举一例说明。 解答:例如,在如表10—1的二人同时博弈中,当参与人 A选择上策略时,参与人 B 既可以选择左策略,也可以选择右策略,因为他此时选择这两个策略的支付是完全一样 的。因此,对于参与人A的上策略,参与人B的条件策略有两个,即左策略和右策略。 表10—1

(完整word版)博弈论给我的心得

博弈论给我的心里体会 潘慧明 201202034049 12金融数学 我是大学第二学期开始选修学习《博弈论》的,并且以前对它停留在表面意思。而在我的进一步对《博弈论》的学习下,我懂得了这门课程在我们的生活中无处不在,在未学习这门课程之前我对身边发生的一些事情无法用一个专业的学说来概述,经过这个学期的学习后,我才知道我身边发生的很多事情都可以用这门课程概述。那么什么是“博弈论”?所谓的“博弈论”——就是研究决策主体的行为发生直接相互作用时的决策及这种决策的均衡问题。并且学习后我还有个感受就是:博弈论有两个比较enlightening的观点,一是more information can hurt you(掌握更多的信息可能是一件坏事),二是more options can hurt you(拥有更多的选择可能是一件坏事).虽然博弈论主要用于研究经济问题,但是我觉得这些原理在我们现实生活中同样是适用的。 而且经过这段时间的学习,我现在对《博弈论》有了些比较肤浅的认识。诚然,一门学问想在短时间内有所深入理解是不现实的。生活之中到处充满着博弈,有人说没有,那是因为缺少发现博弈现象的眼睛。因此在生活中我们要懂得学以致用,要会灵活的去使用这门学科。 人生就是在弈棋,学会博弈。虽说博弈不是万能的,但没有博弈现象存在的生活是万万不能的。 社会生活中,共赢是一种优良的博弈方式。双赢策略其实是一种很高的智慧,帮助别人的同时接受别人的帮助,双方最终将获得独自奋战所不能拥有的东西。放弃内心的宁予外贼不予家奴的思想。中国人对竞争的理解大多不是“你死”就是“我活”,胜利的含义似乎就是阻止别人成功,可是这“胜利”是那么虚假,经不起风吹雨打,经不起时间考验。拥抱双赢,拥抱明天。双赢强调的是博弈双方的利益都要兼顾,就是所谓的“赢者不全赢,输者不全输”。但是双方都得到了满意的结果。这些双赢的事例,在商务上经常可以看到的。如:商务上的谈判,完完全全的运用到了《博弈论》的知识与原理来分析问题,并且从而找到最佳的均衡点,也就是最好的解决方法。 在所有的对抗和较量中,其胜负成败常常取决于三个基本的因素:机会或者说运气、体能和智能。头脑技能是一种策略技巧,或者说是在谋略方面的造诣。既然世间大多数对抗都与头脑技能有关,因此人们试图获得成功,就有必要研究在对抗局势中如何策略性地选择自己的行动。而今,博弈论就是一门专门研究互动局势下人们的策略行为的学问。事实上,每

博弈论案例分析

(1)失火了,你往哪个门跑 失火了,你往哪个门跑——这就是博弈论 一天晚上,你参加一个派对,屋里有很多人,你玩得很开心。这时候,屋里突然失火,火势很大,无法扑灭。此时你想逃生。你的面前有两个门,左门和右门,你必须在它们之间选择。但问题是,其他人也要争抢这两个门出逃。如果你选择的门是很多人选择的,那么你将因人多拥挤、冲不出去而烧死;相反,如果你选择的是较少人选择的,那么你将逃生。这里我们不考虑道德因素,你将如何选择?这就是博弈论! 你的选择必须考虑其他人的选择,而其他人的选择也考虑你的选择。你的结果——博弈论称之为支付,不仅取决于你的行动选择——博弈论称之为策略选择,同时取决于他人的策略选择。你和这群人构成一个博弈(game)。 上述博弈是一个叫张翼成的中国人在1997年提出的一个博弈论模型,被称之为少数者博弈或少数派博弈(Minority Game)。当然,原来的博弈形式不是这么简单,这里我把它简化了,我们在第三部分论述归纳推理时还要谈这个博弈模型。现在很多学者在研究这个问题。 生活中博弈的案例很多,你会见到很多例子。只要涉及到人群的互动,就有博弈。 什么叫博弈?博弈的英文为game,我们一般将它翻译成“游戏”。而在西方,game的意义不同于汉语中的游戏。在英语中,game即是

人们遵循一定规则下的活动,进行活动的人的目的是使自己“赢”。奥林匹克运动会叫Olympic Games。在英文中,game有竞赛的意思,进行game的人是很认真的,不同于汉语中游戏的概念。在汉语中,游戏有儿戏的味道。因此将关于game的理论,即game theory翻译成博弈论或者对策论,是恰当的。本书下面统称game theory为博弈论。 博弈论的出现只有50多年的历史。博弈论的开创者为诺意曼与摩根斯坦,他们1944年出版了《博弈论与经济行为》。诺意曼是着名的数学家,他同时对计算机的发明作出了巨大贡献,他去世时博弈论还未对经济学产生广泛影响,否则经济学的诺贝尔奖肯定有他的名字,因为诺贝尔奖有规定,只颁发给在世的学者。谈到博弈论,不能忽略博弈论天才纳什(John Nash)。纳什的开创性论文《n人博弈的均衡点》(1950)、《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。今天博弈论已发展成一个较完善的学科。 博弈论对于社会科学有着重要的意义,它正成为社会科学研究范式中的一种核心工具,以至于我们可称博弈论是“社会科学的数学”,或者说是关于社会的数学。从理论上讲,博弈论是研究理性的行动者(agents)相互作用的形式理论,而实际上它正深入到经济学、政治学、社会学等等,被各门社会科学所应用。甚至有学者声称要用博弈论重新改写经济学。1994年经济学诺贝尔奖颁发给三位博弈论专家:纳什、塞尔屯、哈桑尼(),而像1985年获得诺贝尔奖的公共选择学派的领导者布坎南,1995年获得诺贝尔奖的理性主义学派的领袖卢

零和游戏原理的故事

零和游戏原理的故事 导读:零和游戏原理源于博弈论。博弈论的英文名为GAME THEORY,直译就是“游戏理论”。一项游戏中,胜方所得与负方所失相同,两者相加,正负相抵,和数必为零,这就是所谓的“零和”。 “零和游戏”之所以广受关注,主要是因为人们发现,在社会的方方面面都有与“零和游戏”相类似的局面,胜利者的光荣后面往往隐蔽着失败者的辛酸和苦涩。但20世纪以来“零和游戏”观念正逐渐被“非零和游戏”即“负和”或“正和”观念所代替。“负和游戏”指,一方虽赢但付出了惨重的代价,得不偿失,可谓没有赢家。赢家所得比输家所失多,或者没有输家,结果为“双赢”或“多赢”,称为“正和”。在竞争社会中,人们开始认识到利已不一定要建立在损人的基础上。有效合作,得到的是皆大欢喜的结局。 从“零和”走向“正和”,要求各方要有真诚合作的精神和勇气,遵守游戏规则,不要耍小聪明,不要总想占别人的小便宜,否则,“双赢”的'局面就不会出现,吃亏的最终还是自己。 寓意:物质决定意识,要求我们做到一切从实际出发。从实际出发,不是从单一的因素出发,而是要从复杂的全面的实际出发,去具体分析每一个事实,这样才能真正做到一切从实际出发。“零和”“负和”和“正和”是游戏结果的三种事实,过去人们只从“零和”这个单一事实出发,而不能从全面的实际出发,尤其是忽视了“正和”这一事实,从而导致了人们形成了错误的主观认识,给个人和社会带来

了一定的损失。 【零和游戏原理的故事】 1.哲理故事:零和游戏原理 2.原理网络游戏作文400字 3.狼和羊的故事 4.零食的故事作文500字 5.狼和羊的故事作文 6.钱商和匪徒的故事 7.狼和羊的故事开学作文 8.烟神和火神的故事 上文是关于零和游戏原理的故事,感谢您的阅读,希望对您有帮助,谢谢

第五章-博弈论与竞争策略

第五章博弈论与竞争策略 第一节第二节第三节博弈论的基本概念完全信息静态博弈重复博弈和序列博弈 在现实经济社会,完全垄断和完全竞争的市场结构十分少见。厂商在市场中既有一定的垄断势力,又面临很大的竞争压力。厂商之间具有相关性和依存性。因此,可以用博弈论的方法解释和说明厂商的竞争行为和策略。博弈论是70年代中期以来微观经济学发展的一个重要方面。1994年的诺贝尔经济学奖被授予博弈论专家:纳什(Nash)、泽尔腾(Selten)和海萨尼(Harsanyi),他们都对博弈论在经济学中的应用作出了贡献。 70年代以来,博弈论已经发展成为现代经济学的基础重要基础之一,改变了传统经济学的结构,这主要有两 个方面的原因: 1.传统经济学着重研究市场机制和价格制度,分析完全竞争市场中的最优决策,不考虑决策者之间的相互影响。但是,现实经济运行中市场是不完全竞争的,行为主体之间的决策具有相互影响。 2.完全竞争市场是以完全信息为条件的,这在现实经济运行中也难以保证。在信息不对称条件下,考虑行为主体相互影响的非价格制度可以用博弈论分析。 当然,应用博弈论解决竞争策略问题也是有条件的。除了掌握博弈论方法外,关键是正确估计各参与者的策略空间和收益函数。 第一节博弈论的基本概念 一.博弈论及其特点 1.博弈和博弈论 博弈是指具有不同利益和目标的多个行为主体共同参加并相互影响的事态发展过程中的策略决策。 博弈论(Game Theory)也称对策论,它是一种分析博弈过程和结果的数学方法,研究具有理性的多个行为主体的决策和行动直接相互作用和影响时,事态发展过程的决策和均衡问题。广泛应用于政治、军事、经济、外交和日常生活的许多领域。 2.特点: (1)参与者具有各自的目标: (2)参与者都是理性行为者; (3)参与者之间具有相关性; (4)事态发展的结果取决于全部参与者的共同行为; (5)参与者要根据对其他参与者的判断决定自己的行动,因而是对策。 可见,博弈论是与优化论不同的决策理论。优化论是一种单人决策理论;博弈论所揭示的规律是一种多人决策理论。 二.博弈论的基本概念 在博弈论中,博弈的基本要素被概括为以下概念: 1)参与者Players (玩家):即参加博弈过程的行为和决策主体,也是利益主体。在一个博弈中,最少要有两个参与者。 2)策略Strategies (战略或策略行为):即参与者在某个博弈时点,根据其掌握的有关博弈信息而选择的决策变量和行动计划,一个参与者的全部可行策略称为他的策略空间。 接上页 3)收益Payoff(支付、得益)和收益函数:收益是指在既定策略组合条件下参与者的得失情况。每个参与者的收益取决于全部参与者所采取的策略,称为收益函数。 4)结局 outcome(结果):指博弈的结果,指既定策略组合条件下全部参与者所得收益的集合。 5)均衡 Equilibrium (均势):指达到稳定的策略组合或结局。 6)博弈规则:指参与者、策略、结局之间的联系。它是由博弈的环境和参与者之间的相互影响决定的。 例: 可口可乐与百事可乐(参与者)的价格决策: 双方都可以保持价格不变或者提高价格(策略) 博弈的目标和得失情况体现为利润的多少(收益) 利润的大小取决于双方的策略组合(收益函数) 博弈有四种策略组合,其结局是: (1)如果双方都不涨价,各得利润10单位; (2)如果可口可乐不涨价,百事可乐涨价,可口可乐利润100,百事可乐利润-30; (3)如果可口可乐涨价,百事可乐不涨价,可口可乐利润-20,百事可乐利润30;

博弈论

第八章 博 弈 论 教学目的:明确博弈产生与发展的有关基本理论;各种博弈种类的比较。 教学要求:阐明博弈理论与传统微观经济学理论的关系。 教学重点:完全信息静态博弈;不完全信息动态博弈;不完全信息静态与动态博弈。 教学难点:纳什均衡;最大化最小化原理;不完全信息博弈。 第一节博弈问题概述 一、博弈论及其基本概念 博弈也叫作对策,译自英文的Game,字面意义可理解为游戏。博弈论“是关于策略相互作用的理论”,研究两个或两个以上参加者在对抗性或竞争性局势下如何采取行动,如何作出有利于己方的决策及其均衡问题。 在前面几章的分析中,除了寡头市场外,消费者和企业的最优决策是在简单环境下进行的,没有考虑各经济主体之间决策的相互影响。 而博弈论研究人与人之间相互“斗智”的形式和后果。 当人们的利益存在冲突时,每个人所获得的利益不仅取决于自己所采取的行动,也取决于其他人采取的行动或者对自己行动的反应,即某一经济主体的决策既受到其它经济主体决策的影响,而且该经济主体的相应决策又反过来影响到其它经济主体的决策。 博弈论描述在这种形势下各方理性地选择自己的行动所实现的结果,分析决策各决策主体的行为发生相互作用时的决策以及这种决策的均衡问题。 博弈论的基本概念包括:参与人、策略、支付。 (1)参与人(player)也称为局中人,是指博弈中选择行动以最大化自身利益(效用、利润等)的决策主体,局中人可以是自然人,也可以是各种社会组织,如:企业、政府、社团等等。 (2)策略(strategy)是指参与人选择行动的计划或规则,它规定参与人如何对其他人的行动作出反应,即在每种情况下应该如何行动,因而代表着参与者的相机行动方案。而行动是指参与人的决策变量。策略与行动是两个不同的概念,策略是行动的规则,而不是行动本身。 (3)信息(information)是指参与人在博弈中的知识,特别是有关其他参与人(对手)的特征和行动的知识。(4)在博弈论中,可以用数值表示各局中人从博弈中各自获益多少或相应的效用水平,这个数值称为支付(payoff);支付函数是所有参与人策略或行动的函数,是每个参与人真正关心的东西。博弈均衡是所有参与人的最优策略或行动的组合。

微观经济学第八章博弈论习题

第八章博弈论 一、重点和难点 (一)重点 1.博弈论及其基本概念 2.纳什均衡 3.占优策略均衡 4.囚徒困境博弈 (二)难点 1.最小最大值(或最大最小值)策略 2.子博弈精炼纳什均衡 3.动态博弈战略行动 4.不完全信息静态博弈 5.不完全信息动态博弈 二、关键概念 博弈零和博弈非常和博弈囚徒困境纳什均衡支付子博弈精炼纳什均衡完全信息静态博弈占优策略均衡重复博弈战略移动可信威胁豪尔绍尼转换三、习题 (一)单项选择题 1.博弈论中,局中人从一个博弈中得到的结果常被称为()。 A. 效用 B. 支付 C. 决策 D. 利润 2.博弈中通常包括下面的内容,除了()。 A.规则 B.占优战略均衡 C.策略 D.结局 3.在具有占优战略均衡的囚徒困境博弈中()。 A.只有一个囚徒会坦白 B.两个囚徒都没有坦白 C.两个囚徒都会坦白 D.任何坦白都被法庭否决了 4.在多次重复的双头博弈中,每一个博弈者努力()。 A.使行业的总利润达到最大 B.使另一个博弈者的利润最小 C.使其市场份额最大 D.使其利润最大 5.一个博弈中,直接决定局中人支付的因素是()。 A. 策略组合 B. 策略 C. 信息 D. 行动 6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时的博弈具有()。 A.囚徒困境式的均衡 B.一报还一报的均衡

C.占优策略均衡 D.激发战略均衡 7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的战略称为()。 A.一报还一报的战略 B.激发战略 C.双头战略 D.主导企业战略 8.在囚徒困境的博弈中,合作策略会导致()。 A.博弈双方都获胜 B.博弈双方都失败 C.使得先采取行动者获胜 D.使得后采取行动者获胜 9.在双寡头中存在联合协议可以实现整个行业的利润最大化,则()。 A.每个企业的产量必须相等 B.该行业的产出水平是有效的 C.该行业的边际收益必须等于总产出水平的边际成本 D.如果没有联合协议,总产量会更大 10.在什么时候,囚徒困境式博弈均衡最可能实现()。 A. 当一个垄断竞争行业是由一个主导企业控制时 B.当一个寡头行业面对的是重复博弈时 C.当一个垄断行业被迫重复地与一个寡头行业博弈时 D. 当一个寡头行业进行一次博弈时 11.一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种战略是一种()。 A.主导战略 B.激发战略 C.一报还一报战略 D.无用战略 12.关于策略式博弈,正确的说法是()。 A. 策略式博弈无法刻划动态博弈 B. 策略式博弈无法表明行动顺序 C. 策略式博弈更容易求解 D. 策略式博弈就是一个支付矩阵 13.下面关于共同知识的说法,正确的是()。 A. 每一个局中人都知道的事,就是共同知识 B. 一般地,假定支付为共同知识 C. 共同知识的假定要求局中人的计算能力不是很强 D. 纳什均衡不需要共同知识的假定 14、导致价格战爆发的原因是() A.合作均衡

相关主题