当前位置：搜档网 › 博弈均衡模型及其举例

博弈均衡模型及其举例

博弈联均衡模型

博弈论模型图示

博弈可划分为合作博弈和非合作博弈，1人们一般讲到的都是指非合作博弈，它有四种不同类型的博弈，即完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈，与上述相对应的是纳什均衡、子博弈精炼纳什均衡、贝叶斯纳什均衡、精炼贝叶斯纳什均衡。这四种均衡中最为基本的是纳什均衡。2

完全信息静态博弈——纳什均衡、

完全信息动态博弈——子博弈精炼纳什均衡

不完全信息静态博弈——贝叶斯纳什均衡、、

不完全信息动态博弈——精炼贝叶斯纳什均衡，

与上述相对应的是、、、。这四种均衡中最为基本的是纳什均衡。

完全信息静态博弈（纳什均衡）

债务人

强硬妥协

1这两者的区别主要在于人们的行为相互作用时，当事人能否达成一个有约束力的协议：如能达成就是合作博弈；反之就是非合作博弈。合作博弈强调团体理性，强调效率和公平，非合作博弈强调理性个人的最优决策，其结果是否有效率则是不确定的。

2所谓纳什均衡，指的是所有参与人最优选择的一种组合，在这种组合下，给定其他人的选择，没有任何人有积极性做出新的选择。纳什均衡的哲学思想是：给定别人遵守协议的情况下，没有人有积极性偏离协议规定的自己的行为规则。换言之，如果一个协议不构成纳什均衡，它就不可能自动实施，因为至少有一个参与人会违背这个协议，不满足纳什均衡要求的协议是没有意义的。当博弈中的所有参与人事先达成一项协议，给出每个人的行为规则。在没有外在强制力约束时，当事人是否会自觉地遵守这个协议？或者说这个协议是否可以自动实施？如果当事人会自觉遵守这个协议，等于说这个协议构成一个纳什均衡。参见张维迎：“经济学家看法律、文化与历史”，载张维迎《产权、政府与信誉》，三联书店2001年版。

囚徒困境

□ 文/柯华庆

“囚徒困境”最早是由美国普林斯顿大学数学家曾克1950年提出来的。他当时编了一个故事向斯坦福大学的一群心理学家们解释什么是博弈论。这个故事后来成为博弈论最经典的案例。故事的内容如下：

两个犯罪嫌疑人被捕并受到指控，但除非至少其中至少有一个人供认犯罪，警方缺乏足够的证据指证他们所犯的罪行，从而将他们按罪判刑。为了得到所需的口供，警察将这两名罪犯关押在不同牢房以防止他们串供或结成攻守联盟，并给他们同样的选择机

说是非常理想的结果，因为节省了信息费用（调查事实真相的费用）；从博弈论的一般性来看（不涉及具体人），两个决策者的立场是不明智的（“聪明反被聪明误”），因为既没有实现团体的最大利益，也没有真正实现自身的个体最大利益。一般认为该博弈揭示了个体理性与集体理性的矛盾，对经济学中斯密“看不见的手”理论是一种重创。“他受着一只看不见的手指导，去尽力达到一个并非他本意想要达到的目的……。他追求自己的利益，往往使他能比在真正出于本意的情况下更有效地促进社会的利益”。单个囚徒仅仅考虑自己，由于策略的相互依存性，最后的结果违背了囚徒自身的利益（仍然是个体利益）。所以囚徒困境揭示的是“事与愿违”，原因在于社会中策略的相互依存性，即个体追求自身利益要考虑其他人的策略，单纯从自身考虑最后的结果可能正好相反。

第四，“囚徒困境”主要是双方不信任的结果。同时没有组织性，如果他们属于黑社会组织或者是其他组织，在他们内部有一个惩罚措施，这时是合作博弈，结果肯定是两个囚徒都选择抵赖。在囚徒困境中，尽管每个人都选择抵赖比选择坦白要好，但是这个帕累托改善做不到，因为它不满足个人理性要求，（抵赖，抵赖）不是一个均衡。假定两个囚徒在作案之前建立一个攻守同盟（绝不坦白），这个攻守同盟也没有用，因为没有人有积极性遵守协定。这就是合作博弈与非合作博弈的区别。如果相互信任的话，也不会出现这种情况。

博弈论66个经典例子(9)不会令人后悔的纳什均衡

不会令人后悔的均衡在纳什均衡中，你不一定满意其他的策略，但你的策略是回馈对手招数的最佳策略。从囚徒困境中我们会发现，作为博弈各方的行动就是针对对方行动而确定的最佳对策，而一旦知道对方在做什么，就没人愿意改变自己的做法。博弈论学把这么一个结果称为均衡。这个概念是有普林斯顿大学数学家约翰·纳什提出的，因此被称为纳什均衡。诺贝尔经济学奖获得者萨缪尔森有句名言，你可以将一只鹦鹉训练成经济学家，因为它所需要学习的只有两个词，供给与需求。博弈论专家坎多瑞引申说：“要成为现代经济学家，这只鹦鹉必须再多学一个词，这个词就是纳什均衡”。 1950年，还是一名研究生的纳什写了一篇论文，题为《n人博弈的均衡问题》，该文只有短短一页纸，可就这短短一页纸成了博弈论的经典文献。纳什的贡献是，他证明了在这一类的竞争中，在很广泛的条件下是有稳定解存在的，只要是别人的行为确定下来，竞争者就可以有最佳的策略。那么，什么纳什均衡呢？简单说，就是一策略组合中，所有的参与者面临这样的一种情况：给定你的策略，我的策略是我最好的策略。给定我的策略，你的策略也是你最好的策略，即双方在对方给定的策略下不愿意调整自己的策略。纳什均衡从此成为经济学家用来分析商业竞争到贸易谈判现象的有力工具，所以纳什均衡是对冯诺依曼和摩根斯坦的合作博弈论的重大发展，甚至说是一场革命。纳什均衡首先对亚当斯密“看不见的手”的原理提出挑战，按照斯密的理论，在市场经济中，每一个人都从利己的目的出发，而最终全社会达到利他的效果，

从纳什均衡引出一个悖论：从利己的目的触发，结果损人不利己。“囚徒困境”就是如此，从这个意义说，纳什均衡提出的悖论实际上动摇了西方经济学的基石。纳什的想法成为我们指导“同时行动博弈”的最后一个法则的基础。这个法则如下：走完寻找优势策略和剔除劣势策略的捷径之后，下一步就是寻找这个博弈的均衡。所谓博弈均衡，它是一稳定的博弈结果。均衡是博弈的一结果，但不是说博弈的结果都能成为均衡。博弈的均衡是稳定的，因而是可以预测的。在囚徒困境中存在唯一的纳什均衡点，即两个囚犯均选择“招认”，这是唯一稳定的结果。有些博弈的纳什均衡点不止一个，如下述夫妻博弈中有两个纳什均衡点。丈夫和妻子商量晚上的活动，丈夫喜欢看拳击，而妻子喜欢欣赏歌剧，但两个人都希望在一起度过夜晚。在这个夫妻博弈中有两个纳什均衡点：要么一同去看歌剧，要么一同去看拳击。在有两个或两个以上纳什均衡点的博弈中，其最后的结果难以预测。在夫妻博弈中，我们无法知道，最后结果是一同欣赏歌剧还是一同看拳击。是不是所有的博弈均存在纳什均衡点呢？不一定存在纯策略纳什均衡点，但至少存在一个混合策略均衡点。这里所谓纯策略是指参与者在他的策略空间中选取唯一确定的策略，所谓混合策略是指参与者采取的不是唯一的策略，而是其策略空间上的概率分布。我们下面将在警察与小偷的博弈中给出混合策略的说明。在西部片里，我们常能看到这样的故事：某个小镇上只有一名警察，他要负责整个镇的治安，现在我们假定，小镇的一头有一家酒馆，另一头有一家银行，再假定该地有一个小偷，要实施偷盗。因为分身乏术，警察一次只能在一个地方

(完整版)博弈论知识点总结

博弈论知识总结博弈论概述： 1、博弈论概念：博弈论：就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。博弈论研究的假设： 1、决策主体是理性的，最大化自己的收益。 2、完全理性是共同知识 3、每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念与预期 2、和博弈有关的变量：博弈参与人：博弈中选择行动以最大化自己受益的决策主体。行动：参与人的决策选择战略：参与人的行动规则，即事件与决策主体行动之间的映射，也是参与人行动的规则。信息：参与人在博弈中的知识，尤其是其他决策主体的战略、收益、类型（不完全信息）等的信息。完全信息：每个参与人对其他参与人的支付函数有准确的了解；完美信息：在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动，否则为不完美信息。不完全信息：参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息，即存在着有关其他参与人的不确定性因素。支付：决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。从经济学的角度讲，博弈是决策主体之间的相互作用，因此和传统个人决策存在着区别： 3、博弈论与传统决策的区别： 1、传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下，最大化自己效用，研究工具是无差异曲线。可表示为：maxU(P ,I)，其中P 为市场价格，I 为消费者可支配收入。 2、其他消费者对个人的综合影响表示为一个参数——市场价格，所以在市场价格既定下，消费者效用只依赖于自己的收入和偏好，不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式：战略式博弈和扩展式博弈战略式博弈：是博弈问题的一种规范性描述，有时亦称标准式博弈。战略式博弈是一种假设每个参与人仅选择一次行动或战略，并且参与人同时进行选择的决策模型，因此，从本质上来讲战略式博弈是一种静态模型，一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合： 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合上的效用函数Ui(s1,s2,…,sn). 扩展式博弈：是博弈问题的一种规范性描述。与战略式博弈侧重博弈结果的描述相比，扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。包含要素： 1、参与人集合 {1,2,...,}n Γ={1,2,...,}n Γ=11(,...,,...,)n i i n i s s s s ==∏

博弈论经典例子

博弈论经典例子篇一:《博弈论三大经典案例》经典的囚徒困境 1950年，由就职于兰德公司的梅里尔弗拉德(MerrillFlood)和梅尔文德雷希尔(MelvinDresher)拟定出相关困境的理论，后来由顾问阿尔伯特塔克(AlbertTucker)以囚徒方式阐述，并命名为"囚徒困境"。经典的囚徒困境如下：警方逮捕甲、乙两名嫌疑犯，但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯，分别和二人见面，并向双方提供以下相同的选择：若一人认罪并作证检举对方(相关术语称"背叛"对方)，而对方保持沉默，此人将即时获释，沉默者将判监xx年。若二人都保持沉默(相关术语称互相"合作")，则二人同样判监半年。若二人都互相检举(互相"背叛")，则二人同样判监2年。用表格概述如下：甲沉默(合作) 乙沉默(合作)二人同服刑半年甲认罪(背叛)甲即时获释;乙服刑xx 年乙认罪(背叛)甲服刑xx年;乙即时获释二人同服刑2年如同博弈论的其他例证，囚徒困境假定每个参与者(即"囚徒")都是利己的，即都寻求最大自身利益，而不关心另一参与者的利益。参与者某一策略所得利益，如果在任何情况下都比其他策略要低的话，此策略称为"严格劣势"，理性的参与者绝不会选择。另外，没有任何

其他力量干预个人决策，参与者可完全按照自己意愿选择策略。囚徒到底应该选择哪一项策略，才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁，并不知道对方选择;而即使他们能交谈，还是未必能够尽信对方不会反口。就个人的理性选择而言，检举背叛对方所得刑期，总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择：若对方沉默、背叛会让我获释，所以会选择背叛。若对方背叛指控我，我也要指控对方才能得到较低的刑期，所以也是会选择背叛。二人面对的情况一样，所以二人的理性思考都会得出相同的结论选择背叛。背叛是两种策略之中的支配性策略。因此，这场博弈中唯一可能达到的纳什均衡，就是双方参与者都背叛对方，结果二人同样服刑2年。这场博弈的纳什均衡，显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言，如果两个参与者都合作保持沉默，两人都只会被判刑半年，总体利益更高，结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设，二人均为理性的个人，且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛，结果二人判决均比合作为高，总体利益较合作为低。这就是"困境"所在。例子漂亮地证明了：非零和博弈中，帕累托最优和纳什均衡是相冲突的。由囚徒困境可以写出类似的员工困境：一名经理，数名员工;前提，经理比较苛刻; 如果所有员工都听从经理吩咐，则奖金等待遇一样，不过所有人

关于定价的博弈论模型

CH13 关于定价的博弈论模型分析寡头市场的最大困难在于策略问题。在此情形下，市场上仅有几家企业，每一家企业在做决策时，都必须在一定程度上考虑其它企业的行为。博弈论就是用以研究策略选择的一种主要的工具。一、基本概念在一些情况下，个人或企业必须作出策略性选择，并且最终的结果依赖于每一个行动者的选择，这种情况就可以看成是一个博弈。 1．博弈的三要素任何一个博弈都必须具备三个要素：（1）博弈的参与者参与人的具体身份无关紧要，在博弈中没有“好人”与“坏蛋”之分，我们只是简单地假设每个参与者在考虑到对手行为的前提下，做出最有利的策略性选择。（2）策略策略是博弈参与者的行动规则。在非合作博弈中，参与者之间不能就策略选择达成一个有约束力的协议。（3）支付（payoffs ）支付是参与者的最终受益。支付包括了与博弈结果相关的所有方面，既包括显性的货币报酬，也包括隐性的参与者关于结果的心理感受。 2. 符号两个参与者（A 和B ）之间的博弈G 用下式表示 [,,(,),(,A B A B G S S U a b U a b 其中，A S 和B S 分别表示参与者A 和参与者B 的可选策略，(,)A U a b 和(,)B U a b 分别表示当参与者A 和B 分别选择策略a 和策略b 时，各自所得到的支付（,A B a S b S ∈∈）。二、Nash 均衡市场均衡：在均衡价格和产量下，买方和卖方都没有动力去改变自己的行为。

Nash 均衡：对于策略组合（**,a b ），如果给定其它参与者的策略，没有一个参与者会选择单方面偏离，那么这个策略组合就构成一个Nash 均衡。也就是说 ** * (,)(,)A A U a b U a b '≥ 对于所有A a S '∈ ** * (,)(,)B B U a b U a b '≥ 对于所有B b S '∈ 对纳什均衡的理解设想所有参与者在博弈之前达成一个（没有约束力的）协议，规定每个参与人选择一个特定的战略。那么，给定其他参与人都遵守此协议，是否有人不愿意遵守此协议？如果没有参与人有积极性单方面背离此协议，我们说这个协议是可以自动实施的（self-enforcing ），这个协议就构成一个纳什均衡。否则，它就不是一个纳什均衡。三、一个例子两个厂商（A 和B ）决定自己花多少钱用于做广告。每个厂商可以选择较高的预算（H ）或较低的预算（L ）。 1．博弈的扩展式表述图13.1 2．博弈的策略式（规范式）表述表13.1 3．占优策略和Nash 均衡从表13.1可以看出，低预算（L ）是厂商B 的占优策略，即不管厂商A 选择哪一种策略，L 都是厂商B 的最佳选择。由于该博弈的结构是公共知识，厂商A 也知道L 是厂商B 的占优策略，所以厂商A 将选择L 。因此，该博弈的均衡是（L ，L ）。请验证（L ，L ）构成一个Nash 均衡，而其它三个策略组合都不是Nash 均衡。

从博弈论角度看古诺模型

从博弈论角度看古诺模型 WTD standardization office【WTD 5AB- WTDK 08- WTD 2C】

博弈论的观点看古诺模型罗思蕴（华中师范大学数学与应用数学系，武汉430079）摘要：运用博弈论的研究方法，对古诺模型的几种变式进行分析，给出模型解法的代数表达式，并对结果进行适当的对比分析，最后总结出不同模型对结论的改变情况。关键词：古诺模型纳什均衡完全信息不完全信息静态博弈动态博弈古诺模型（Cournot model）是博弈论中最具有代表性的模型之一，也是是纳什均衡最早的版本。它是法国经济学家古诺(Augustin Cournot)在1938年出版的《财富理论的数学原理研究》一书中最先提出的。而古诺的定义比纳什的定义早了一百多年，足以体现博弈论这样一个学科是深深扎根于经济学的土壤中的。从经济学的角度，它的研究价值在于古诺模型是介于两种极端状况完全竞争和垄断之间。在古诺生活的时代，大多数市场都只有少数的厂商经营，所以这个模型在当时是极具现实意义的。随着时间的推移，古诺模型也演变出了各种不同的版本。如果从博弈论的角度分析，有四种情况极具代表性：完全信息静态博弈的古诺模型、不完全信息静态博弈的古诺模型、完全且完美信息动态博弈的古诺模型、无限次重复博弈的古诺模型。 1 经典古诺模型古诺模型最初的形态是来自于经济学的。在经济学中，寡头的概念是指那种在某一产业只有少数几个卖者的市场组织形式。古诺模型对寡头具有如下的基本假设。一，

假定一个产业只有两个寡头，每个寡头生产同质产品，并追求利润最大化。二，两个寡头之间进行的是产量的竞争而不是价格竞争，且产品的价格依赖于两者生产的产品总量。三，寡头之间无勾结行为。四，每个生产者都把对方的产出水平视为定值。五，边际成本为常数。在经典的古诺模型中，每个企业具有相同的不变单位成本：需求函数为：第i个企业的利润为：最优化的一阶条件为：反应函数为：解得纳什均衡为：每个公司的利润为：古诺模型是在假定寡头具有完全信息的基础上导出的。在这一均衡中，每个寡头都可以准确猜测对手的产量，从而选择自己的最大产出。最重要的是，古诺均衡解在寡头无勾结的假定下求出的。如果考虑寡头之间相互勾结而达到均衡的情况，那么经过计算可以得到实际产出水平与实际价格上等于完全垄断条件下达到的产量与价格。更广泛的，考虑无勾结寡头市场、垄断市场、自由市场，可以得到：无论是产量还是价格，无勾结寡头市场都是处于中间的位置。也就是说，如果寡头市场不存在勾结的行为，其效率高于完全垄断，低于完全竞争。 2 博弈分类下的两种古诺模型不完全信息静态博弈的古诺模型完全信息静态博弈的古诺模型即经济学中最经典的形式，它假设了厂商相互完全

豪泰林(hotelling)产品决策模型

豪泰林（hotelling ）产品决策模型对伯特兰德悖论（Bertrand paradox ）的一种解释是引入产品差异性。如果不同企业生产的产品是有差异的，替代弹性就不会是无限的，在这种情况下，消费者对不同的产品具有不同的偏好，购买该产品的均衡价格就不会等于边际成本。产品差异有多种形式，豪泰林（Hotelling ，1929）提出了一个考虑空间差异的产品决策模型。在此模型中，产品在物质性能上是相同的，但在空间位置上存在差异，因为不同位置上的消费者要支付不同的运输成本，这时他们关心的是价格和运输成本之和，而不仅是价格。假定有一个长度为1的线性城市，消费者均匀地分布于[0，1]区间内，分布密度为1。假定有两个商店，分别位于城市两端，出售的产品性能相同，每个商店提供单位产品的成本为c ，消费者购买商品的旅行成本与距商店的距离成比例，单位距离的成本为t 。这样，住在x 处的消费者若去商店1购买要花费tx 的运输成本；若去商店2去购买，要花费)1(x t -的成本。为简单起见，现假定消费者具有单位需求，即或者消费1个单位，或者消费个0个单位。假定两个商店同时选择自己的销售价格，现考虑两商店进行价格竞争的纳什均衡。在该博弈中，两个参与者为商店1和商店2，其可选择的策略分别为各自的价格1p 、2p 。设),(21p p D i 为需求函数，2,1=i 。若住在x 的消费者在两个商店之间是无差异的，则所有在x 左边的消费者都将在商店1购买，所有住在x 右边的消费者将在商店2购买，需求分别为x D =1，x D -=12，这里，x 满足 )1(21x t p tx p -+=+ （1）由（1）式得两商店的需求函数分别为 t t p p x p p D 2),(12211+-==

博弈论经典案例分析

博弈论经典案例分析囚徒困境案例：警察把甲乙分开关押，并在提审时分别告之，如果你坦白而他不坦白，那么你将只判0年，他将被判8年；如果你不坦白而他坦白，那么你判8年，他判0年；如果你们两人都坦白了，各判5年；如果你们两人都不坦白了，各判1年。分析：每个博弈方选择自己的策略时，虽然无法知道另一方的实际选择，但他却不能忽视另一方的选择对他自己的得益的影响，因此他应该考虑到另一方有两种可能的选择，并分别考虑自己相应的最佳策略。对囚徒A 来说，囚徒B 有坦白和不坦白两种可能的选择，假设囚徒B 的选择是不坦白，则对囚徒A 来说，不坦白得益为-1，坦白得益为0，他应该选择坦白；假设囚徒B 选择的是坦白，则囚徒A 不坦白得益为-8，坦白得益为-5，他还是该选择坦白。因此，在此博弈中，无论囚徒B 采取何种策略囚徒A 的选择只有一种，即坦白，因为在另一方两种可能的情况下，坦白给自己带来的得益都是较大的。同样的道理，囚徒B 的唯一的选择也是坦白。所以最可能的结局：该博弈的最终结果是两博弈方同选择坦白策略。其支付矩阵如下：性格大战案例：一对恋人准备在周末晚上一起出去，男的喜欢看足球，但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。分析：可以看出，分开将使他们两人得不到任何满足，只要在一起，不管是看时装表演还是看足球，两人都会得到一定的满足。但看足球将使男的得到更大的满足，看时装表演则使女的得到更大的满足。在这样的一个对局中，男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择，一旦对方选定了某一项活动，另一个人选择同样的活动就是最好的策略。因此，如果男的已经买好了足球的门票，女的当然就不再反对；反之，如果女的已经买好了时装表演票，男的也就会与她一起看时装表演。 1，1 8， 0 不坦白 0，8 5，5 坦白嫌疑犯乙不坦白坦白嫌疑犯甲 1，2 -1， -1 时装 0，0 2，1 足球男时装足球女

(完整版)博弈论知识点总结

费者可支配收入。 2、其他消费者对个人的综合影响表示为一个参数——市场价格，所以在市场价格既定下，消费者效用只依赖于自己的收入和偏好，不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式：战略式博弈和扩展式博弈战略式博弈：是博弈问题的一种规范性描述，有时亦称标准式博弈。战略式博弈是一种假设每个参与人仅选择一次行动或战略，并且参与人同时进行选择的决策模型，因此，从本质上来讲战略式博弈是一种静态模型，一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合： 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合上的效用函数Ui(s1,s2,…,sn). 扩展式博弈：是博弈问题的一种规范性描述。与战略式博弈侧重博弈结果的描述相比，扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。包含要素： 1、参与人集合 2、参与人的行动顺序，即每个参与人在何时行动； 3、序列结构：每个参与人行动时面临的决策问题，包括参与人行动时可供选择的行动方案、所了解的信息； 4、参与人的支付函数。比较： 1、战略式博弈从本质上来讲是一种静态模型。 2、扩展式博弈从本质上来讲是一种动态模型。 {1,2,...,} n Γ={1,2,...,}n Γ=11 (,...,,...,) n i i n i s s s s ==∏

博弈论经典模型全解析

博弈论经典模型全解析（入门级） 1. 囚徒困境这是博弈论中最最经典的案例了——囚徒困境，非常耐人寻味。“囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事，结果被警察发现抓了起来，分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下，两个囚犯都可以做出自己的选择：或者供出他的同伙(即与警察合作，从而背叛他的同伙)，或者保持沉默(也就是与他的同伙合作，而不是与警察合作)。这两个囚犯都知道，如果他俩都能保持沉默的话，就都会被释放，因为只要他们拒不承认，警方无法给他们定罪。但警方也明白这一点，所以他们就给了这两个囚犯一点儿刺激：如果他们中的一个人背叛，即告发他的同伙，那么他就可以被无罪释放，同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决，并且为了加重惩罚，还要对他施以罚款，作为对告发者的奖赏。当然，如果这两个囚犯互相背叛的话，两个人都会被按照最重的罪来判决，谁也不会得到奖赏。那么，这两个囚犯该怎么办呢？是选择互相合作还是互相背叛？从表面上看，他们应该互相合作，保持沉默，因为这样他们俩都能得到最好的结果：自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子，他马上意识到，他根本无法相信他的同伙不

会向警方提供对他不利的证据，然后带着一笔丰厚的奖赏出狱而去，让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到，他的同伙也不是傻子，也会这样来设想他。所以A犯的结论是，唯一理性的选择就是背叛同伙，把一切都告诉警方，因为如果他的同伙笨得只会保持沉默，那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了，那么，A犯反正也得服刑，起码他不必在这之上再被罚款。所以其结果就是，这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应：坐牢。企业在信息化过程中需要与咨询企业、软件供应商打交道的。在与这些企业打交道的过程中，我们不可避免地也会遇到类似的两难境地，这个时候需要相互之间有足够的了解与信任，没有起码的信任做基础，切不可贸然合作。在对对方有了足够的信任之后，诚意也是必不可少的，如果没有诚意或者太过贪婪，就可能闹到双方都没有好处的糟糕情况，造成企业之间的双输。 2. 智猪博弈在博弈论（Game Theory）经济学中，“智猪博弈”是一个着名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽，另一头安装着控制猪食供应的按钮，按一下按钮会有10个单位的猪食进槽，但是谁按按钮就会首先付出2个单位的成本，若大猪先到槽边，大小猪吃到食物的收益比是9∶1；同时到槽边，收益比是

博弈论的总结｜博弈论总结

博弈论学习的个人总结刘艳丽第一部分基本情况视频来源耶鲁公开课《博弈论》1----5讲，人人影视参考资料耶鲁校园网《博弈论--战略分析入门》，美，罗杰A麦凯恩，原毅军译，机械工业出版社，2006，42元《策略博弈》，阿维纳什迪克西特，蒲勇健译，中国人民大学出版社，第二版，2009，65元班级工商，人力08级学生课时8节我的时间投入视频26个小时；书籍，25小时；上网时间，无法统计。第二部分知识层面一、The five lessons五个基本的结论 1、Don"t play a strictly dominated strategy

2、Rational choices can lead to bad outcomes 3、You can"t get what you want 4、Put yourself in other people"s shoes 5、Yale students are evil 二、Game 2: "pick a number."数字游戏 Without showing your neighbor what you"re doing, put in the box below a whole number between 1 and a 100 [whole number between 1 and 100--integer.] We will calculate the average number chosen in the class. The winner in this game is the person whose number is closest to two-thirds times the average in the class. 三、The Prisoners" Dilemmasome examples囚徒困境 A joint project Price competition

博弈论培训心得

博弈论培训心得 -------李佳航经过两次对博弈论的培训本人感触很深，也看了许多关于博弈的案例也从案例从学习了很多关系学习生活为人方面的博弈。学习后现在简单总结一下： 1、博弈论中有很多的模型，其实记住模型并不是最重要的东西，掌握将问题变成博弈格局图以及进行优势策略标注法，找到纳什均衡更加重要。世界上的事情千变万化，仅仅靠这几个模型是无法全部解释的，而且模型与模型之间，仅仅变换几个数字，则发生变化。 2、博弈论可以将社会问题变成一个数学模型来计算推理，因此我们运用此模型时，需要相对准确地核定博弈各方的支付大小，解决问题的过程中，可设法改变参数让博弈对自己更加有利。 3、基本博弈模型的作用在于解决问题时更加容易去套，而不需要计算即知道博弈的结果将是什么，因此对于分析问题是有益的。有了模型在，对于一些谈判，容易让人站在博弈论的高度去分析它，这往往让人对谈判更加具有控制力。 4、对于较为简单的事件，完全不需要学习博弈论即能找到问题的答案，我们现实生活中的都自然而然的达到了博弈的均衡结果。本周培训主要是讲的卡尼曼的前景理论和损失规避。前景理论： 1、“二鸟在林，不如一鸟在手”，在确定的收益和“赌一把”之间，多数人会选择确定的好处。所谓“见好就收，落袋为安。称之为“确定效应”。 2、在确定的损失和“赌一把”之间，做一个抉择，多数人会选择“赌一把”。称之为“反射效应”。 3、白捡的100元所带来的快乐，难以抵消丢失100元所带来的痛苦。称之为“损失规避”。 4、很多人都买过彩票，虽然赢钱可能微乎其微，你的钱99.99%的可能支持福利事业和体育事业了，可还是有人心存侥幸搏小概率事件。称之为“迷恋小概率事件”。 5、多数人对得失的判断往往根据参照点决定，举例来说，在“其他人一年挣6万元你年收入7万元”和“其他人年收入为9万元你一年收入8万”的选择题中，大部分人会选择前者。称之为“参照依赖”。损失规避：如何理解“损失规避”？用一句话打比方，就是“白捡的100元所带来的快乐，难以抵消丢失100元所带来的痛苦”。前景理论最重要也是最有用的发现之一是：当我们做有关收益和有关损失的决策时表现出的不对称性。对此，就连传统经济学的坚定捍卫者保罗·萨缪尔森，也不得不承认：“增加100元收入所带来的效用，小于失去100元所带来的效用。” 这其实是前景理论的第3个原理，即“损失规避”（lossaversion）：

博弈论教材2013-2

第三章纳什均衡及其应用 3.1 混合策略纳什均衡 1 鹰鸽博弈我们知道老鹰具有攻击性，而鸽子爱好和平。在原始社会里有两个部落，可以做出两个行动：一是进攻一是和平，分别用鹰和鸽表示。表1 鹰鸽博弈乙甲鹰鸽该博弈的那是均衡为（鹰，鸽），（鸽，鹰）。一些学者研究发现，在同一个地域内，“鹰”和“鸽”的比例为0.36：0.64。事实上，设鹰鸽比为:1z z -，可以得出如下结果： ()2514(1)1439E e z z z =-+-=-； ()95(1)514E d z z z =-+-=- 9 0.3625 z = = 聪明的做法是：当鹰鸽比小雨0.36时，选择鹰策略；否则选择鸽策略。使用混合策略方法分析：第一步：混合策略型表示：乙鹰鸽甲鹰 p 鸽 1-p 第二步：计算期望效用： (925)514(259)514E p q q E q p p =-+-=++-甲乙第三步：作出最优反应函数

91 259[0,1] 2590 25q p q q ???若若若， 90 259[0,1] 259 1 25p q p p ? ?? 如果如果如果第四步：作出反应函数的图像第五步：根据交点，找出纳什均衡：其中（ 99 ,2525 ）是混合策略纳什均衡。 2 斗鸡博弈我的老家地处安徽最北部，苏鲁豫皖四省交界之处，东北处有条小河。河边的棉花地里，经常有鹌鹑栖息在其间。秋末冬初的农闲时节，小鹌鹑刚好长成。村民结网捕鹌鹑把玩、斗鸟儿为乐。每天早晨4点多钟出发，大约7点钟回来，雄性的鹌鹑留起来先要整夜整夜的熬鹌鹑、放在手里把鹌鹑，真正熟练了，才拿出来和别人的相斗。设想两只鹌鹑要在场子里一决雌雄。每只鹌鹑都有两个策略：攻击或逃跑。由于两只鹌鹑实力相当，若同时选择进攻会两败俱伤；若一只进攻，一只逃跑，进攻者胜利。逃跑的鹌鹑算是玩完了，以后再也没胆量进场子，主人也不回在把玩它，会用一块黑布把它的笼子蒙起来，培养成“叫子”，以后后捕鹌鹑的时候拎出去吸引同伴。若同时逃跑不会败掉，以后还能斗，但是都会挨饿一天。 1 p q

博弈模型

有趣味的博弈论模型按语：本文已经发表在“百科知识”2009年6月下半月总第413期第14-15页；在今年2月下半月总第405期第11-13页上发表了“网络科学三大里程碑”；2005年11月上半月总第326期第21-22页发表了“网络科学的三大发现”。令我意外的是去年在网上偶然发现“共检索到 10 条读者推荐文章”（请看最后附录），这篇科普文章名列首位，我们还有一篇文章名列第七。如果读者有兴趣可以去看看，或等我有时间找出来。我觉得，把新兴科学应用通俗易懂的语言写出来，有利于科学知识普及。这也应该是一个科学工作者的责任。在自然界和人类社会经济等领域中广泛存在合作与竞争，而能够反映这种既激烈竞争又需要合作的一门学科就是博弈论（Game Theory），也称对策论，它是模拟和分析理性的个体在利益冲突环境下相互作用的形式、决策及其均衡理论，研究个体之间行为的相互影响和相互作用规律，它可以描述现实生活中参与者面对有限资源的合作与竞争行为。令人惊奇的是，有三次诺贝尔获奖者是博弈论的杰出科学家，他们是1985年获得诺贝尔奖的公共选择学派的领导者布坎南，1994年经济学诺贝尔奖颁发给美国普林斯顿大学的纳什博士、塞尔屯、哈桑尼3位博弈论专家，1995年获奖的理性主义学派的领袖卢卡斯。博弈论在经济学、政治学、管理学、社会学、军事学、生物学等诸多学科领域具有广泛的实际背景和应用价值。进入20世纪末，随着复杂网络科学的一些新的发现，博弈论也成为网络时代人们的一种思维方式、竞争与合作的模式。博弈论对人有一个最基本假定：人是理性的，人在具体策略选择的目的全是使自己的利益最大化。博弈论就是研究理性的人之间如何进行策略选择的，因此博弈论也称为对策论。博弈论就凭这么一条最简单的假定可以展开广泛的研究，并获得了丰富多彩的结果，利用博弈论可以解读人类的社会行动或集体行动，更易理解人类社会的复杂性和特殊性。为了刻画个体间利益的冲突对整个系统的影响，人们已经提出和研究了许多博弈模型，比较著名的有三个模型：囚徒困境、“雪堆”博弈和“少数者”博弈，下面笔者通过对这三个模型进行简单而通俗的介绍，让大家了解博弈论及其应用概况。 “囚徒困境”模型囚徒困境作为一个经典的博弈模型受到广泛关注。这个博弈模型假设两个小偷合伙作案时被捕，分别关在不同的屋子里，如果双方都拒绝承认同伴的罪行，则由于证据不足两人都会被轻判（收益为）；为此，警方设计了一个机制：如果一方出卖同伴，而另一方保持忠诚，则背叛者将无罪释放（收益为T ）；坚持忠诚的一方将被重判（收益为）；如果双方都背叛了对方，则双方都会被判刑（收益为R S P ）。这里假设上述收益参数满足下面的条件：。对每个参与者来说，如果对手坚持忠诚，则他也选择忠诚得到的收益T R P S >>>R 小于他选择背叛得到的收益T ；如果对手选择背叛，则他选择忠诚得到的收益仍小于他选择背叛得到的收益。 S P 可见，无论对手采取哪种策略，自己的最佳策略就是背叛，双方都选择背叛称为囚徒困境的唯一“纳什均衡”（纳什因其提出的“非合作完全信息博弈的纳什均衡”概念而荣获了1994年的诺贝尔获得经济学奖）；同时选择背叛所取得的平均收益要低于两个人同时选择合作取得的平均收益。在这种情况下，理性参与者面临着两难的困境。自然界中广泛存在的合作现象——从单细胞生物的协同工作到人类的无私奉献的行为

博弈论经典案例与分析

案例：一对恋人准备在周末晚上一起出去，男的喜欢看足球，但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。分析：可以看出，分开将使他们两人得不到任何满足，只要在一起，不管是看时装表演还是看足球，两人都会得到一定的满足。但看足球将使男的得到更大的满足，看时装表演则使女的得到更大的满足。在这样的一个对局中，男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择，一旦对方选定了某一项活动，另一个人选择同样的活动就是最好的策略。因此，如果男的已经买好了足球的门票，女的当然就不再反对；反之，如果女的已经买好了时装表演票，男的也就会与她一起看时装表演。价格战案例：假设市场中仅有A 、B 两家企业，每家企业可采取的定价策略都是10元或15元，我们可以得出得益矩阵如下：分析：无论对企业A 还是企业B 来说，低价都是他们的占优战略。从表可见，企业A 的占优战略是10元，因为无论B 采取什么战略，企业A 都能获取比定价15元更多的利润。如果企业B 定价10元，企业A 定价10元能够获利80万元，而定价15元只能获得30万元；如果企业B 定价15元，企业A 定价10元可获利170万元，而定价15元却只能获利120万元。同样地，企业B 的占优战略也是定价10元的策略。企业B 男

博弈论理论经典讲解

博弈论经典案例冰晶淩（杂物区）2010-04-09 22:31:28 阅读258 评论0 字号：大中小订阅引用光光的博弈论经典案例 1994年诺贝尔经济学奖授给了三位博弈论专家：纳什，泽尔腾和海萨尼．而博弈论可以划分为合作博弈和非合作博弈．那三位博弈论专家的贡献主要是在非合作博弈方面，而且现在经济学家谈到博弈论，一般指的是非合作博弈，很少指合作博弈．合作博弈与非合作博弈之间的区别主要在于人们的行为相互作用时，当事人能否达成一个具有约束力的协议，如果有，就是合作博弈；反之，就是非合作博弈．非合作博弈强调的是个人理性，个人最优决策，其结果可能是有效率的，也可能是无效率的．而合作博弈强调的是团体理性．下面是我收集的张维迎教授的几个有关博弈论的经典案例．＜案例一：囚徒困境＞囚徒困境讲的是两个嫌疑犯作案后被警察抓住，分别关在不同的屋子里审讯．警察告诉他们：如果两人都坦白，各判刑8年；如果两个都抵赖，各判1年(或许因证据不足)；如果其中一人坦白一人抵赖，坦白的放出去，不坦白的判刑10年(这有点＇坦白从宽，抗拒从严＇的味道)．这里，每个囚徒都有两种战略：坦白或抵赖．表中每一格的两个数字代表对应战略组合下两个囚徒的支付（效用），其中第一个数字是第一个囚徒的支付，第二个数字为第二个囚徒的支付．战略形式又称标准形式，是博弈的两种表述形式之一，它特别方便于静态博弈分析．在这个例子里，纳什均衡就是（坦白，坦白）：给定B坦白的情况下，Ａ的最优战略是坦白；同样，给定Ａ坦白的情况下，Ｂ的最优战略也是坦白．事实上，这里，（坦白，坦白）不仅是纳什均衡，而且是一个占优战略均衡．就是说，不论对方如何选择，个人的最优选择是坦白．比如说，如果Ｂ不坦白，Ａ坦白的话被放出来，不坦白的话判１年，所以坦白比不坦白好；如果Ｂ坦白，Ａ坦白的话判８年，不坦白的话判１０年，所以，坦白还是比不坦白好。这样，坦白就是Ａ占优战略；同样，坦白也是Ｂ的占优战略．结果是，每个人都选择坦白，各判刑８年．＜案例二：智猪博弈＞这个例子讲的是，猪圈里有两头猪，一大一小．猪圈的一头有一个猪食槽，另一头安装一个按钮，控制着猪食的供应。按一下按钮会有１０个单位的猪食进槽，但谁按按钮需要付２个单位的成本．若大猪先到，大猪吃到９个单位，小猪只能吃１个单位；若同时到，大猪吃７个单位，小猪吃３个单位；若小猪先到，大猪吃６个单位，小猪吃４个单位。表中第一格表示两猪同时按按钮，因而同时走到猪食槽，大猪吃７个，小猪吃３个，扣除２个单位的成本，支付水平分别为５和１．其他情形可以类推．在这个例子中，什么是纳什均衡？首先我们注意到，无论大猪选择＂按＂还是＂等待＂，小猪的最优选择均是＂等待＂．比如说给定大猪按，小猪也按时得到１个单位，等待则得到４个单位；给定大猪等待，小猪按得到－１单位，等待则得０单位，所以，＂等待＂是小猪的占优战略．给定小猪总是选择＂等待＂，大猪的最优选择只能是＂按＂．所以，纳什均衡就是：大猪按，小猪等待，各得４个单位．多劳者不多得！＜案例三：性别战＞

博弈论的经典案例与分析

博弈论的经典案例与分析囚徒困境案例：警察把甲乙分开关押，并在提审时分别告之，如果你坦白而他不坦白，那么你将只判0年，他将被判8年；如果你不坦白而他坦白，那么你判8年，他判0年；如果你们两人都坦白了，各判5年；如果你们两人都不坦白了，各判1年。分析：每个博弈方选择自己的策略时，虽然无法知道另一方的实际选择，但他却不能忽视另一方的选择对他自己的得益的影响，因此他应该考虑到另一方有两种可能的选择，并分别考虑自己相应的最佳策略。对囚徒A 来说，囚徒B 有坦白和不坦白两种可能的选择，假设囚徒B 的选择是不坦白，则对囚徒A 来说，不坦白得益为-1，坦白得益为0，他应该选择坦白；假设囚徒B 选择的是坦白，则囚徒A 不坦白得益为-8，坦白得益为-5，他还是该选择坦白。因此，在此博弈中，无论囚徒B 采取何种策略囚徒A 的选择只有一种，即坦白，因为在另一方两种可能的情况下，坦白给自己带来的得益都是较大的。同样的道理，囚徒B 的唯一的选择也是坦白。所以最可能的结局：该博弈的最终结果是两博弈方同选择坦白策略。其支付矩阵如下：性格大战案例：一对恋人准备在周末晚上一起出去，男的喜欢看足球，但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。分析：可以看出，分开将使他们两人得不到任何满足，只要在一起，不管是看时装表演还是看足球，两人都会得到一定的满足。但看足球将使男的得到更大的满足，看时装表演则使女的得到更大的满足。在这样的一个对局中，男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择，一旦对方选定了某一项活动，另一个人选择同样的活动就是最好的策略。因此，如果男的已经买好了足球的门票，女的当然就不再反对；反之，如果女的已经买好了时装表演票，男的也就会与她一起看时装表演。 1，1 8， 0 不坦白 0，8 5，5 坦白嫌疑犯乙不坦白坦白嫌疑犯甲 1，2 -1， -1 时装 0，0 2，1 足球男时装足球女

博弈论经典案例

博弈论经典案例：案例一囚徒困境在博弈论中，含有占优战略均衡的一个著名例子是由塔克给出的“囚徒困境”（prisoner's dilemma）博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯，对每一个犯罪嫌疑人，警方给出的政策是：如果两个犯罪嫌疑人都坦白了罪行，交出了赃物，于是证据确凿，两人都被判有罪，各被判刑8年；如果只有一个犯罪嫌疑人坦白，另一个人没有坦白而是抵赖，则以妨碍公务罪（因已有证据表明其有罪）再加刑2年，而坦白者有功被减刑8年，立即释放。如果两人都抵赖，则警方因证据不足不能判两人的偷窃罪，但可以私入民宅的罪名将两人各判入狱1年。下表给出了这个博弈的支付矩阵。囚徒困境博弈[Prisoner's dilemma] A╲B 坦白抵赖坦白-8，-8 0，-10 抵赖-10，0 -1，-1 对A来说，尽管他不知道B作何选择，但他知道无论B选择什么，他选择“坦白”总是最优的。显然，根据对称性，B也会选择“坦白”，结果是两人都被判刑8年。但是，倘若他们都选择“抵赖”，每人只被判刑1年。在表2.2中的四种行动选择组合中，（抵赖、抵赖）是帕累托最优的，因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。不难看出，“坦白”是任一犯罪嫌疑人的占优战略，而（坦白，坦白）是一个占优战略均衡。案例二智猪博弈一、经济学中的“智猪博弈”（Pigs’payoffs）这个例子讲的是：假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽，另一头安装着控制猪食供应的按钮，按一下按钮会有10个单位的猪食进槽，但是谁按按钮就会首先付出2个单位的成本，若大猪先到槽边，大小猪吃到食物的收益比是9∶1；同时行动（去按按钮），收益比是7∶3；小猪先到槽边，收益比是6∶4。那么，在两头猪都有智慧的前提下，最终结果是小猪选择等待。

博弈均衡模型及其举例

博弈论66个经典例子(9)不会令人后悔的纳什均衡

(完整版)博弈论知识点总结

博弈论经典例子

关于定价的博弈论模型

从博弈论角度看古诺模型

豪泰林(hotelling)产品决策模型

博弈论经典案例分析

(完整版)博弈论知识点总结

博弈论经典模型全解析

博弈论的总结｜博弈论总结

博弈论培训心得

博弈论教材2013-2

博弈模型

博弈论经典案例与分析

博弈论理论经典讲解

博弈论的经典案例与分析

博弈论经典案例

相关文档

最新文档