搜档网
当前位置:搜档网 › 博弈模型

博弈模型

博弈模型
博弈模型

有趣味的博弈论模型

按语: 本文已经发表在“百科知识”2009年6月下半月总第413期第14-15页;在今年2月下半月总第405期第11-13页上发表了“网络科学三大里程碑”;2005年11月上半月总第326期第21-22页发表了“网络科学的三大发现”。令我意外的是去年在网上偶然发现“共检索到 10 条读者推荐文章”(请看最后附录),这篇科普文章名列首位,我们还有一篇文章名列第七。如果读者有兴趣可以去看看,或等我有时间找出来。我觉得,把新兴科学应用通俗易懂的语言写出来,有利于科学知识普及。这也应该是一个科学工作者的责任。

在自然界和人类社会经济等领域中广泛存在合作与竞争,而能够反映这种既激烈竞争又需要合作的一门学科就是博弈论(Game Theory),也称对策论,它是模拟和分析理性的个体在利益冲突环境下相互作用的形式、决策及其均衡理论,研究个体之间行为的相互影响和相互作用规律,它可以描述现实生活中参与者面对有限资源的合作与竞争行为。令人惊奇的是,有三次诺贝尔获奖者是博弈论的杰出科学家,他们是1985年获得诺贝尔奖的公共选择学派的领导者布坎南,1994年经济学诺贝尔奖颁发给美国普林斯顿大学的纳什博士、塞尔屯、哈桑尼3位博弈论专家,1995年获奖的理性主义学派的领袖卢卡斯。博弈论在经济学、政治学、管理学、社会学、军事学、生物学等诸多学科领域具有广泛的实际背景和应用价值。进入20世纪末,随着复杂网络科学的一些新的发现,博弈论也成为网络时代人们的一种思维方式、竞争与合作的模式。

博弈论对人有一个最基本假定:人是理性的,人在具体策略选择的目的全是使自己的利益最大化。博弈论就是研究理性的人之间如何进行策略选择的,因此博弈论也称为对策论。博弈论就凭这么一条最简单的假定可以展开广泛的研究,并获得了丰富多彩的结果,利用博弈论可以解读人类的社会行动或集体行动,更易理解人类社会的复杂性和特殊性。为了刻画个体间利益的冲突对整个系统的影响,人们已经提出和研究了许多博弈模型,比较著名的有三个模型:囚徒困境、“雪堆”博弈和“少数者”博弈,下面笔者通过对这三个模型进行简单而通俗的介绍,让大家了解博弈论及其应用概况。

“囚徒困境”模型

囚徒困境作为一个经典的博弈模型受到广泛关注。这个博弈模型假设两个小偷合伙作案时被捕,分别关在不同的屋子里,如果双方都拒绝承认同伴的罪行,则由于证据不足两人都会被轻判(收益为);为此,警方设计了一个机制:如果一方出卖同伴,而另一方保持忠

诚,则背叛者将无罪释放(收益为T )

;坚持忠诚的一方将被重判(收益为);如果双方都背叛了对方,则双方都会被判刑(收益为R S P )

。这里假设上述收益参数满足下面的条件:。对每个参与者来说,如果对手坚持忠诚,则他也选择忠诚得到的收益T R P S >>>R 小于他选择背叛得到的收益T ;如果对手选择背叛,则他选择忠诚得到的收益仍小于他选择背叛得到的收益。

S P 可见,无论对手采取哪种策略,自己的最佳策略就是背叛,双方都选择背叛称为囚徒困境的唯一“纳什均衡”(纳什因其提出的“非合作完全信息博弈的纳什均衡”概念而荣获了1994年的诺贝尔获得经济学奖);同时选择背叛所取得的平均收益要低于两个人同时选择合作取得的平均收益。在这种情况下,理性参与者面临着两难的困境。

自然界中广泛存在的合作现象——从单细胞生物的协同工作到人类的无私奉献的行为

说明,还有其他的动力学机制激励一般所认为的自私的个体认识到合作的重要性。为了揭示这种潜在的演化机制,有人提出了“针锋相对”演化规则,采用“去输存赢”策略,改进囚徒困境中的两难结局。

“雪堆”博弈模型

“雪堆”博弈又称为“鹰鸽”博弈或者“小鸡”博弈(Chicken Game),是另一类两人对称博弈模型,描述了两个人相遇时是彼此合作共同受益,还是彼此欺骗来相互报复。它揭示了个体理性和群体理性的矛盾对立。可以这样来描述雪堆博弈:在一个风雪交加的夜晚,两人相向而来,被一个雪堆所阻,假设铲除这个雪堆使道路通畅需要的代价为c , 如果道路通畅则带给每个人的好处量化为b 。如果两人一齐动手铲雪,则他们的收益为;如果只有一人铲雪,虽然两个人都可以回家,但是背叛者逃避了劳动,它的收益为,而合作者的收益为;如果两人都选择不合作,两人都被雪堆挡住而无法回家,他们的收益都为。这里假设收益参数满足下面的条件:T R 。雪堆模型与囚徒困境不同的是,遇到背叛者时合作者的收益高于双方相互背叛的收益。因此,一个人的最佳策略取决于对手的策略:如果对手选择合作,他的最佳策略是背叛;反过来,如果对手选择背叛,那么他的最佳策略是合作。这样合作在系统中不会消亡,而与囚徒困境相比,合作更容易在雪堆博弈中涌现。

/2R b c =?T b =S b c =?0P =S P >>>

“争当少数者”模型

该模型由查勒特和张翼成于1997年提出,他们假设在一个系统中有(奇数)个参与者,在某一时刻各自独立地在两个策略中做出选择,参与人数少的策略获胜。该模型的核心思想是少数者获胜,这是从实际中提炼出来的一个好模型,股票交易就是一个典型例子。需要指出,少数者博弈模型是对著名“酒吧问题”的一种抽象和简化。

N 酒吧问题研究的是一群生活在美国圣塔菲的人们在周四晚上是否去该地区的一个著名酒吧的决策问题:每周四晚上这个酒吧都会有优雅的爱尔兰音乐演奏,然而如果去的人数过多,超过了酒吧所能容纳的人数(阈值c ),酒吧就会变得嘈杂拥挤,人们也无法悠闲地欣赏音乐。因此人们需要根据过去的公共信息来对当晚去酒吧的人数做预测,以决定自己究竟是去酒吧还是留在家里。酒吧问题和少数者博弈模型都反映了社会经济活动中众多千差万别的参与者对有限资源竞争的基本特征,其思想是金融市场中的普遍原则——少数人获胜。 争当少数者博弈模型原则上与前面两个模型不同,双方并非完全自私、完全理性且具有相当完整信息,并按照严格的收益计算而决策,以便达到某种博弈的均衡。人们看到该模型中的双方基本上是根据“成功的经验”或“模仿成功者”进行决策,并非理性,信息也非完整,因此它不存在争当少数者博弈模型的均衡,似乎可以说,非理性和非完整信息的博弈更为重要。确实,现实生活中究竟有哪些面临的决择是“完全理性”地根据完全信息严格计算而决策的博弈?

进而,提出演化少数者博弈(EMG)模型,将进化论与少数者博弈结合在一起,发现通过学习过去的公共历史信息,可以提高参与者的平均收益。在EMG 模型中,对于某一轮博弈,参与者根据他记忆中保存的公共历史信息来独立地决策本轮自己是加入“1”组还是“0”组;当所有人都做出选择后,进入人数少的一组的人为获胜者,进入人数多的一组的人为失败者。人们通过对EMG 模型的研究发现一个有趣的结论:一个相互间竞争的人群最终总是趋向于分离成为具有两种相反的极端行为的人群。这意味着为了在竞争社会中生存,参与者的行为最终会走向极端:要么始终遵循基本策略,要么始终反其道而行之。博弈后获胜者的收益加,S

而失败者的收益减1,因此也被称为奖惩比。实际上,还有更复杂的情形,例如,奖惩比情况下发现:策略分布既可形成“M ”形(S 1S <0992S .=),也可形成“”形分布

(),这意味着随着奖惩比S 的减小,参与者采取的策略从极端转向中庸。进一步,在争当少数者博弈演化模型中,发现在 S

∩0971S .=本文以囚徒困境、雪堆博弈和少数者博弈三个典型模型为例,简单介绍了近年来博弈论研究概况。在现实生活和许多领域中,博弈行为对网络结构演化的作用是令人关注的课题。随着演化博弈动力学行为与复杂网络之间关系深入研究,博弈必定会推动复杂网络的发展,乃至社会的进步,其应用前景十分美好。

附录:网上10 条读者推荐文章目录如下:

[1] 方锦清. 网络科学的三大发现[J]. 百科知识 , 2005,(21) .

[2] 之秋. 是谁在和“世人”开玩笑?[J]. 报刊之友 , 2001,(01) .

[3] 李峰 ,朱静. 电子商务与国际贸易[J]. 世界有色金属 , 2005,(10) .

[4] 清道夫. 网络世界生存小窍门之拒收垃圾[J]. 电脑爱好者 , 2000,(06) .

[5] 刘杰,陆君安. 一个小型科研合作复杂网络及其分析[J]. 复杂系统与复杂性科学 , 2004,(03) .

[6] 覃森,戴冠中,王林. 节点数固定的复杂网络模型初探[J]. 复杂系统与复杂性科学 , 2005,(02) .

[7] 刘强,方锦清,李永,梁勇. 探索小世界特性产生的一种新方法[J]. 复杂系统与复杂性科学 , 2005,(02) .

[8] 杨波,陈忠,段文奇. 基于个体选择的小世界网络结构演化[J]. 系统工程 , 2004,(12) .

[9] 刘涛,陈忠,陈晓荣. 复杂网络理论及其应用研究概述[J]. 系统工程 , 2005,(06) .

[10] 项天晟. 网络命运交响曲[J]. 广东科技 , 2002,(09) .

浅析价格战中的博弈论

价格战中博弈论的浅析 2011-2012学年第一学期 课程名称:博弈论 班级:10物流治理(采购与供应链1班) 学号:1040407122 姓名:曾维乐

二〇一一年十二月十八日 价格战中的博弈论浅析 摘要:博弈论研究互动决策行为,大多数时候是研究对抗性行为,但并不是所有的对抗行为。博弈论是运筹学的一个重要分支,类型众多。本文在简要介绍了博弈论相关内容的基础上,重点介绍了纳什均衡。通过案例,充分运用囚徒困境、智猪博弈、反向归纳法等进行分析,从而得出在经济决策中行为人如何决定最优决策的方法。在此基础上,结合博弈论相关知识,分析解决经济生活中的一些实际问题。如:针对商家的价格战问题。

关键词:囚徒困境懦夫博弈安全博弈纳什均衡 一、理论介绍 1、博弈论简介 博弈论(game theory),也称对策论,它是运筹学的一个重要分支,是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题,简单讲来确实是一些个人或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自同意选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。 从上述定义中能够看出,一个完整的博弈一般由以下几个要素组成:博弈的参加者,各博弈方各自选择的全部策略或行为的集合、博弈方的得益(得益矩阵)、结果、均衡等。 1、参与人指的是博弈中选择行动以最大化自己效用的决策主体(能够是个人,也能够是团体)。 2、行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策。 3、策略是指参与人选择行动的规则,即在博弈进程中,什么情况下选择什么行动的预先安排。 4、信息指的是参与人在博弈中所明白的关于自己以及其他参与人的行动、策略及其得益函数等知识。 5、得益是参与人在博弈结束后从博弈中获得的效用,一般

用博弈论分析生活中的现象

上海第二工业大学 2012-2013学年第二学期 用博弈论分析生活现象论文

博弈论分析生活中现象 博弈论它较好地解决了对竞争等问题的可操作性分析,成为经济学中激荡人心的一个研究领域,主要是研究各相关行为主体的决策行为相互影响、相互作用的假定条件下,博弈论就是分析博弈行为和博弈决策的一门科学。其实博弈现象不只现身于经济领域对于我们日常生活中也是处处可见的,所以博弈论的思想不仅仅能够用来分析经济从而获得最大的盈利,我们也可以尝试将博弈论的思想运用到生活实践中从而获得最优的策略。 比如某一天你觉得应该是你女朋友的生日,但又不能肯定,如果是女朋友的生日的话,你可以送一束花,女朋友会特别高兴,你不送花,女朋友会埋怨你忘了她的生日如果不是女朋友的生日的话,你可以送女朋友一束花女朋友感到意外的惊喜,你不送花结果生活同往常一样。 生日非生日 买花 1 ,1 2 ,1 不买花-1,-1 0 ,0 确定今天是女朋友的生日或确定今天不是女朋友的生日,但你的最好行动都是买花。 谈到博弈论我们不得不说到囚徒困境,其内容大致为两名罪犯A 和B隔离审讯。如果两个都不招,因为证据不充分,两人都只能判1年。如果一方招了,属立功表现,功罪相抵,无罪释放;而另一方则属抗拒从严,判10年刑但如果两人都招了,则各判 5 年。结果大家都知道:两个人争先恐后地招了,结结实实地各判了5年。两个犯

人陷入的就是囚徒困境, A B 招不招 招 5 ,5 无罪释放,10 不招10,无罪释放 1 ,1 其结果就是A和B都招,判5年刑。如果两人协商后选择不招,但如果A或B其中一人招了,另一人就会判10年,而招的一人就会无罪释放,这样的诱惑足以让两名罪犯违背两人协议。而选择招。这样最有可能就是俩人都招。 人际交往中的博弈 人与人之间的相互矛盾和相互冲突的关系实际上就是一种博弈关系。矛盾冲突的结果也有三种情况负和游戏、零和游戏和正和游戏。“负和游戏”是一种两败俱伤的游戏故也称为双输博弈。在人与人的交往时由于相互的冲突和矛盾不能达到统一交际双方都不让步,最后使交际活动不能展开,结果是交际的双方都从中受损两败俱伤。如果是朋友,也会因不断发生“负和游戏”而逐渐疏远,夫妻间经常出现“负和”现象感情自然会受到影响。交际中之所以经常会发生“负和博弈”现象,大多是因为心胸狭窄,遇事爱使性负气,必然会出现“负和”局面。如果不使性负气,而是互相谅解,与人交往采取合作态度,便能使有矛盾和冲突的交际活动朝好的方向发展。在交际中如果遇到了和交际对象发生冲突的时候能够想着退一步海阔天高,采取一种和对方合作的态度就一定能避免交际中“负和游戏”的发生。至于“零和游戏”这种简单的“你输我赢”的思考方式往往会给人们带来更大的麻烦。其实在人与人之间的交往中双方的关系并不是简单

博弈论经典模型全解析

博弈论经典模型全解析(入门级) 1. 囚徒困境这是博弈论中最最经典的案例了——囚徒困境,非常耐人寻味。“囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不

会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到,他的同伙也不是傻子,也会这样来设想他。所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。企业在信息化过程中需要与咨询企业、软件供应商打交道的。在与这些企业打交道的过程中,我们不可避免地也会遇到类似的两难境地,这个时候需要相互之间有足够的了解与信任,没有起码的信任做基础,切不可贸然合作。在对对方有了足够的信任之后,诚意也是必不可少的,如果没有诚意或者太过贪婪,就可能闹到双方都没有好处的糟糕情况,造成企业之间的双输。 2. 智猪博弈在博弈论(Game Theory)经济学中,“智猪博弈”是一个着名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是

战略风险投资博弈模型分析

战略风险投资博弈模型分析 本文此处将通过对风险投资公司投资处于成长阶段创新企业的活动的分析和研究,提出信号传递博弈模型的企业价值评估方法。通过信号传递博弈模型来分析企业向风险投资公司传递信号(企划书)对价值评估结果的影响,给风险投资公司进一步量化风险和预期投资收益提供思路和参考。 4.1 如何对风险投资目标企业进行价值评估 目前国际上对一个成熟的企业的价值评估一般分为以下五个步骤:分析历史绩效、预测绩效、资本成本评估、连续价值评估、计算并解释结果。这几个步骤有些因为创新企业还远未成熟而无法进行,比如历史绩效分析时很可能财务数据不健全,目标市场价值权数选取时也因为主观预测成分很大而具有很大风险性;最重要一点,由于创新企业急需要注入大笔资金才能继续生存和发展,风险投资公司必须在尽量短的时间内作完考查工作,因为时间价值可谓创新企业的生命价值,错过发展时机肯定是要牺牲的。在这尽量短的时间内,创新企业需要一定的融资技巧,而且有很强的信息优势,风险投资公司除应在投资合约中对其进行约束之外,也要根据自己的观察结果给企业定价,以作为谈判和投资的基础。本文拟引入信息经济学中信号传递博弈模型的企业价值评估方法,风险投资公司结合以往投资经验和统计结果对相应估计结果进行调整,以便客观评估企业的价值及是否值得投资。作为创新企业经营者一方面应利用信息优势影响评价结果,另外对企业有初步的估价以免在价格谈判中贱卖了企业,所以该模型对谈判双方都具有一定的实际价值。 4.2 信号传递博弈模型介绍 信号传递模型(Signaling Games)是一种比较简单但有广泛应用意义的不完全信息动态博弈。在这类博弈中,有两个参与人,i= 1,2,参与人1称信号发送者,参与人2为信号接受者;参与人1的类型是私人信息,参与人2的类型是公共信息。博弈顺序如下: (1)“自然”首先选择参与人1的类型θ∈Ω,此处Ω={θ1,…,θK}是参与人1的类型空间,参与人1知道θ,但参与人2不知道,只知道参与人1属于θ的先

博弈模型

有趣味的博弈论模型 按语: 本文已经发表在“百科知识”2009年6月下半月总第413期第14-15页;在今年2月下半月总第405期第11-13页上发表了“网络科学三大里程碑”;2005年11月上半月总第326期第21-22页发表了“网络科学的三大发现”。令我意外的是去年在网上偶然发现“共检索到 10 条读者推荐文章”(请看最后附录),这篇科普文章名列首位,我们还有一篇文章名列第七。如果读者有兴趣可以去看看,或等我有时间找出来。我觉得,把新兴科学应用通俗易懂的语言写出来,有利于科学知识普及。这也应该是一个科学工作者的责任。 在自然界和人类社会经济等领域中广泛存在合作与竞争,而能够反映这种既激烈竞争又需要合作的一门学科就是博弈论(Game Theory),也称对策论,它是模拟和分析理性的个体在利益冲突环境下相互作用的形式、决策及其均衡理论,研究个体之间行为的相互影响和相互作用规律,它可以描述现实生活中参与者面对有限资源的合作与竞争行为。令人惊奇的是,有三次诺贝尔获奖者是博弈论的杰出科学家,他们是1985年获得诺贝尔奖的公共选择学派的领导者布坎南,1994年经济学诺贝尔奖颁发给美国普林斯顿大学的纳什博士、塞尔屯、哈桑尼3位博弈论专家,1995年获奖的理性主义学派的领袖卢卡斯。博弈论在经济学、政治学、管理学、社会学、军事学、生物学等诸多学科领域具有广泛的实际背景和应用价值。进入20世纪末,随着复杂网络科学的一些新的发现,博弈论也成为网络时代人们的一种思维方式、竞争与合作的模式。 博弈论对人有一个最基本假定:人是理性的,人在具体策略选择的目的全是使自己的利益最大化。博弈论就是研究理性的人之间如何进行策略选择的,因此博弈论也称为对策论。博弈论就凭这么一条最简单的假定可以展开广泛的研究,并获得了丰富多彩的结果,利用博弈论可以解读人类的社会行动或集体行动,更易理解人类社会的复杂性和特殊性。为了刻画个体间利益的冲突对整个系统的影响,人们已经提出和研究了许多博弈模型,比较著名的有三个模型:囚徒困境、“雪堆”博弈和“少数者”博弈,下面笔者通过对这三个模型进行简单而通俗的介绍,让大家了解博弈论及其应用概况。 “囚徒困境”模型 囚徒困境作为一个经典的博弈模型受到广泛关注。这个博弈模型假设两个小偷合伙作案时被捕,分别关在不同的屋子里,如果双方都拒绝承认同伴的罪行,则由于证据不足两人都会被轻判(收益为);为此,警方设计了一个机制:如果一方出卖同伴,而另一方保持忠 诚,则背叛者将无罪释放(收益为T ) ;坚持忠诚的一方将被重判(收益为);如果双方都背叛了对方,则双方都会被判刑(收益为R S P ) 。这里假设上述收益参数满足下面的条件:。对每个参与者来说,如果对手坚持忠诚,则他也选择忠诚得到的收益T R P S >>>R 小于他选择背叛得到的收益T ;如果对手选择背叛,则他选择忠诚得到的收益仍小于他选择背叛得到的收益。 S P 可见,无论对手采取哪种策略,自己的最佳策略就是背叛,双方都选择背叛称为囚徒困境的唯一“纳什均衡”(纳什因其提出的“非合作完全信息博弈的纳什均衡”概念而荣获了1994年的诺贝尔获得经济学奖);同时选择背叛所取得的平均收益要低于两个人同时选择合作取得的平均收益。在这种情况下,理性参与者面临着两难的困境。 自然界中广泛存在的合作现象——从单细胞生物的协同工作到人类的无私奉献的行为

博弈模型分析

1.3 管理型医疗概念研究 - 概念提出 - 博弈关系杨燕绥/王瑶平 - 分析模型岳公正 管理型医疗中的博弈关系:模型分析 (暂题) 概括地讲,管理型医疗是一种主要由医院(或者医生)、患者(或者受益人)、医疗保险管理机构(或者医疗保险经办机构)、政府四方参与的管理过程,是建立在互惠基础上的进行多方合作的医疗社会管理机制。由于经济发展水平、人文环境、行政管理具体情况等的不同,各个国家和地区的管理型医疗的结构和内容应当有其特点,具体操作方式和方法也很自然地存在差异。但是,从逻辑实质看,各个国家和地区存在着诸多差异的管理型医疗在本质上都是一个由医院、患者、医疗保险管理机构、政府四方围绕医疗服务定价、服务标准和成本控制等问题进行协商、规范和监督的管理过程。 本节的研究内容:1、对于管理型医疗中的博弈关系进行划分;2、对于管理型医疗中主要的博弈关系进行分析。 1 管理型医疗中博弈关系的划分 一般分析,医疗保险涉及的主体主要由医院、患者、医疗保险管理机构、政府四方组成。但是,在通常情况下,医疗保险在实际操作上涉及的主体还包括参保人、缴费人、受益人、基金管理公司、基金托管机构、医疗服务机构(营利和非营利)、药店、类似医生协会和药品协会的NGO组织、社会保障部门和卫生部门、监督评价机构等等。如何将这些组织和机构协调起来,从而降低医疗费用,提高医疗服务的质量是管理型医疗的主要内容。

图1-3—1 医疗保险的运行关系1 依据图1-3—1分析,医疗保险的运行中,包括了多元主体(医院、医疗保险经办机构、雇主、雇员、药店等)之间复杂的多维的相互制约与相互影响的关系。 1、医院和医疗保险经办机构的关系; 2、医院和受益人的关系; 3、医疗保险经办机构和受益人的关系; 4、医疗保险经办机构和药店的关系; 5、受益人和药店的关系; 6、医疗保险经办机构和政府的关系; 7、医疗保险经办机构和雇主(企业)的关系; 8、医疗保险经办机构和雇员(患者、投保人)的关系; 9、雇主和雇员的关系; 1杨燕绥著:《劳动与社会保障立法国际比较研究》,第239页,中国劳动社会保障出版社,2001年

博弈论理论经典讲解

博弈论经典案例 冰晶淩(杂物区)2010-04-09 22:31:28 阅读258 评论0 字号:大中小订阅 引用 光光的博弈论经典案例 1994年诺贝尔经济学奖授给了三位博弈论专家:纳什,泽尔腾和海萨尼.而博弈论可以划分为合作博弈和非合作博弈.那三位博弈论专家的贡献主要是在非合作博弈方面,而且现在经济学家谈到博弈论,一般指的是非合作博弈,很少指合作博弈.合作博弈与非合作博弈之间的区别主要在于人们的行为相互作用时,当事人能否达成一个具有约束力的协议,如果有,就是合作博弈;反之,就是非合作博弈.非合作博弈强调的是个人理性,个人最优决策,其结果可能是有效率的,也可能是无效率的.而合作博弈强调的是团体理性.下面是我收集的张维迎教授的几个有关博弈论的经典 案例. <案例一:囚徒困境> 囚徒困境讲的是两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里审讯.警察告诉他们:如果两人都坦白,各判刑8年;如果两个都抵赖,各判1年(或许因证据不足);如果其中一人坦白一人抵赖,坦白的放出去,不坦白的判刑10年(这有点'坦白从宽,抗拒从严'的味道).这里,每个囚徒都有两种战略:坦白或抵赖.表中每一格的两个数字代表对应战略组合下两个囚徒的支付(效用),其中第一个数字是第一个囚徒的支付,第二个数字为第二个囚徒的支付.战略形式又称标准形式,是博弈的两种表述形式之一,它特别方便于静态博弈分析. 在这个例子里,纳什均衡就是(坦白,坦白):给定B坦白的情况下,A的最优战略是坦白;同样,给定A坦白的情况下,B的最优战略也是坦白.事实上,这里,(坦白,坦白)不仅是纳什均衡,而且是一个占优战略均衡.就是说,不论对方如何选择,个人的最优选择是坦白.比如说,如果B不坦白,A坦白的话被放出来,不坦白的话判1年,所以坦白比不坦白好;如果B坦白,A坦白的话判8年,不坦白的话判10年,所以,坦白还是比不坦白好。 这样,坦白就是A占优战略;同样,坦白也是B的占优战略.结果是,每个人都选择坦白,各判刑8年. <案例二:智猪博弈> 这个例子讲的是,猪圈里有两头猪,一大一小.猪圈的一头有一个猪食槽,另一头安装一个按钮,控制着猪食的供应。按一下按钮会有10个单位的猪食进槽,但谁按按钮需要付2个单位的成本.若大猪先到,大猪吃到9个单位,小猪只能吃1个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃6个单位,小猪吃4个单位。表中第一格表示两猪同时按按钮,因而同时走到猪食槽,大猪吃7个,小猪吃3个,扣除2个单位的 成本,支付水平分别为5和1.其他情形可以类推. 在这个例子中,什么是纳什均衡?首先我们注意到,无论大猪选择"按"还是"等待",小猪的最优选择均是"等待".比如说给定大猪按,小猪也按时得到1个单位,等待则得到4个单位;给定大猪等待,小猪按得到-1单位,等待则得0单位,所以,"等待"是小猪的占优战略.给定小猪总是选择"等待",大猪的最优选择只能是"按".所以,纳什均衡就是:大猪按,小猪等待,各得4个单位.多劳者不多得! <案例三:性别战>

智猪博弈的思考

“智猪博弈”在现实生活中的应用 会计1201 左龙飞1208010317 摘要:智猪博弈是微观经济学中的一个非常典型的博弈模型,在社会领域的应用十分广泛,例如市场竞争中的大企业与中小企业、公共服务分配领域中社会全体和社会弱势群体,企业内部分配时的管理者与劳动者等等,本文的目的在于以经济生活中的实例印证所学,并在此基础上提出相应的对策。 关键词:智猪博弈知识产权公共分配博弈制衡 "智猪博弈"由约翰·纳什(JohnFNash),1950年提出。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,在大猪选择行动的前提下,小猪选择等待的话,在大猪返回食槽之前,小猪可得到4个单位的纯收益,大猪到达之后只能得到剩下的6个单位,实得4个单位;而小猪和大猪同时行动的话,则它们同时到达食槽,分别得到1个单位和5个单位的纯收益;在大猪选择等待的前提下,小猪如果行动的话,小猪在返回到达食槽之前,大猪已吃了9个单位,小猪只能吃到剩下的1个单位,则小猪的收入将不抵成本,纯收益为-1单位,如果大猪也选择等待的话,那么小猪的收益为零,成本也为零,总之,等待还是要优于行动。 从矩阵中可以看出,当大猪选择行动的时候,小猪如果行动,其收益是1,而小猪等待的话,收益是4,所以小猪选择等待;当大猪选择等待的时候,小猪如果行动的话,其收益是-1,而小猪等待的话,收益是0,所以小猪也选择等待。综合来看,无论大猪是选择行动还是等待,小猪的选择都将是等待,即等待是小猪的占优策略。而反观大猪,明知小猪不会去踩踏板,但是去踩踏板总比不踩强,所以只好亲历亲为了。

(完整word版)经典的博弈论分析案例——“海盗分金”问题

经典的博弈论分析案例——“海盗分金”问题 5个海盗抢得100枚金币,他们按抽签的顺序依次提方案:首先由1号提出分配方案,然后5人表决,超过半数同意方案才被通过,否则他将被扔入大海喂鲨鱼,依此类推。 “海盗分金”其实是一个高度简化和抽象的模型,体现了博弈的思想。在“海盗分金”模型中,任何“分配者”想让自己的方案获得通过的关键是事先考虑清楚“挑战者”的分配方案是什么,并用最小的代价获取最大收益,拉拢“挑战者”分配方案中最不得意的人们。 假设前提 假定“每个海盗都是绝顶聪明且很理智”,那么“第一个海盗提出怎样的分配方案才能够使自己的收益最大化?” 推理过程 从后向前推,如果1至3号强盗都喂了鲨鱼,只剩4号和5号的话,5号一定投反对票让4号喂鲨鱼,以独吞全部金币。所以,4号惟有支持3号才能保命。 3号知道这一点,就会提出(100,0,0)的分配方案,对4号、5号一毛不拔而将全部金币归为已有,因为他知道4号一无所获但还是会投赞成票,再加上自己一票,他的方案即可通过。 不过,2号推知3号的方案,就会提出(98,0,1,1)的方案,即放弃3号,而给予4号和5号各一枚金币。由于该方案对于4号和5号来说比在3号分配时更为有利,他们将支持他而不希望他出局而由3号来分配。这样,2号将拿走98枚金币。 同样,2号的方案也会被1号所洞悉,1号并将提出(97,0,1,2,0)或(97,0,1,0,2)的方案,即放弃2号,而给3号一枚金币,同时给4号(或5号)2枚金币。由于1号的这一方案对于3号和4号(或5号)来说,相比2号分配时更优,他们将投1号的赞成票,再加上1号自己的票,1号的方案可获通过,97枚金币可轻松落入囊中。这无疑是1号能够获取最大收益的方案了!答案是:1号强盗分给3号1枚金币,分给4号或5号强盗2枚,自己独得97枚。分配方案可写成(97,0,1,2,0)或(97,0,1,0,2)。分析 1号看起来最有可能喂鲨鱼,但他牢牢地把握住先发优势,结果不但消除了死亡威胁,还收益最大。这不正是全球化过程中先进国家的先发优势吗?而5号,看起来最安全,没有死亡的威胁,甚至还能坐收渔人之利,却因不得不看别人脸色行事而只能分得一小杯羹。 不过,模型任意改变一个假设条件,最终结果都不一样。而现实世界远比模型复杂。 首先,现实中肯定不会是人人都“绝对理性”。回到“海盗分金”的模型中,只要3号、4号或5号中有一个人偏离了绝对聪明的假设,海盗1号无论怎么分都可能会被扔到海里去了。所以,1号首先要考虑的就是他的海盗兄弟们的聪明和理性究竟靠得住靠不住,否则先分者倒霉。 如果某人偏好看同伙被扔进海里喂鲨鱼。果真如此,1号自以为得意的方案岂不成了自掘坟墓! 再就是俗话所说的“人心隔肚皮”。由于信息不对称,谎言和虚假承诺就大有用武之地,而阴谋也会像杂草般疯长,并借机获益。如果2号对3、4、5

基于“智猪博弈”的若干经济应用和对策

基于“智猪博弈”的若干经济应用和对策 09级财政学张晨林I200902050 摘要:智猪博弈是微观经济学中的一个非常典型的博弈模型,学习此章后发现博弈在社会领域的应用十分广泛,不同的利益集团相互扮演着大猪和小猪的角色,如市场竞争中的大企业与中小企业、公共服务分配领域中社会全体和社会弱势群体等等。本文的目的在于以经济生活中的实例印证所学,并在此基础上提出相应的对策。 关键字:智猪博弈;创新;公共服务;博弈制衡 智猪博弈的模型框架:假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有少量的猪食进槽,如果小猪按钮的话,大猪刚好可以吃完所有的食物。如果大猪按钮的话,可以赶在小猪吃完所有的食物前吃点残羹冷炙。我们用下图把双方不同策略下各个猪的净吃食量表示如下 那么两只猪各会采取什么策略?这个2×2矩阵博弈的纳什均衡解是(踩动,等待),即小猪将选择等待,大猪选择踩踏板,主要因为小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,反正自己不踩踏板总是最好的选择,是自己的严格优势策略。对于大猪,明知小猪是不会去踩踏板的,自己亲自去踩踏板还可以净得4,总比不踩得到0好。 总之,智猪博弈模型可以解释为谁占有更多资源,谁就必须承担更多的义务。 下面我们来看下这方面的具体应用: 一、从“智猪博弈”来看企业创新策略 不同的企业在博弈中扮演的角色不同,大型企业是小猪,中小企业是大猪。大型企业创造社会财富的主动性是缺失的,一方面是因为它的垄断性,一方面是因为它多半是国企,在政策信息上占有先机。大型企业的盈利一般来自于两个方面:一是瓜分中小企业的利润,二是抢占更多消费者剩余。大型企业的领导通常缺乏改革企业的动力和承担风险的能力。 中小企业是创造社会财富的主力军,虽然它也会剥削劳动者的剩余价值,也会攫取消费者的利益,但是它总有改革和创新的动力。因为自身薄弱的实力促使它必须面对竞争和追求创新,否则就意味着淘汰和出局,所以它总是冲在最前面,附带着解决社会失业问题。中小企业不得不去踩踏板,因为这是它唯一的出路。 与大型企业相比,中小企业有以下几方面的劣势:首先,资金;其次,人才制约;再者,高风险。因此对中小企业来讲,由于本身的特点所限,就技术创新而言,如果想完全依靠率先创新的方式实现技术进步,是不切实际的,应该采用以模仿创新为主的技术进步模式。

博弈论经典案例

博弈论经典案例: 案例一 囚徒困境 在博弈论中,含有占优战略均衡的一个著名例子是由塔克给出的“囚徒困境”(prisoner's dilemma)博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果两个犯罪嫌疑人都坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪,各被判刑8年;如果只有一个犯罪嫌疑人坦白,另一个人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。下表给出了这个博弈的支付矩阵。 囚徒困境博弈[Prisoner's dilemma] A╲B 坦白抵赖 坦白-8,-8 0,-10 抵赖-10,0 -1,-1 对A来说,尽管他不知道B作何选择,但他知道无论B选择什么,他选择“坦白”总是最优的。显然,根据对称性,B也会选择“坦白”,结果是两人都被判刑8年。但是,倘若他们都选择“抵赖”,每人只被判刑1年。在表2.2中的四种行动选择组合中,(抵赖、抵赖)是帕累托最优的,因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。不难看出,“坦白”是任一犯罪嫌疑人的占优战略,而(坦白,坦白)是一个占优战略均衡。 案例二 智猪博弈 一、经济学中的“智猪博弈”(Pigs’payoffs)这个例子讲的是: 假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时行动(去按按钮),收益比是7∶3;小猪先到槽边,收益比是6∶4。那么,在两头猪都有智慧的前提下,最终结果是小猪选择等待。

“智猪博弈”模型对员工激励机制的启示

内容摘要:在现代企业中,人已经成为企业发展最为重要的因素。而企业能否成功地对员工实施激励,发挥员工的积极性和创造性,直接决定其未来的市场竞争地位。本文以企业的激励机制为背景,通过对“智猪博弈”模型及其改进的分析,将其与企业激励机制相结合,最后得出改善企业员工激励机制的措施。 关键词:激励机制“智猪博弈”模型 人力资源是现代企业的战略性资源,也是企业发展的关键因素。激励是人力资源中的重要内容,它是指激发员工的工作动机,也就是说用各种有效的方法去调动员工的积极性和创造性,使员工努力去完成组织的任务,实现组织的目标。因此,企业实行激励机制的最根本目的是正确激发员工的工作热情,使他们在实现组织目标的同时实现自身的需要,增加其满意度,从而使他们的积极性和创造性继续保持下去。可见,激励机制运用的好坏在一定程度上是决定企业兴衰的重要因素。如何运用好激励机制也就成为各个企业面临的一个重要问题。 研究背景 企业的发展壮大是与员工密不可分的。在调动员工的积极性,使其全心全意为企业服务这一方面,激励机制发挥的作用尤为重要。笔者针对某企业对其员工进行的调查研究,得出该企业现有的激励机制的优势与劣势。 (一)企业激励机制的优势 1.大量的员工培训。该企业对入职员工进行大量的入职培训,让员工掌握岗位最基本工作技能与操作,以便使他们尽快适应工作环境。 2.培训结果与晋升挂钩。该企业对入职员工培训后,对其培训效果进行评估,成绩好的员工被任为助理。 (二)企业激励机制的劣势 1.工资过低。该企业的员工包括管理层、月薪工和时薪工三种。其中,月薪工和时薪工的工资都偏低,特别是时薪工。 2.没有制定绩效改进计划。年度评估后,没有给出员工具体的方向,使得评估的作用发挥不大。同时因为绩效考评没有和薪酬有机结合起来,使得绩效考评的激励作用也不明显。 总的来说,员工出勤率、工作效率都相对比较低,工作的积极性不高,原有的激励机制并不够完善,没有起到应有的作用。笔者试从“智猪博弈”模型的构造与改进的分析中,得出改善该企业的时薪工激励机制的措施。 “智猪博弈”模型构造 博弈论是研究各个理性决策主体在其行为发生直接相互作用时的决策及决策均衡问题,它是有关一个主体受到其他人、其他企业选择的影响,而且反过来影响到其他人、其他企业选择时的决策问题和均衡问题。在博弈论中有一个经典的模型即“智猪博弈”模型,其博弈的结果和策略对企业的激励机制很有启示。 (一)“智猪博弈”模型 “智猪博弈”讲的是猪圈里有两头猪,一头大猪,一头小猪。猪圈的一头有一个猪食槽,另一头安装着一个按钮,控制着猪食的供应。按一下按钮会有10个单位的猪食进槽,但按动

《博弈羊皮卷》之智猪博弈与激励制度

智猪博弈与激励制度 文:赵宁 在博弈论经济学中,有一个博弈叫“智猪博弈”,其内容是这样的:假设猪圈里有一头大猪、一头小猪,猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,大猪和小猪可选择的策略分别是行动和等待,你认为,大猪和小猪如何做,才能获得最大收益呢? 现在从博弈的角度来分析一下,先从大猪开始,若大猪选择行动,而小猪选择等待,那么大猪将获得6个单位的食物,同时要付出2个单位的成本,其收益为4个单位;若大猪选择行动,小猪也选择行动,那么大猪将获得7个单位的食物,同时要付出2个单位的成本,其收益为5个单位;若大猪选择等待,而小猪选择行动,那么大猪将获得9个单位的食物,其收益为9个单位;还有一种情况是大猪小猪都选择等待,那么,大猪的收益为0,也就是吃不到食物。 我准备用一个单元格来表示出大猪的收益状况,如下: 单元格一 下面再分析一下小猪的策略与收益情况,并用单元格表示。对于小猪而言,若小猪选择等待,而大猪选择行动,那么小猪将获得4个单位的食物,其收益为4个单位;若小猪选择行动,这时大猪也选择行动,那么小猪将获得3个单位的食物,同时,小猪要付出2个单位的成本,其收益为1个单位;若小猪选择行动,而大猪选择等待,那么小猪将获得1个单位的食物,同时,小猪减去2个单位的成本,小猪的最后收益为 -1个单位;若小猪选择等待,而大猪也选择等待,那么小猪的收益为0。 用单元格表示出小猪的收益的状况,如下:

单元格二 把单元格一和单元格二合并起来,可以得到一个矩阵,这个矩阵是关于大猪和小猪的收益矩阵,如下: 矩阵中的收益数据,可不是凭空捏造的数字,而是经过分析得出的科学的数据,需要提醒一下,单单矩阵本身并不代表博弈,博弈研究的是策略形势,而不是矩阵,它只是作为一种明晰的工具出现在博弈中。 从矩阵中可以清晰的看出,当大猪选择等待,而小猪选择行动的时候对于大猪来说,收益是最大的,可是博弈者的大猪和小猪的决策是相互影响的,小猪是否愿意选择行动这一策略呢?

博弈论智猪博弈

市场竞争中的“智猪”模型分析 学号姓名 摘要:随着市场竞争的越来越激烈,运营商之间的竞争也变得越来越激烈。其本身的实力不容忽视,但其运用的策略也至关重要。本文运用“智猪”博弈模型来谈谈对其的一点看法。 关键词:智猪博弈市场竞争制度 一:什么是博弈论? (一)博弈是指一些个人、团队或其他组织,面对一定的环境条件,在一定的约束条件下,依靠所掌握的信息,同时或先后,一次或多次,从各自可能的行为或策略集合中进行选择并实施,各自从中取得相应结果或收益的过程。 (二)博弈论是一种关于游戏的理论,又叫做对弈论,是一门以数学为基础,研究对抗冲突中最优解问题的学科。 (三)一个标准的博弈应当包括: 1.博弈的参与人,又称局中人,是指博弈中独立决策、独立承担后果,一自身利益最大化来选择行动的决策主体,局中人以最终实现自身利益最大化为目标。 2.博弈行为,是指参与人的所有可能的策略或行动的集合。 3.博弈信息,是指参与人在博弈过程中所掌握的对选择策略有帮助的情报知识,特别是有关其他参与人的特征和行动的知识,即该参与人所掌握的其他参与人的对其决策有影响的所有知识。 4.博弈策略,又称战略,是指参与人可选择的全部行为或策略的集合。 5.博弈的次序,即博弈参加者做出策略选择的先后顺序。 6.博弈方的收益,是指参与人从博弈中做出决策选择后的所得和所失。 7.结果,是指博弈分析者感兴趣的要素集合。 8.均衡,是指所有参与人的最优策略或行动的组合。 二、“智猪”博弈模型

(一)智猪博弈是经济学中经常讲的一个经典博弈实例。这个案例讲的是:有一大一小两头猪在同一个食槽进食,在食槽的另一端安装有一个控制猪食供应量的按钮,在每次进食前,至少要有一头猪过去按按钮,他们才能获得食物。模型还假定:每按一次按钮可出8单位食物,但按按钮要付出2个单位的成本。若大猪先到食槽,则大猪得到7单位的食物,而小猪仅得到1单位的食物:若小猪先到,则大猪小猪各得到4单位得食物;若两猪同时到,则大猪得到5单位,小猪得到3单位食物。这时,大猪小猪得都有两个战略:按或等待。如果大猪按电钮,小猪等待,大猪可得食4单位,扣除成本后得2单位,小猪亦得4单位;如果小猪按电钮,大猪等待,大猪得食7单位,小猪得食3单位,扣除成本后得食1单位;如果同时按,大小猪各得5个和3个单位,扣除成本后,各得3个和1单位;如果谁都不按,则无食可吃,皆为0。那么,两只猪各会采取什么策略?答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。上述模型虽然没有严格的占优均衡,但“按”对小猪来说是劣策略,所以理性的小猪会选择“等待”,同样,大猪也是理性的,会选择“按”。于是该模型有“重复提出劣策略的占优均衡解”——(按,等待),“大猪按钮,小猪等待”,这就是小猪的“搭便车”现象。 (二)生活中的智猪博弈模型 在电信市场上,大小猪的现象很普遍。在这里,可以将大的主导运营商看作是“大猪”,比如中国移动、中国电信和中国网通;把中小运营商看作“小猪”,比如中国联通、中国铁通和众多增值电信业务运营商。主导运营商资金雄厚,抗风险能力强,还积聚了大量的人才,具有较强的市场开拓能力,而小运营商得益于政府的扶持,比如国家为了扶持相对弱小的新兴运营商,采取了不对称管制,主要电信资费采取差别化定价方式,即对主导电信运营商实行政府定价,对新进入的电信运营商实行在政府定价的基础上下浮一定比例的政府指导价,浮动比例一般为10%~15%。加上网间结算费用较低,一些新兴的电信运营商就可以利用这个优势来打价格战,利用低价在主导运营商的存量市场上“挖角”。另外,主导运营商往往要承担村村通工程、普遍服务义务,而中小型电信运营商可以不承担上述义务。因此,中小运营商就可以实行“撇脂”策略,给主导运营商造成较大的竞争压力。

博弈论案例分析1

一、经济学中的“智猪博弈”(Pigs’payoffs) 故事背景:猪圈里有一头大猪和一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。 那么,两只猪各会采取什么策略?答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。 原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。 “小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是:每次落下的事物数量和踏板与投食口之间的距离。 如果改变一下核心指标,猪圈里还会出现同样的“小猪躺着大猪跑”的景象吗?试试看。 改变方案一:减量方案。投食仅原来的一半分量。结果是小猪大猪都不去踩踏板了。小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将也会把食物吃完。谁去踩踏板,就意味着为对方贡献食物,所以谁也不会有踩踏板的动力了。 如果目的是想让猪们去多踩踏板,这个游戏规则的设计显然是失败的。 改变方案二:增量方案。投食为原来的一倍分量。结果是小猪、大猪都会去踩踏板。谁想吃,谁就会去踩踏板。反正对方不会一次把食物吃完。小猪和大猪相当于生活在物质相对丰富的“共产主义”社会,所以竞争意识却不会很强。 对于游戏规则的设计者来说,这个规则的成本相当高(每次提供双份的食物);而且因为竞争不强烈,想让猪们去多踩踏板的效果并不好。 改变方案三:减量加移位方案。投食仅原来的一半分量,但同时将投食口移到踏板附近。结果呢,小猪和大猪都在拼命地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费完。 对于游戏设计者,这是一个最好的方案。成本不高,但收获最大。 原版的“智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。但是对于社会而言,因为小猪未能参与竞争,小猪搭便车时的社会资源配置的并不是最佳状态。为使资源最有效配置,规则的设计者是不愿看见有人搭便车的,政府如此,公司的老板也是如此。而能否完全杜绝“搭便车”现象,就要看游戏规则的核心指标设置是否合适了。 比如,公司的激励制度设计,奖励力度太大,又是持股,又是期权,公司职员个个都成了百万富翁,成本高不说,员工的积极性并不一定很高。这相当于“智猪博弈”增量方案所描述的情形。但是如果奖励力度不大,而且见者有份(不劳动的“小猪”也有),一度十分努力的大猪也不会有动力了----就像“智猪博弈”

博弈均衡模型及其举例

博弈联均衡模型 博弈论模型图示 博弈可划分为合作博弈和非合作博弈,1人们一般讲到的都是指非合作博弈,它有四种不同类型的博弈,即完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈,与上述相对应的是纳什均衡、子博弈精炼纳什均衡、贝叶斯纳什均衡、精炼贝叶斯纳什均衡。这四种均衡中最为基本的是纳什均衡。2 完全信息静态博弈——纳什均衡、 完全信息动态博弈——子博弈精炼纳什均衡 不完全信息静态博弈——贝叶斯纳什均衡、、 不完全信息动态博弈——精炼贝叶斯纳什均衡, 与上述相对应的是、、、。这四种均衡中最为基本的是纳什均衡。 完全信息静态博弈(纳什均衡) 债务人 强硬妥协 1这两者的区别主要在于人们的行为相互作用时,当事人能否达成一个有约束力的协议:如能达成就是合作博弈;反之就是非合作博弈。合作博弈强调团体理性,强调效率和公平,非合作博弈强调理性个人的最优决策,其结果是否有效率则是不确定的。 2所谓纳什均衡,指的是所有参与人最优选择的一种组合,在这种组合下,给定其他人的选择,没有任何人有积极性做出新的选择。纳什均衡的哲学思想是:给定别人遵守协议的情况下,没有人有积极性偏离协议规定的自己的行为规则。换言之,如果一个协议不构成纳什均衡,它就不可能自动实施,因为至少有一个参与人会违背这个协议,不满足纳什均衡要求的协议是没有意义的。当博弈中的所有参与人事先达成一项协议,给出每个人的行为规则。在没有外在强制力约束时,当事人是否会自觉地遵守这个协议?或者说这个协议是否可以自动实施?如果当事人会自觉遵守这个协议,等于说这个协议构成一个纳什均衡。参见张维迎:“经济学家看法律、文化与历史”,载张维迎《产权、政府与信誉》,三联书店2001年版。

博弈论模型

1. 囚徒困境 这是博弈论中最最经典的案例了——囚徒困境,非常耐人寻味。 “囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发 现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情 形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他 们拒不承认,警方无法给他们定罪。但警方也明白这一点,所以他们就给了这 两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就 可以被无罪释放,同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪 来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会 得到奖赏。 那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看, 他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。 但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不会向警方提供对他不利的证据,然后带着一笔 丰厚的奖赏出狱而去,让他独自坐牢。这种想法的诱惑力实在太大了。但他也 意识到,他的同伙也不是傻子,也会这样来设想他。所以A犯的结论是,唯一 理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保 持沉默,那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个 逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。 企业在信息化过程中需要与咨询企业、软件供应商打交道的。在与这些企业打 交道的过程中,我们不可避免地也会遇到类似的两难境地,这个时候需要相互 之间有足够的了解与信任,没有起码的信任做基础,切不可贸然合作。在对对 方有了足够的信任之后,诚意也是必不可少的,如果没有诚意或者太过贪婪, 就可能闹到双方都没有好处的糟糕情况,造成企业之间的双输。 2. 智猪博弈 在博弈论(Game Theory)经济学中,“智猪博弈”是一个著名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着 控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是 9∶1;同时到槽边,收益比是7∶3;小猪先到槽边,收益比是6∶4。那么,在两头猪都有智慧的前提下,最终结果是小猪选择等待。 实际上小猪选择等待,让大猪去按控制按钮,而自己选择“坐船”(或称为搭便车)的原因很简单:在大猪选择行动的前提下,小猪也行动的话,小猪可得到1

博弈论模型案例分析报告报告材料

利用古诺双寡头模型来分析案例 1 案例 在目前竞争的市场上主打的两种可乐是可口可乐和百事可乐,几乎垄断了整个市场,在生产过程中,他们都了解对方的策略。据统计他们的产量接近于Q/3,其中Q 为市场总容量,问题1是:为什么这个市场会这样发展? 2 建立古诺双寡头模型 根据以上案例可以采取古诺双寡头模型来分析问题,该模型假定市场只有两个卖者,商品是同质的,并且假设他们共同面临的市场的需求曲线是线性的,相互间没有任何勾结行为,但相互间都知道对方将怎样行动,从而各自怎样确定最优的产量来实现利润最大化。 这个博弈的参与人是两家公司,在该模型下,把两种可乐看成是同质商品,在这个博弈中生产成本就是C*Q ,生产一单位商品的成本是C 。根据需求曲线图,可乐属于正常品,两家企业生产得越多,该商品的价格就越低。价格取决于两个参数:a &b ,b 为需求曲线的斜率。)(21q q b a P +-= ------① 这些公司的目标是利润最大化,公司1的利润跟q1,q2有关, 图1需求曲线 总产量Q=q1+q2 0 m q

11211,q c q p q q u *-*=) (,把①式中的价格p 带入得122 111cq q bq bq aq u ---=②,同理可得,22222212),(cq q bq bq aq q q u ---=③。 2.1我们可以尝试找出纳什均衡: 方法:把每个人的最佳对策看成别人策略的函数,然后找出函数的交点。参与人1对于2不同产量下的最佳产量,然后反过来,在参与人1的不同产量下,参与人2的最佳产量。即在不同的q2下q1取什么值才能最大化利润。 ②式对q1求导后,令导数为0,并且验证2阶条件,发现其小于0 ,所以是最大值,就得出参与人2不同策略下参与人1的最佳对策,2/2/)(21q b c a q --=,同理可得2/2/)(12q b c a q --=。 2.2参与人1的最佳对策选择过程如下: 假如参与人2的产量为0时,参与人1的最佳对策是为(a-c )/2b ,形成垄断产量,表现在图1为边际收入等于边际成本的产量m q ;再是公司2的产量为多少时公司1停产,在图1表现为边际成本与需求曲线的交点处,即公司2的产量一直增加到(a-c )/b 时,因为市场上该产品的产量跟价格成反比,因此当公司2增加产量时每件产品必然降价。这个点就是完全竞争产量。在完全竞争市场中,这就是最终的市场价格。现在我们算出垄断产量跟完全竞争产量,二者之间的关系是直线。 下面做出这些函数的图形,横轴表示产量,这表示参与人1的策略,纵轴表示参与人2的策略。下面的曲线就是说在给定q2的产量情况下,q1的最佳对策是多少产量。那么反过来,给定q1的产量情况下,q2的最佳对策是多少产量,是关于45度线的对称线。这个图的纳什均衡点就是两条线的交点产量为q1*=q2*=(a-c)/3b ,即最佳决策点的交点A 。这就是古诺模型的纳什均衡点。

相关主题