搜档网
当前位置:搜档网 › 博弈论教案设计

博弈论教案设计

博弈论教案设计
博弈论教案设计

博弈论教案设计

论经济博弈论

论经济博弈论 “博弈即一些个人、对组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。”博弈由英文“game”翻译过来,过去每每听到博弈一词.都觉得这是一个高深莫测、充满神秘色彩的领域,如今通过了系统的学习,才终于可以对“博弈”有一些粗浅的理解。博弈论的英文名称为Gm,ne Theory,也翻译为对策论、游戏论。作为一门现代学科体系,博弈论早在半个世纪以前就已经出现,但长期以来并没有受到足够重视,除了少数博弈论专家以外,很少有人知道它。可是,近年来却受到高度的重视和青睐。1994 年三位致力于博弈论基础理论研究的经济学家共同获得了诺贝尔经济学奖,使得博弈论作为重要的经济学分支学科的地位和作用得到了最具权威性的肯定。此后1996年,诺贝尔经济学奖又由博弈论和信息经济学家莫里斯和维克瑞获得,这进一步肯定了博弈论在经济学中的重要地位,同时也从一个侧面体现出博弈理论已经渡过了成长期,步人了成熟期。 一、博弈论的发展进程 博弈论思想虽然有着悠久的历史,但是作为一门系统的学科来说还相当的年轻。近代以来,在学术研究的过程中许多学者逐渐认识到了博弈论的重要作用,对博弈理论进行了探索研究。一般认为,对于博弈理论的最早研究可以追溯到18世纪初。瓦德格拉夫(W aldegrave)在1713年提出了两人博弈的极小化极大混合策略解。古诺(Coumot)和波特兰德(Bertrand)分别在1838年和1883年提出了博弈论最经典的模型,两位学者分别从产茸决策和价格决策分析垄断的双寡头竞争模型,确定了在竞争之下各自的最优反应函数。但是作为一种理论来说,1944年,冯·诺依曼(VonNeumann)和奥·摩根斯坦(Morgenstem)合著了《博弈论与经济行为》在总结了以往关于博弈的研究成果的基础上,提出了博弈论的概念术语、一般框架和表述方法,提较系统的博弈理论,因此这被认为是博弈理论初步形成的标志。50年代初,纳什(J.Nash)的两篇非合作博弈论奠基性论文发表之后。博弈论飞速发展。作为博弈论的一部分,非合作博弈比合作博弈的发展更加迅速,在经济学等其他学科中的应用也更为广泛。提起博弈论,现在差不多总是指非合作博弈论。50年代以来,纳什(Nash)、泽尔腾(Sehen)、海萨尼(Harsanyi)等人是

博弈论经典例子

博弈论经典例子 篇一:《博弈论三大经典案例》 经典的囚徒困境 1950年,由就职于兰德公司的梅里尔弗拉德(MerrillFlood)和梅尔文德雷希尔(MelvinDresher)拟定出相关困境的理论,后来由顾问阿尔伯特塔克(AlbertTucker)以囚徒方式阐述,并命名为"囚徒困境"。经典的囚徒困境如下: 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 若一人认罪并作证检举对方(相关术语称"背叛"对方),而对方保持沉默,此人将即时获释,沉默者将判监xx年。若二人都保持沉默(相关术语称互相"合作"),则二人同样判监半年。若二人都互相检举(互相"背叛"),则二人同样判监2年。 用表格概述如下: 甲沉默(合作) 乙沉默(合作)二人同服刑半年甲认罪(背叛)甲即时获释;乙服刑xx 年乙认罪(背叛)甲服刑xx年;乙即时获释二人同服刑2年 如同博弈论的其他例证,囚徒困境假定每个参与者(即"囚徒")都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为"严格劣势",理性的参与者绝不会选择。另外,没有任何

其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 若对方沉默、背叛会让我获释,所以会选择背叛。若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 二人面对的情况一样,所以二人的理性思考都会得出相同的结论选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是"困境"所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。由囚徒困境可以写出类似的员工困境: 一名经理,数名员工;前提,经理比较苛刻; 如果所有员工都听从经理吩咐,则奖金等待遇一样,不过所有人

博弈论经典案例分析

博弈论经典案例分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

高鸿业,微观经济学,第七版,课后答案,西方经济学18第十章博弈论初步

第十章 博弈论初步 第一部分 教材配套习题本习题详解 一、简答题 1.什么是纳什均衡?纳什均衡一定是最优的吗? 解答:(1)所谓纳什均衡,是参与人的一种策略组合,在该策略组合上, 任何参与人单独改变策略都不会得到好处。 (2)不一定。如果纳什均衡存在,纳什均衡可能是最优的,也可能不是最优的。例如,在存在多个纳什均衡的情况下,其中有一些纳什均衡就不是 最优的;即使在纳什均衡是唯一时,它也可能不是最优的,因为与它相对应的支付组合可能会小于与其他策略组合相对应的支付组合。如:囚徒 困境。 2.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下, 纯策略的纳什均衡最多可有几个?为什么? 解答:在只有两个参与人 (如 A和 B)且每个参与人都只有两个策略可供选择的情况下,纯策略的纳什均衡最多可有四个。例如,当A与B的支付矩阵可分别表示如下时,总的支付矩阵中所有四个单元格的两个数字均有下划线,从而,总共有四个纳什均衡。 A 的支付矩阵=??????22211211a a a a B 的支付矩阵=??? ???2221 1211b b b b 例如:a 11=a 12=a 21=a 22,b 11=b 12=b 21=b 22就会得到以上四个纳什均衡。 具体事例为: 73737373?? ?? ??

3.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,纯策略的纳什均衡可能有三个。试举一例说明。 解答:在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,纯策略的 纳什均衡可能有4个、3个、2个、1个和0个五种情况,所以可能有3个。例如,当参与 人A与B的支付矩阵可分别表示如下时,总的支付矩阵中恰好有三个单元格的两个数字均有下划线,从而,总共有三个纳什均衡。 A 的支付矩阵= ??? ???22211211a a a a B 的支付矩阵=11122122b b b b ???????? A 、 B 共同的支付矩阵=1111121222222121a b a b a b a b ?? ?????? 具体事例为: 76157323?? ?? ?? 4.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,如何找到所 有的纯策略纳什均衡? 解答:可使用条件策略下划线法。具体步骤如下:首先,把整个博弈的支付矩阵分解 为两个参与人的支付矩阵;其次,在第一个 (即位于整个博弈矩阵左方的)参与人的支付矩阵中,找出每一列的最大者,并在其下画线;再次,在第二个 (在位于整个博弈矩阵上 方的)参与人的支付矩阵中,找出每一行的最大者,并在其下画线;然后,将已经画好线的两个参与人的支付矩阵再合并起来,得到带有下划线的整个博弈的支付矩阵;最后,在带有下划线的整个的支付矩阵中,找到两个数字之下均画有线的支付组合。由该支付组合 代表的策略组合就是博弈的纳什均衡。 5.设有A、B两个参与人。对于参与人A的每一个策略,参与人B的条件策略有无 可能不止一个?试举一例说明。 解答:例如,在如表10—1的二人同时博弈中,当参与人 A选择上策略时,参与人 B 既可以选择左策略,也可以选择右策略,因为他此时选择这两个策略的支付是完全一样 的。因此,对于参与人A的上策略,参与人B的条件策略有两个,即左策略和右策略。 表10—1

博弈论经典模型全解析

博弈论经典模型全解析(入门级) 1. 囚徒困境这是博弈论中最最经典的案例了——囚徒困境,非常耐人寻味。“囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不

会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到,他的同伙也不是傻子,也会这样来设想他。所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。企业在信息化过程中需要与咨询企业、软件供应商打交道的。在与这些企业打交道的过程中,我们不可避免地也会遇到类似的两难境地,这个时候需要相互之间有足够的了解与信任,没有起码的信任做基础,切不可贸然合作。在对对方有了足够的信任之后,诚意也是必不可少的,如果没有诚意或者太过贪婪,就可能闹到双方都没有好处的糟糕情况,造成企业之间的双输。 2. 智猪博弈在博弈论(Game Theory)经济学中,“智猪博弈”是一个着名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是

博弈论案例分析

(1)失火了,你往哪个门跑 失火了,你往哪个门跑——这就是博弈论 一天晚上,你参加一个派对,屋里有很多人,你玩得很开心。这时候,屋里突然失火,火势很大,无法扑灭。此时你想逃生。你的面前有两个门,左门和右门,你必须在它们之间选择。但问题是,其他人也要争抢这两个门出逃。如果你选择的门是很多人选择的,那么你将因人多拥挤、冲不出去而烧死;相反,如果你选择的是较少人选择的,那么你将逃生。这里我们不考虑道德因素,你将如何选择?这就是博弈论! 你的选择必须考虑其他人的选择,而其他人的选择也考虑你的选择。你的结果——博弈论称之为支付,不仅取决于你的行动选择——博弈论称之为策略选择,同时取决于他人的策略选择。你和这群人构成一个博弈(game)。 上述博弈是一个叫张翼成的中国人在1997年提出的一个博弈论模型,被称之为少数者博弈或少数派博弈(Minority Game)。当然,原来的博弈形式不是这么简单,这里我把它简化了,我们在第三部分论述归纳推理时还要谈这个博弈模型。现在很多学者在研究这个问题。 生活中博弈的案例很多,你会见到很多例子。只要涉及到人群的互动,就有博弈。 什么叫博弈?博弈的英文为game,我们一般将它翻译成“游戏”。而在西方,game的意义不同于汉语中的游戏。在英语中,game即是

人们遵循一定规则下的活动,进行活动的人的目的是使自己“赢”。奥林匹克运动会叫Olympic Games。在英文中,game有竞赛的意思,进行game的人是很认真的,不同于汉语中游戏的概念。在汉语中,游戏有儿戏的味道。因此将关于game的理论,即game theory翻译成博弈论或者对策论,是恰当的。本书下面统称game theory为博弈论。 博弈论的出现只有50多年的历史。博弈论的开创者为诺意曼与摩根斯坦,他们1944年出版了《博弈论与经济行为》。诺意曼是着名的数学家,他同时对计算机的发明作出了巨大贡献,他去世时博弈论还未对经济学产生广泛影响,否则经济学的诺贝尔奖肯定有他的名字,因为诺贝尔奖有规定,只颁发给在世的学者。谈到博弈论,不能忽略博弈论天才纳什(John Nash)。纳什的开创性论文《n人博弈的均衡点》(1950)、《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。今天博弈论已发展成一个较完善的学科。 博弈论对于社会科学有着重要的意义,它正成为社会科学研究范式中的一种核心工具,以至于我们可称博弈论是“社会科学的数学”,或者说是关于社会的数学。从理论上讲,博弈论是研究理性的行动者(agents)相互作用的形式理论,而实际上它正深入到经济学、政治学、社会学等等,被各门社会科学所应用。甚至有学者声称要用博弈论重新改写经济学。1994年经济学诺贝尔奖颁发给三位博弈论专家:纳什、塞尔屯、哈桑尼(),而像1985年获得诺贝尔奖的公共选择学派的领导者布坎南,1995年获得诺贝尔奖的理性主义学派的领袖卢

博弈模型

有趣味的博弈论模型 按语: 本文已经发表在“百科知识”2009年6月下半月总第413期第14-15页;在今年2月下半月总第405期第11-13页上发表了“网络科学三大里程碑”;2005年11月上半月总第326期第21-22页发表了“网络科学的三大发现”。令我意外的是去年在网上偶然发现“共检索到 10 条读者推荐文章”(请看最后附录),这篇科普文章名列首位,我们还有一篇文章名列第七。如果读者有兴趣可以去看看,或等我有时间找出来。我觉得,把新兴科学应用通俗易懂的语言写出来,有利于科学知识普及。这也应该是一个科学工作者的责任。 在自然界和人类社会经济等领域中广泛存在合作与竞争,而能够反映这种既激烈竞争又需要合作的一门学科就是博弈论(Game Theory),也称对策论,它是模拟和分析理性的个体在利益冲突环境下相互作用的形式、决策及其均衡理论,研究个体之间行为的相互影响和相互作用规律,它可以描述现实生活中参与者面对有限资源的合作与竞争行为。令人惊奇的是,有三次诺贝尔获奖者是博弈论的杰出科学家,他们是1985年获得诺贝尔奖的公共选择学派的领导者布坎南,1994年经济学诺贝尔奖颁发给美国普林斯顿大学的纳什博士、塞尔屯、哈桑尼3位博弈论专家,1995年获奖的理性主义学派的领袖卢卡斯。博弈论在经济学、政治学、管理学、社会学、军事学、生物学等诸多学科领域具有广泛的实际背景和应用价值。进入20世纪末,随着复杂网络科学的一些新的发现,博弈论也成为网络时代人们的一种思维方式、竞争与合作的模式。 博弈论对人有一个最基本假定:人是理性的,人在具体策略选择的目的全是使自己的利益最大化。博弈论就是研究理性的人之间如何进行策略选择的,因此博弈论也称为对策论。博弈论就凭这么一条最简单的假定可以展开广泛的研究,并获得了丰富多彩的结果,利用博弈论可以解读人类的社会行动或集体行动,更易理解人类社会的复杂性和特殊性。为了刻画个体间利益的冲突对整个系统的影响,人们已经提出和研究了许多博弈模型,比较著名的有三个模型:囚徒困境、“雪堆”博弈和“少数者”博弈,下面笔者通过对这三个模型进行简单而通俗的介绍,让大家了解博弈论及其应用概况。 “囚徒困境”模型 囚徒困境作为一个经典的博弈模型受到广泛关注。这个博弈模型假设两个小偷合伙作案时被捕,分别关在不同的屋子里,如果双方都拒绝承认同伴的罪行,则由于证据不足两人都会被轻判(收益为);为此,警方设计了一个机制:如果一方出卖同伴,而另一方保持忠 诚,则背叛者将无罪释放(收益为T ) ;坚持忠诚的一方将被重判(收益为);如果双方都背叛了对方,则双方都会被判刑(收益为R S P ) 。这里假设上述收益参数满足下面的条件:。对每个参与者来说,如果对手坚持忠诚,则他也选择忠诚得到的收益T R P S >>>R 小于他选择背叛得到的收益T ;如果对手选择背叛,则他选择忠诚得到的收益仍小于他选择背叛得到的收益。 S P 可见,无论对手采取哪种策略,自己的最佳策略就是背叛,双方都选择背叛称为囚徒困境的唯一“纳什均衡”(纳什因其提出的“非合作完全信息博弈的纳什均衡”概念而荣获了1994年的诺贝尔获得经济学奖);同时选择背叛所取得的平均收益要低于两个人同时选择合作取得的平均收益。在这种情况下,理性参与者面临着两难的困境。 自然界中广泛存在的合作现象——从单细胞生物的协同工作到人类的无私奉献的行为

《经济博弈论》期末考试复习解析

《经济博弈论》期末考试复习资料 第一章导论 1.博弈的概念: 博弈即一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,并从中各自取得相应结果的过程。它包括四个要素:参与者,策略,次序和得益。 2.一个博弈的构成要素: 博弈模型有下列要素:(1)博弈方。即博弈中决策并承但结果的参与者.包括个人或组织等:(2)策略。即博弈方决策、选择的内容,包括行为取舍、经济活动水平或多种行为的特定组合等。各博弈方的策略选择范围称策略空间。每个博弈方各选一个策略构成一个策略组合。(3)进行博弈的次序:次序不同一般就是不同的博弈,即使博弈的其他方面都相同。(4)得益。各策略组合对应的各博弈方获得的数值结果,可以是经济利益,也可以是非经济利益折算的效用等。 3.合作博弈和非合作博弈的区别: 合作博弈:允许存在有约束力协议的博弈;非合作博弈:不允许存在有约束力协议的博弈。主要区别:人们的行为互相作用时,当事人能否达成一个具有约束力的协议。 假设博弈方是两个寡头企业,如果他们之间达成一个协议,联合最大化垄断利润,并且各自按这个协议生产,就是合作博弈。 如果达不成协议,或不遵守协议,每个企业都只选择自己的最优产品(价格),则是非合作博弈。 合作博弈:团体理性(效率高,公正,公平) 非合作博弈:个人理性,个人最优决策(可能有效率,可能无效率) 4.完全理性和有限理性: 完全理性:有完美的分析判断能力和不会犯选择行为的错误。 有限理性:博弈方的判断选择能力有缺陷。 区分两者的重要性在于如果决策者是有限理性的,那么他们的策略行为和博弈结果通常与在博弈方有完全理想假设的基础上的预测有很大差距,以完全理性为基础的博弈分析可能会失效。所以不能简单地假设各博弈方都完全理性。 5.个体理性和集体理性: 个体理性:以个体利益最大为目标;集体理性:追求集体利益最大化。 第一章课后题:2、4、5 2.设定一个博弈模型必须确定哪几个方面? 设定一个博弈必须确定的方面包括:(1)博弈方,即博弈中进行决策并承担结果的参与者;(2)策略(空间),即博弈方选择的内容,可以是方向、取舍选择,也可以是连续的数量水平等;(3)得益或得益函数,即博弈方行为、策略选择的相应后果、结果,必须是数量或者能够折算成数量;(4)博弈次序,即博弈方行为、选择的先后次序或者重复次数等;(5)信息结构,即博弈方相互对其他博弈方行为或最终利益

博弈论的经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

高鸿业《西方经济学(微观部分)》(第6版)笔记(第10章 博弈论初步)

高鸿业《西方经济学(微观部分)》(第6版)第10章博弈论初步 复习笔记 跨考网独家整理最全经济学考研真题,经济学考研课后习题解析资料库,您可以在这里查阅历年经济学考研真题,经济学考研课后习题,经济学考研参考书等内容,更有跨考考研历年辅导的经济学学哥学姐的经济学考研经验,从前辈中获得的经验对初学者来说是宝贵的财富,这或许能帮你少走弯路,躲开一些陷阱。 以下内容为跨考网独家整理,如您还需更多考研资料,可选择经济学一对一在线咨询进行咨询。 博弈论在20世纪50年代由数学家约翰·冯·诺依曼和经济学家奥斯卡·摩根斯坦引入经济学,目前已经成为主流经济分析的主要工具,对寡头理论、信息经济学等经济理论的发展作出了重要贡献。 一、博弈论的几个基本概念 博弈论是研究在策略性环境中如何进行策略性决策和采取策略性行动的科学。在策略性环境中,每一个人进行的决策和采取的行动都会对其他人产生影响。因此,每个人在进行策略性决策和采取策略性行动时,要根据其他人的可能反应来决定自己的决策和行动。 1.博弈参与人 参与人或称局中人,是指博弈中的决策主体,即在博弈中进行决策的个体。参与人既可以是个人,也可以是团体(企业或国家)。 2.策略 策略是指参与人选择行为的规则,也就是指参与人应该在什么条件下选择什么样的行动,以保证自身利益最大化。 3.支付函数 支付函数也称为效用函数,表明了博弈的参与人采取的每种策略组合的结果或收益,它是所有参与人策略或行动的函数,是每个参与人真正关心的东西。 4.支付矩阵 参与博弈的多个参与人的收益可以用一个矩阵或框图表示,这样的矩阵或框图称之为支付矩阵,也称之为博弈矩阵或收益矩阵。 其中,博弈参与人、参与人的策略和参与人的支付构成了博弈须具有的三个基本要素。 二、完全信息静态博弈:纯策略均衡 1.条件策略和条件策略组合 在同时博弈中,在给定其他参与人的策略时,某个参与人的最优策略称之为该参与人的条件优势策略(简称条件策略),而包括该参与人的条件策略以及这些条件在内的所有参与人的策略组合称之为该参与人的条件优势策略组合(简称条件策略组合)。 2.纳什均衡 如表10-1所示,(不合作,不合作)既是甲厂商的条件策略组合,也是乙厂商的条件策略组合,在该策略组合上,甲厂商和乙厂商都没有单独改变策略的倾向。 表10-1 寡头博弈:合作与不合作

博弈论理论经典讲解

博弈论经典案例 冰晶淩(杂物区)2010-04-09 22:31:28 阅读258 评论0 字号:大中小订阅 引用 光光的博弈论经典案例 1994年诺贝尔经济学奖授给了三位博弈论专家:纳什,泽尔腾和海萨尼.而博弈论可以划分为合作博弈和非合作博弈.那三位博弈论专家的贡献主要是在非合作博弈方面,而且现在经济学家谈到博弈论,一般指的是非合作博弈,很少指合作博弈.合作博弈与非合作博弈之间的区别主要在于人们的行为相互作用时,当事人能否达成一个具有约束力的协议,如果有,就是合作博弈;反之,就是非合作博弈.非合作博弈强调的是个人理性,个人最优决策,其结果可能是有效率的,也可能是无效率的.而合作博弈强调的是团体理性.下面是我收集的张维迎教授的几个有关博弈论的经典 案例. <案例一:囚徒困境> 囚徒困境讲的是两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里审讯.警察告诉他们:如果两人都坦白,各判刑8年;如果两个都抵赖,各判1年(或许因证据不足);如果其中一人坦白一人抵赖,坦白的放出去,不坦白的判刑10年(这有点'坦白从宽,抗拒从严'的味道).这里,每个囚徒都有两种战略:坦白或抵赖.表中每一格的两个数字代表对应战略组合下两个囚徒的支付(效用),其中第一个数字是第一个囚徒的支付,第二个数字为第二个囚徒的支付.战略形式又称标准形式,是博弈的两种表述形式之一,它特别方便于静态博弈分析. 在这个例子里,纳什均衡就是(坦白,坦白):给定B坦白的情况下,A的最优战略是坦白;同样,给定A坦白的情况下,B的最优战略也是坦白.事实上,这里,(坦白,坦白)不仅是纳什均衡,而且是一个占优战略均衡.就是说,不论对方如何选择,个人的最优选择是坦白.比如说,如果B不坦白,A坦白的话被放出来,不坦白的话判1年,所以坦白比不坦白好;如果B坦白,A坦白的话判8年,不坦白的话判10年,所以,坦白还是比不坦白好。 这样,坦白就是A占优战略;同样,坦白也是B的占优战略.结果是,每个人都选择坦白,各判刑8年. <案例二:智猪博弈> 这个例子讲的是,猪圈里有两头猪,一大一小.猪圈的一头有一个猪食槽,另一头安装一个按钮,控制着猪食的供应。按一下按钮会有10个单位的猪食进槽,但谁按按钮需要付2个单位的成本.若大猪先到,大猪吃到9个单位,小猪只能吃1个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃6个单位,小猪吃4个单位。表中第一格表示两猪同时按按钮,因而同时走到猪食槽,大猪吃7个,小猪吃3个,扣除2个单位的 成本,支付水平分别为5和1.其他情形可以类推. 在这个例子中,什么是纳什均衡?首先我们注意到,无论大猪选择"按"还是"等待",小猪的最优选择均是"等待".比如说给定大猪按,小猪也按时得到1个单位,等待则得到4个单位;给定大猪等待,小猪按得到-1单位,等待则得0单位,所以,"等待"是小猪的占优战略.给定小猪总是选择"等待",大猪的最优选择只能是"按".所以,纳什均衡就是:大猪按,小猪等待,各得4个单位.多劳者不多得! <案例三:性别战>

第十章 博弈论初步 微观经济学微观课后答案

第十章 博弈论初步 1.什么是纳什均衡?纳什均衡一定是最优的吗? 解答:(1)所谓纳什均衡,是参与人的一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。 (2)不一定。如果纳什均衡存在,纳什均衡可能是最优的,也可能不是最优的。例如,在存在多个纳什均衡的情况下,其中有一些纳什均衡就不是最优的;即使在纳什均衡是唯一时,它也可能不是最优的——因为与它相对应的支付组合可能会小于与其他策略组合相对应的支付组合。如:囚徒困境。 2.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,纯策略的纳什均衡最多可有几个?为什么? 解答:在只有两个参与人(如A 和B)且每个参与人都只有两个策略可供选择的情况下,纯策略的纳什均衡最多可有四个。例如,当A 与B 的支付矩阵可分别表示如下时,总的支付矩阵中所有四个单元格的两个数字均有下划线,从而,总共有四个纳什均衡。 A 的支付矩阵=??????22211211 a a a a B 的支付矩阵=?? ????22211211b b b b 3.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,纯策略的纳什均衡可能有三个。试举一例说明。 解答:在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,纯策略的纳什均衡可能有4个、3个、2个、1个和0个,五种情况,所以可能有3个。例如,当参与人A 与B 的支付矩阵可分别表示如下时,总的支付矩阵中恰好有三个单元格的两个数字均有下划线,从而,总共有三个纳什均衡。 A 的支付矩阵= ??????22211211a a a a B 的支付矩阵=11122122b b b b ???????? 4.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,如何找到所有的纯策略纳什均衡? 解答:可使用条件策略下划线法。具体步骤如下:首先,把整个博弈的支付矩阵分解为两个参与人的支付矩阵;其次,在第一个(即位于整个博弈矩阵左方的)参与人的支付矩阵中,找出每一列的最大

经济博弈论

1、纳什均衡的概念。 对于任一个博弈游戏来讲,一定存在这么一组策略,使得其对于任一个局中人而言都是最好的,如果其它的所有局中人不改变他们的策略的话。 2、非合作博弈与合作博弈的区别。形成合作博弈的两个条件: (1)对联盟来说,整体收益大于其每个成员单独经营时的收益之和。 (2)对联盟内部而言,应存在具有帕累托改进性质的分配规则,即每个成员都能获得比不加入联盟时多一些的收益。 如何保证实现和满足这些条件,这是由合作博弈的本质特点决定的。也就是说,联盟内部成员之问的信息是可以互相交换的,所达成的协议必须强制执行。这些与非合作的策略型博弈中的每个局中人独立决策、没有义务去执行某种共同协议等特点形成了鲜明的对比。因此可以说:形成合作博弈的原因是在某种制度约束下的集体理性战胜了个人理性。 3、解释下列概念:纯策略、混合策略、策略组合、纳什均衡、贝叶斯均衡、反应函数 在完全信息博弈中,如果在每个给定信息下,只能选择一种特定策略,这个策略为纯策略。纯策略是混合策略的特例。 按照一定的概率,从一套“纯策略”中随机选取实际的对策,称为混合策略。混合策略是纯策略在空间上的概率分布,纯策略是混合策略的特例。 策略组合指参与者可能采取的所有行动方案的集合。策略集合必须有两个以上元素,否则,无所谓对策,只是独自决策。 所谓贝叶斯纳什均衡是指这样一组策略组合:在给定自己的特征和其他局中人特征的概率分布的情况下,每个局中人选择策略使自己的期望支付达到最大化,也就是说,没有人有积极性选择其他策略 反应函数,在无限策略的古诺博弈模型中,博弈方的策略有无限多种,因此各个博弈方的最佳对策也有无限种,它们之间往往构成一种连续函数的关系,把这个连续函数称为反应函数。4、解释下列概念:博弈、静态博弈和动态博弈、完全信息博弈和不完全信息博 弈、完美信息动态博弈和不完美信息动态博弈 博弈是指在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与人依靠所掌握的信息,选择各自策略(行动),以实现利益最大化和风险成本最小化的过程。简单说就是人与人之间为了谋取利益而竞争。 静态博弈是指博弈中参与者同时采取行动,或者尽管参与者行动的采取有先后顺序,但后行动的人不知道先采取行动的人采取的是什么行动。 动态博弈是指参与人的行动有先后顺序,而且行动在后者可以观察到行动在先者的选择,并据此作出相应的选择。 完全信息博弈:是指每一参与者都拥有所有其他参与者的特征、策略集及得益函数等方面的准确信息的博弈。 不完全信息博弈,也称贝叶斯博弈,是指对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的信息,在这种情况下进行的博弈就是不完全信息博弈。博弈参与者对于对手的收益函数没有完全信息。 完全信息动态博弈,是指博弈中信息是完全的,即双方都掌握参与者对他参与人的战略空间和战略组合下的支付函数有完全的了解,但行动是有先后顺序的,后动者可以观察到前者的行动,了解前者行动的所有信息,而且一般都会持续一个较长时期。 不完美信息动态博弈,在动态博弈中,在不完全信息条件下,至少有一个局中人对其他某些局中人的收益不清楚。由于行动有先后顺序,后行动者可以通过观察先行动者的行为,获得有关先行动者的信息,从而证实或修正自己对先行动者的行动。 6、在公司制企业中,股东、经理、债券人、顾客、供货商等都被称为利益相关者。试分析不同

博弈论三大经典案例

经典的囚徒困境 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ?若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ?若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ?若二人都互相检举(互相“背叛”),则二人同样判监2年。 用表格概述如下: 甲沉默(合作)甲认罪(背叛) 乙沉默(合作)二人同服刑半年甲即时获释;乙服刑10年 乙认罪(背叛)甲服刑10年;乙即时获释二人同服刑2年 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ?若对方沉默、背叛会让我获释,所以会选择背叛。 ?若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 由囚徒困境可以写出类似的员工困境: 一名经理,数名员工; 前提,经理比较苛刻; 如果所有员工都听从经理吩咐,则奖金等待遇一样,不过所有人都超负荷工作 如果某人不听从吩咐,其他人听从吩咐,则此人下岗。其他人继续工作 如果所有人都不听从经理吩咐,则经理下岗 但是,由于员工之间信息是不透明的,而且,都担心别人听话自己不听话而下岗,所以,大家只能继续繁重的工作. 囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。

博弈论经典案例

博弈论经典案例: 案例一 囚徒困境 在博弈论中,含有占优战略均衡的一个著名例子是由塔克给出的“囚徒困境”(prisoner's dilemma)博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果两个犯罪嫌疑人都坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪,各被判刑8年;如果只有一个犯罪嫌疑人坦白,另一个人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。下表给出了这个博弈的支付矩阵。 囚徒困境博弈[Prisoner's dilemma] A╲B 坦白抵赖 坦白-8,-8 0,-10 抵赖-10,0 -1,-1 对A来说,尽管他不知道B作何选择,但他知道无论B选择什么,他选择“坦白”总是最优的。显然,根据对称性,B也会选择“坦白”,结果是两人都被判刑8年。但是,倘若他们都选择“抵赖”,每人只被判刑1年。在表2.2中的四种行动选择组合中,(抵赖、抵赖)是帕累托最优的,因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。不难看出,“坦白”是任一犯罪嫌疑人的占优战略,而(坦白,坦白)是一个占优战略均衡。 案例二 智猪博弈 一、经济学中的“智猪博弈”(Pigs’payoffs)这个例子讲的是: 假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时行动(去按按钮),收益比是7∶3;小猪先到槽边,收益比是6∶4。那么,在两头猪都有智慧的前提下,最终结果是小猪选择等待。

博弈论的基本概念

博弈论的基本概念 ?博弈论是研究两人或多人谋略和决策的理论。 ?博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的的学科。 ?参与者:参与者是指一个博弈中的决策主体,通常又称为参与人或局中人。 参与人的目的是通过合理悬着自己的行动,以便取得最大化的收益。参与者可以是自然人,也可以是团体。 ?信息:信息是指参与者在博弈过程中能了解和观察到的知识。信息对参与者是至关重要,每一个参与者在每一次进行决策之前必须根据观察到的其他参与者的行动和了解到的有关情况作出自己的最佳选择。完全信息是指所有参与者各自选择的行动的不同组合所决定的收益对所有参与者来说是共同知识。

?策略:策略是参与者如何对其他参与者的行动作出反应的行动规则,它规定参与者在什么时候选择什么行动。通常用s i表示参与者i的一个特定策略,用S i表示参与者i的所有可选择的策略的集合(又成为而i的策略空间)。如果n个参与者没人选择一个策略,那么s=(s1,s2,…,s n)称为一个策略组合。 ?收益:收益是在一个特定的策略组合下参与者能得到的确定的效用。通常用u i表示参与者i的收益,它是策略组合的函数。 ?均衡:均衡是所有参与者的最优策略组合,记为s*。 几个经典的博弈实例 ?例一囚徒困境两个共同作案的犯罪嫌疑人被捕,并受到指控。除非至少一人认罪,否则警方无充分证据将他们按最论刑。警方把他们隔离审讯,并对他们说明不同行动所带来的后果。如果两人都采取沉默的抗拒态度,因警方证据不足,两人将均被判为轻度犯罪入狱一个月;如果双方都坦白,根据案情两人将被判入狱六个月;如果一个招认而另一个拒不坦白,招认者因由主动认罪立功的表现将立即释放,而另一人将被判入狱九个月。

生活中的博弈论例子

生活中的博弈论有那些例子 那讲工作上的事假如你做的策划被上司偷了那你是要向更高级的领导告状还是忍受这也算一个博弈论问题你要是告状,也许能够伸冤,但也会若到上司他可能会给你下绊子但不上诉他也许会再偷,你的工作就白废了 还有物价方面假如几个店铺联合起来自然能够把东西卖的比较贵但只要其中一个降价其他店的客人就会全跑到那家去那另外几家也会被迫降价店铺联合本来是最好的赚钱方法但店铺间一般是敌对关系为防备有人订低价,引走客人所有的店铺都会尽可能低价其实我们学校门口的网吧刚上演了一出这个好戏真是有感触啊!!!!! 弈论的研究方法和其他许多利用数学工具研究社会经济现象的学科一样,都是从复杂的现象中抽象出基本的元素,对这些元素构成的数学模型进行分析,而后逐步引入对其形势产影响的其他因素,从而分析其结果。 基于不同抽象水平,形成三种博弈表述方式,标准型、扩展型和特征函数型利用这三种表述形式,可以研究形形色色的问题。因此,它被称为“社会科学的数学”从理论上讲,博弈论是研究理性的行动者相互作用的形式理论,而实际上正深入到经济学、政治学、社会学等等,被各门社会科学所应用。 1.博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自选择的行为或是策略进行选择并加以实施,并从各自取得相应结果或收益的过程,在经济学上博奕论是个非常重要的理论概念。 什么是博弈论古语有云,世事如棋。生活中每个人如同棋手,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们“出棋” 着数中理性化、逻辑化的部分,并将其系统化为一门科学。换句话说,就是研究个体如何在错综复杂的相互影响中得出最合理的策略。事实上,博弈论正是衍生于古老的游戏或曰博弈如象棋、扑克等。数学家们将具体的问题抽象化,通过建立自完备的逻辑框架、体系研究其规律及变化。这可不是件容易的事情,以最简单的二人对弈为例,稍想一下便知此中大有玄妙:若假设双方都精确地记得自己和对手的每一步棋且都是最“理性” 的棋手,甲出子的时候,为了赢棋,得仔细考虑乙的想法,而乙出子时也得考虑甲的想法,所以甲还得想到乙在想他的想法,乙当然也知道甲想到了他在想甲的想法… 面对如许重重迷雾,博弈论怎样着手分析解决问题,怎样对作为现实归纳的抽象数学问题求出最优解、从而为在理论上指导实践提供可能性呢现代博弈理论由匈牙利大数学家冯·诺伊曼于20世纪20年代开始创立,1944年他与经济学家奥斯卡·摩根斯特恩合作出版的巨著《博弈论与经济行为》,标志着现代系统博弈理论的初步形成。对于非合作、纯竞争型博弈,诺伊曼所解决的只有二人零和博弈--好比两个人下棋、或是打乒乓球,一个人赢一着则另一个人必输一着,净获利为零。在这里抽象化后的博弈问题是,已知参与者集合(两方) ,策略集合(所有棋着) ,和盈利集合(赢子输子) ,能否且如何找到一个理论上的“解”或“平衡” ,也就是对参与双方来说都最“合理” 、最优的具体策略怎样才是“合理” 应用传统决定论中的“最小最大” 准则,即博弈的每一方都假设对方的所有功略的根本目的是使自己最大程度地失利,并据此最优化自己的对策,诺伊曼从数学上证明,通过一定的线性运

相关主题