搜档网
当前位置:搜档网 › 演化博弈论简介-萧敢

演化博弈论简介-萧敢

演化博弈论简介-萧敢
演化博弈论简介-萧敢

演化博弈论简介

说明:这篇东西是我上周六在浙大思想讨论班上做演讲的讲稿和主要内容。讲完以后,叶航老师提出了很多宝贵的意见。我也正好乘这机会把没有讲或者没有讲清楚的东西梳理了一下。整理过程中还发现了了很多问题,请大家批评。

丁丁1994年有一篇重要的文章,介绍发展经济学的最新进展。他比较了诺斯(North)的制度变迁理论,罗默(Romer),卢卡斯(Lucas)等的内生增长理论,哈耶克的“自发秩序论”,重复博弈和演化博弈论等理论,这些理论的共同特点是“动态”(dynamic)。传统新古典经济学是静态的,重视均衡点,但很难进行历史的研究。正因为如此,这些新理论才显示出强大

的生命力,获得广泛运用。

我们这里讲演化博弈(evolutionary game theory),它显然有2条理论来源,一是演化理论,一是博弈论。

先来看演化理论,我首先要纠正一个常见的误解,即演化均衡是帕累托最优的,或者说最大化整个社群的福利。我们要注意到,演化均衡不等于一般均衡,等会我会给出一些严格的定义。从福利经济学第一定理可以得知,一般均衡必然是帕累托最优的,即所谓的看不见的手的含义,但是演化均衡并没有类似的定理。我们用常识来分析,如果演化均衡最大化社群的福利,那么什么是社群的福利呢?是个体的总数最大吗,是个体的多样性最多吗,抑或是个体预期存活概率最大?即使我们能为适应性(fitness)找出合适的测量方法,我们也无法保证演化是朝向个体适应性最大的方向演化。我这里用演化,避免用演进,可以减少误解。

演化理论中有两条最重要的机制。一个叫自然选择,即不是每种生物都有相同的概率在下一期存活。在这个世界上,有些生物个体(或者人)特别幸运,他们能活下去,但还有些个体就倒霉了,他们会被淘汰。我们今天都活着,可见我们的祖先都还是幸运的,他们有后代继承了他们的基因。我特别要强调自然选择,对于我们来说是被选择(be selected),我们能决定我们的行为和策略,但不能决定我们是否被选择,那是上帝的事情。严复说物竞天择,就是这个意思。

另一种机制叫突变机制(mutant),这保证了种群的变化。如果没有突变,那么这个世界上存活下来的物种就会越来越少,最后只剩下一种。对于突变机制,我也要强调它是没有方向性的,可能会提高个体的适应性,但更有可能降低个体的适应性。突变同样是上帝的选择,微观个体无能为力。

接下来,我们就可以回顾演化经济学的思想史了。我在幻灯片里给出了一长串人的名字,他们都可以看作是具有演化思想的经济学家,都是演化经济学的先驱。斯密,马克思,门格尔,马歇尔,凡勃仑,熊彼特,直到哈耶克。我尤其要强调雄彼特的贡献,他研究经济发展和经济周期,提出了著名的“创新”思想。这带有明显的动态的特征,并影响了随后的尼尔森和温特。

安德森把熊彼特以后,尼尔森-温特以前这段时间(1930-1970)比作黑暗时代(当然这仅指演化经济学而言,对于新古典经济学无疑是黄金时代呢),这段时间很少有人关心动态的演化的经济学理论。(阿尔奇安也许是个例外)

从70年代初开始,尼尔森和温特提出了一系列演化经济学模型。同时,梅纳德.史密斯在1973年提出了著名的演化稳定策略,奠定了演化经济学的基础。从此,演化经济学可以算真正诞生了。

尼尔森自称是熊彼特的忠实信徒,而温特是达尔文进化论的信徒,他们的演化理论非常鲜明地具有这些特征。计算机能够很好地模拟生态学上物种数量的演化,因而也被广泛地用于经济模型的演化模拟。尼尔森-温特的多数模型都很容易被改编成计算机模型,用现实数据进

行实证检验。大家认为他们的模型在产业组织(IO)的应用比较成功,我就以这方面的模型为例子。

尼尔森-温特给出了个体在演化过程中的几个重要特征,我把他们列在下面

1个体永远不会完美信息(局部知识或吉尔兹的地方性知识,而不是全局性知识)

2个体行为受制度(正式和非正式),规范,习俗,意识系统等条件约束

3个体(或者企业)可以模仿对手

4开发和模仿(也就是R&D)既有“积聚效应”(可以参考Becker关于“上瘾”以及孩子教育的论文)和路径依赖的效果,又与原创性科学研究相关。

5个体竞争的结果往往是非均衡的-即败者出局(被淘汰)

6个体的特征是非决定性的-这里他们是在反驳“决定论”的批评。同时,演进的结果通常是不可逆的。

7主流经济学喜欢讨论“潜在的”均衡(也就是往往达不到的,但理论上可能的均衡),而对非均衡状态的分析要远比那些均衡来的重要。

我们重点讲其中的“创新”部分。熊彼特的创新,到了尼尔森和温特那里,运用到对firm 的研究,被偷换成了R&D(更具体一些,是innovation/imitation)。创新当然不完全等同于R&D,但这样做是必要的。我们可以参考Becker的研究方法,我们脚站在工具里,把能够工具化的变量尽量工具化,也许我们只抓住了变量的很次要一部分,我们只迈出了一小步,但对这一小步我们有足够的自信心。回到R&D,我下面主要依据他们1982年那本著名的教科书Evolutionary theory of economic change。

我们根据以下知识列出计算方程

1 资本生产率是由企业的专门化知识决定的

2R&D的产物是innovation和imitation。

3R&D密度(就是R&D占总资金比例,例如微软好像是5%)由一固定规则决定。

4原创能否实现是一个柏松过程。再加上一些常识,就能写出联立方程组,用计算机来算。5创新是不连续的,有跳跃,有“高原现象”。

接着我们就可以批评他们的工作了。先是一个小问题,就是如何区分原创和模仿,两者之间的关系是怎样的(互补或互替或其他),他们也做了回应。接着是一个大问题,就是他们把R&D看作在一个搜索空间(search space)里的搜索过程。

让我先打个岔,说说经典博弈论里的共同知识(common knowledge)的事情。耶路撒冷学派的领袖奥曼(Aumann)说,博弈论的基础是一团乱麻。要理出一根阿里阿德涅线,我们要找到一个线头,这就是共同知识。共同知识就是,我知道你的策略,你知道我的策略,我知道你知道我的策略,你知道我知道你的策略...宾莫尔(Binmore)等人试图用一个自明之理来取代这个共同知识。有些事情,只要发生了,人人都应该知道(例如911事件,现在的美伊战争等)。但他们在公理化这个自明之理时,又遇到致命的阻碍。这就是所谓的第五公理和第六公理。第五公理说,我知我所知。这还算了,第六公理说,我知我所不知,这立刻遇到了哲学问题。亚里斯多德的“愈学愈无知”的故事正好拿来反驳。一个人如何能知道自己的策略空间,更如何能知道自己策略空间以外的空间?从语言学或者认识论的角度来看,这个公理更显得荒谬了。

博弈论大师在共同知识这个问题前的狼狈是可想而知的。我这里只是想类比一下,R&D真的能表示成在给定的搜索空间里搜索吗?从实践的角度,我们只能处理一维和二维的情况,丁丁说的“一切人在一切方向上的创新”,这就超出我们能够处理的范围了。我们能够在一个时点讨论多个维度(一般均衡),我们也能在时间连续情形下讨论一个维度(演化稳定-这就是尼尔森和温特他们的工作),但我们无法讨论时间连续下多个维度的情况,这超出了理性的范围,但这正是创新的特点。

说了那么多,我只是想指出,他们这派的方法论是排除个人的理性选择的。所以他们的模型可以被很好地运用到产业组织的研究中。他们的路子跟泰勒尔(Tirole ),美国的博弈论四人帮等的路子很不同。传统的经验型的产业组织研究(张伯伦,罗宾逊他们的研究,到后来贝恩那里所谓的SCP 范式)已经彻底被博弈论征服了。而尼尔森,温特他们用演进理论借尸还魂,恢复产业组织的经验研究(很显然,计算机模拟的结果可以跟实证数据对比)是很成功的。其中最微妙的与人的选择关系最密切的R&D 活动也被巧妙的模型化了。(但我们看到,把多维的创新压缩到1,2维的搜索空间里的搜索,这里面问题很大)

接着,我们可以讨论一些重要的概念了,主要是一些博弈论的概念。当然,其中最重要的概念就是演化稳定策略(ESS )。我想强调,ESS 是一种策略,而不是均衡。策略在前,均衡在后。由策略看演化,是由前往后看,由均衡看演化,是由后往前看。

我们先给出一个严格的定义,在两人对称博弈情况下(我们下面主要讨论对称的情况,不对称通常可以转换成对称的情形),存在策略σ,σσ'≠,()(0,1)εσ'∈,使得 (,(1))(,(1))u u σεσεσσεσεσ'''+->+-,那么σ就被称为演化稳定策略。

由上面的定义可以看到,博弈双方都会采用这最优的演化稳定策略。我们有两条性质如下 性质1:演化稳定策略必然是纳什均衡。

性质2:只有严格的(即唯一的)纳什均衡才能由演化稳定策略得出。

下面我介绍一个通俗的例子,表明演化稳定策略往往会不存在,所以我们有时不得不转向均衡的分析。

这个例子很简单,叫“石头-剪刀-布”博弈。石头胜剪刀,剪刀胜布,布胜石头,当双方的策略相同时,收益都为x.

很显然,这个博弈有一个混合策略纳什均衡,即用1/3的概率分别选择出石头-剪刀-布{1/3,1/3,1/3},或者说随机选择,这个策略的期望收益是1

3X 。假设这个博弈存在演化稳定策略 ,那么双方都采取这个策略,收益显然为X.由定义得,既然策略是ESS ,那么必然有X>1

3X ,我们知道这只有在X>0时才满足。

当X<0时,这个博弈不存在演化稳定策略,但显然它是存在纳什均衡的,所以我们需要另一种分析方法,叫演化稳定均衡(EES )

我把定义写在下面

X 是个非空纳什均衡策略闭集合,存在(0,1)ε'∈,X σ∈,((1))BR σεσεσ''∈-+,

0εε'<<,(1)X εσεσ'-+∈,则X 是演化稳定均衡。

我们可以证明,每个对称博弈都存在演化稳定均衡,每个演化稳定均衡是纳什均衡集的一个元素。

这样,我们就有了几个相关的工具。一个是演化稳定策略,由这个策略可以推导最后的均衡,但这个占优策略未必存在。一个是演化稳定均衡,它一定是存在的,但只是最后的结果。一个是纳什均衡,但我们知道纳什均衡往往不唯一。

接下去,我们来讨论演化策略的稳定性。我们有时候会发现ESS 虽然是占优的,但不是稳定的-这很重要,这导致我们必须引入一种“突变”(mutant )机制。

我下面举一个例子,是Robson(1990)年提出的,被称为“秘密握手”博弈。

有支付矩阵如下 (0.1)

显然,这个博弈有2个纳什均衡,分别是(d,d)和(m,m),(m,m)帕累托占优于(d,d)。因为(d,d)与(d,m),(m,d)无差异,而(m,m)优于(d,m)和(m,d),因此,只有(m,m)是演化稳定策略。

我们仔细观察这个支付矩阵,就能看出问题。随着演化,大家采用的策略最后都稳定在m 上,采用m 即合作的策略成为大家默认的规则(制度)。

这时候,就会有人想钻空子了(突变),他会想改变策略选择c 。当别人选择m 时,他就获得更高的收益。对手很快就会发现这种情况,于是也选择策略c ,但(c,c)不是纳什均衡,不稳定,最后会收敛到(d,d),我们又回到了分析的起点。

这自然是个无限递归的过程,Robson 用一种“秘密握手”的思想解决这个问题,即人们通过观察行为,把人分成2组。大家都只和潜在的朋友合作(握手),选择策略m ,而对外人采取策略d 。这种握手从支付矩阵里看不出来,是外生的。这条思路就和信息经济学接起来了。

然后,我们就可以讲最重要的复制动态了。我们还是从最著名的“鹰鸽博弈”开始讲。

这个博弈的生物学涵义是,一个社会有两种动物,一种有攻击性,叫鹰;一种没有攻击性,叫鸽。这个博弈的均衡与c,v 的数值大小密切相关。我们先假设,对于某个微观个体,物种只是由遗传(gene )决定的,即某种生物生来要么是鹰,要么是鸽,它无法采取混合策略。如果V>C ,也就是两个鹰之间竞争后的预期收益大于0,那么很显然,唯一的纳什均衡就是(H,H),演化稳定策略就是(H,H )。长此以往,整个社会最终将只剩下鹰。如果V

但我们放松前面那个假定,从宏观社群角度来看,情况就不同了。如果我们允许混合策略存在,我们可以得到一个混合策略*(,1)v v c c σ=-

这个混合策略的生物学涵义是,整个社会里有v

c 的生物是鹰,1v

c -的生物是鸽。如果鹰多

了,它会因为相互斗争而两败俱伤,从而减少数量,恢复到均衡状态。反之亦如是。

描写人口变化数量的微分方程就被称为复制动态。我们知道,人口变化一方面受上一代种群数量的影响(即著名的费雪方程),一方面受当期竞争的影响(博弈论)。这里,我们再次碰到了演化经济学的大问题,演化是基因演化还是文化演化?即个体的特性是先天遗传决定还是后天学习决定。我举个小例子吧。人类学家在欧洲发掘早期智人,发现两种骨头,一种在前,叫尼安德特人;一种在后,叫克里马隆人。对于这两种人之间的关系,人类学家提出了2种看法。我们在后期只发现克里马隆人,一种可能的解释当然是尼安德特人全都进化成了克里马隆人。另一种可能的解释是,克里马隆人和尼安德特人没有任何亲缘关系,他们只是后来居上,消灭了尼安德特人。这就分别对应于“文化演化”与“基因演化”。这两种演化思想的争论至今仍然是演化理论的核心问题。

好了,接着我们就可以讲近年来演化博弈论最重要的进展,随机稳定(SS ),这是杨(P .Y oung )和福斯特(Foster )的贡献,他们都写过重要的演化博弈论教科书。我们知道,演化稳定策略只能抵御初始的冲击,它保证这个策略比其他策略都占优。但在演化博弈过程中,发生了冲击,那么演化稳定策略就无能为力了。它不能保证必然导向估计的稳定点。而我们有了随机稳定策略以后,情况就好得多。我们只要保证每次转移矩阵不变,不管中间发生了多少次冲击,整个博弈都能向均衡点收敛。

随机稳定策略被广泛运用于制度分析中,因为制度变迁的过程正是一个不断冲击,不断相互作用的过程。下面,我们用一个协调博弈的例子来说明,这个例子来自于卡多里等,被称为KMR 模型(Kandori,Mailath,Rob )。先简单解释一下协调博弈,这类似于围城战。例如史可法被清兵把扬州城团团包围了。他派人杀出城去求来南明救兵。但因为敌人强大,一定要里应外合才能杀退敌军,任何一方单独行动都会遭至失败。

当然,这里面有一个信号传递的问题,即协调的过程,而这又和共同知识(common knowledge )有关。城外的人必须完全知道城内人的策略空间,城内的人也是,相互嵌逃,无穷递归。而我们用自明之理代替共同知识,又会遇到认识论的问题,上面已经说过了。 我们不看信号传递,就简单地看这个支付矩阵。

我们假设其中a>c,b>d,但是a-c

我们假设整个社会人口1()t t z b z +=,{1,...,1}z Z N ∈=-。其中()b z z >当且仅当(,)(,)u A z u B z >,1

(,)11z N z

u A z a b N N --=+--,1

(,)11z

N z u B z a b N N --=+--。

于是整个社会人口的变动1()t t t t z b z x y +=+-

这其中~(())t t x N b z ε-,~(())t t y b z ε,于是我们就得到Z 空间上的一个马尔可夫链()p ε

我们可以证明马尔可夫链()p ε有唯一的均衡()με,满足()()()P μεεμε=,可以称之为不变均衡。

这个博弈策略,它有稳定性质任何()p Z ∈?,lim ()()t

t P p εμε→∞→ 最后,我们给出一个性质但不加证明了,当博弈时间足够长(即N 足够大时),风险占优策略才是唯一的随机稳定策略。

我不应该再讲技术性的东西了,我们步入下一个大问题。我用一个大家最熟悉的例子来运用一下复制动态,同时引向第三个关键字“互惠”(reciprocity )。金迪斯2001年那篇“互惠性”的论文,被丁丁称为“社会学第一定理”。我知道大家都很熟悉,就只讲一下主要思想,在金迪斯(Gintis )文章里,他假设有两种人,一种利他的人(雷锋?),一种自私的经济人。在每一个生命周期里,自私的人一定能活下去,但利他的人会以小于1的某概率活下去。(注意,这里金迪斯没把牺牲自己和造福大家必然地联系起来,这其中的缺陷值得我们反思。叶老师提出的合作效用就是要弥补这个缺陷)。而人口会以固定的速度繁殖增长,金迪斯假设利他人与利他人的孩子,必然是利他的。自私人与自私人的孩子必然是自私的。利他人与自私人的孩子以0.5的概率分别是利他和自私的,这里只有显性遗传。这就是最典型的复制动态情形,金迪斯把这称为纵向动态。如果只有纵向动态,那么最后利他的人必然濒临灭绝。这里,金迪斯又引入一个微分方程,一般文献称为Mutant (突变),金迪斯称为水平遗传-即教育或教化。一部分自私的人会良心发现,变成利他。一部分利他的人受不住诱惑,变成自私的人。这样,随着初始参数的变动,可以得到各种结果。

从这里,我们步入最后一个大问题,那就是“互惠”。这条路非常复杂,因为研究目标是活生生的人。我们必须追溯到道金斯,威尔森,一直到现在的Boyd,Richerson,Gintis,Fehr 等。叶老师写过很多这方面的文章,我也有一篇综述,大家可以参考。我想指出的是,这个领域介于生物学,社会学(包括人类学)与经济学之间。从现在的发展程度来看,所谓的行为学是解决这一方向问题的最好工具。我们归根结底要探究个人的动机(motivation ),这又好像是心理学的事情了。心理学是个模糊的学科,行为主义对它有着深远的影响。社会学中也有一个行为主义学派,代表人物有霍曼斯(Homans ),布劳(Blow ),大家应该都很熟悉。

另一个我想强调的就是,实验经济学对这条互惠思路的研究提供了很多支持。 “最后通牒”博弈已经家喻户晓了。与之相关的实验还有,公共品博弈验,效率工资博弈等等。

在给出那么多理论以后,我想从生物学的角度提出9个问题(是泽尔腾在博弈论手册中提出的),每一个问题自然都与演化博弈理论相关,但都没有必然的答案,仅供大家思考。

问题一:为什么动物竞争时(例如共同猎取一猎物)有时遵循一定的惯例(例如先到先得,例如在谁的地盘上就归谁),而不都以暴力(身体上的攻击)解决。这种惯例在什么情况下产生?

问题二:冲突是怎么解决的?动物在什么情况下不采用暴力解决冲突?

问题三:当个体与整体进行博弈(非对称)时,冲突的成本收益是否能够计算? 问题四:动物在什么时候停止有成本的攻击?

问题五:动物如何通过行为来交流?(发送信号)

问题六:基因在动物合作行为中起到何种作用?

问题七:动物合作行为是后天学习的吗?

问题八:动物合作行为是因为存在共同利益吗?

问题九:组织演化与重复博弈的逻辑之间的关系是什么?

最后一个问题也是演化博弈论最本质的问题,它牵涉到演化博弈的两种思想来源。演化理论从生物进化论而来,而重复博弈就是学习的过程,这两种理论的融合必然是演化博弈论发展的方向。

博弈论知识点总结

博弈论知识总结 博弈论概述: 1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 博弈论研究的假设: 1、 决策主体是理性的,最大化自己的收益。 2、 完全理性是共同知识 3、 每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念 与预期 2、和博弈有关的变量: 博弈参与人:博弈中选择行动以最大化自己受益的决策主体。 行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。 信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息) 等的信息。 完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息。 不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。 支付:决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。 从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别: 3、博弈论与传统决策的区别: 1、 传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己 效用,研究工具是无差异曲线。可表示为:maxU(P ,I),其中P 为市场价格,I 为消费者可支配收入。 2、 其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定 下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式:战略式博弈和扩展式博弈 战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。 战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合 : 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn). 扩展式博弈:是博弈问题的一种规范性描述。 与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。 包含要素: 1、 参与人集合 {1,2,...,}n Γ={1,2,...,}n Γ=11(,...,,...,)n i i n i s s s s ==∏

博弈论入门进阶书籍大全——如何成为智谋博弈大师

博弈论入门进阶书籍大全——如何成为智谋博弈大师 选书如选老师,因此选择书籍是一件十分重要的事。在此,向给大家推荐与博弈论相关书籍,让你少走弯路,成为智谋博弈大师! 博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。 入门书籍: 《妙趣横生博弈论》 21世纪的经典博弈书——《妙趣横生博弈论》。2005年诺贝尔经济学奖获得者托马斯·谢林“一生中最不能错过的一本书”——“西方孙子兵法”——《妙趣横生博弈论》。该书由阿维纳什K.迪克西特和巴里J.奈尔伯夫合著。核心思想:在本性上,人们都倾向于以自我为中心,只关注自己的理解和自身的需要。但博弈的艺术要求,不要以自我为中心,要理解他人的立场、观念以及看重什么,并运用这种理解来指导行动。

《身边的博弈》 《身边的博弈》用浅显易懂的语言、近百个故事讲述了博弈论的基本原理及其在现实世界的运用,使你通过快乐地学习生活中无时不在的博弈掌握竞争的技巧。 《博弈论的诡计》

博弈论的目的在于巧妙的策略,而不是解法。学习博弈论的目的,不是为了享受博弈分析的过程,而在于赢得更好的结局。博弈的思想既然来自现实生活,它就可以高度抽象化地用数学工具来表述,也可以用日常事例来说明,并运用到生活中去。博弈时时存在,它就在你的身边。《博弈论的诡计》就是试图通过日常生活中常见的例子,来介绍博弈论的基本思想及运用,并且寻求用种智慧来指导生活决策的方法。阅读本书,我们除了了解到令人震撼的社会真实轨迹之外,还可以学到最合适的为人处世方法。 《太极博弈原理》

博弈论知识点总结

博弈论知识点总结

博弈论知识总结 博弈论概述: 1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 博弈论研究的假设: 1、决策主体是理性的,最大化自己 的收益。 2、完全理性是共同知识 3、每个参与人被假定为可以对所处 环境以及其他参与者的行为形成正确的 信念与预期 2、和博弈有关的变量: 博弈参与人:博弈中选择行动以最大化自己受益的决策主体。 行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。 信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完 全信息)等的信息。

1、

2、 既定下,消费者效用只依赖于自己 的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式:战略式博弈和扩展式博弈 战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。 战略式博弈是一种假设每个参与人仅 选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合 : 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn). 扩展式博弈:是博弈问题的一种规范性描述。 与战略式博弈侧重博弈结果的描述相 比,扩展式博弈更注重对参与人在博弈过程 {1,2,...,} n Γ=11 (,...,,...,) n i i n i s s s s ==∏

博弈论

2.2.1 博弈论的定义 现代经济学的最新发展有一个特别引人注目的特点,那就是博弈论在经济学中越来越受到重视。博弈论,又称为对策论,它是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。也就是说,当一个主体,好比说一个人或一个企业的选择受到其他人、其他企业选择的影响,而且反过来影响到其他人、其他企业选择时的决策问题和均衡问题①。简单地说,就是研究决策主体的行为在发生直接相互作用时,他们如何进行决策,以及这种决策的均衡问题。1944 年冯·诺依曼和摩根斯特恩(Morgenstern)合作出版了《博弈论与经济行为》(The Theory of Games and Economic Behavior),开始将博弈论引入经济学,成为现代经济博弈论研究的开端。20 世纪50 年代纳什(John F. Nash)、塔克(Tucker)等人的研究,奠定了现代博弈论的基石。在其后的几十年里,许多经济学家致力于博弈论的研究,1965 年泽尔腾(Reinhard Selten)将纳什均衡的概念引入了动态分析;1967-1968 年,海萨尼(John C. Harsanyi)把不完全信息分析引入博弈论的研究;1982 年克瑞普斯(David M. Kreps)和威尔逊(RobertWilson)分析了动态不完全信息条件下的博弈问题。1994 年诺贝尔经济学奖授予了纳什、泽尔腾和海萨尼三位博弈论专家,此后在2001 年诺贝尔经济学奖同样授予了三位博弈论的专家②。博弈论是一种关于行为主体策略相互作用的理论,它已形成了一套完整的理论体系和方法论体系。它具有基本假设的合理性、研究对象的普遍性、研究结论的真实性、方法论的实证性等特点。正是因为这些特点,博弈论的产生和发展引发了一场深刻的经济学革命,使得现代经济学从方法论,到概念和分析的方法体系,都发生了很大的变化。正如克瑞普斯(Kreps)在《博弈论与经济模型》一书中指出“在过去一二十年中,经济学在方法论,以及语言、概念等等方面,经历了一场温和的革命,非合作博弈已经成为范式的中心……在经济学或者与经济学原理相关的金融、会计、营销和政治科学等学科中,现在人们已经很难找到不①懂纳什均衡能够‘消化’近代文献的领域。” 张维迎:《博弈论与信息经济学》,上海人民出版社2004 年版,第3 页。 ②2001 年诺贝尔经济学奖授予了在不对称信息市场理论方面做出杰出贡献的三位博弈论专家,他们是美国 加利福尼亚大学伯克利分校的阿克诺夫(GorgeAkerlof)教授、斯坦福大学的斯宾塞(A. M. Spence)教授 和哥伦比亚大学的斯蒂格利茨(J. Stiglitz)教授。 在博弈论分析中,一定场合下的每个博弈者在决定采取何种行动时都策略 地、有目的地行事,他既要考虑其他博弈者对自己决策行为的影响,又要考虑自 己的决策对其他博弈者决策的可能影响,并在寻求自身效益最大化的前提下,来 确定自己的决策。一个博弈所包括的要素有:参与人、信息、策略、行动的次序、 收益、结果。 1、参与人:参与人是博弈的决策主体,他们的目的是通过选择行动(或策 略)以最大化自己的支付(效用)水平。参与人可以是自然人,也可以是各种社 会组织,如企业、政府、社团等。 2、信息:信息是参与人有关博弈的知识,特别是有关“自然 ① ”的选择、其 他参与人的特征和行动的知识。信息对于博弈参与者的意义和作用至关重要,掌 握信息的多少将直接影响到决策的准确性,从而关系到整个博弈的成败。 3、策略:策略是指在博弈的每一环上,参与者的行事规则,即按什么规则 选择行动。在不同的博弈中可供博弈方选择的策略或行动很不相同。即使在同一 博弈中,不同博弈方的可选策略或行为也常常不同,有时只有有限的几种,甚至

演化博弈论发展

演化博弈论发展 理论部分应用部分 解(均衡)概念适应机制经济学社会学…制度学生物学 ESS NSS … REE 无理性(自然选择)部分理性(学习) (在不同情形下定义及性质不同) 复制动态路径学习模仿信念学习 国外部分应用研究: [1]Basu(1995)研究了公民规范和演化之间的关系 [2]Friedman & Fung(1996)以日本和美国的企业组织模式为背景,用演化博弈论分 析了在无贸易和有贸易的情况下企业组织模式的演化 [3]Bester & Guth(1998)用演化博弈论研究了人类在经济活动中利他行为的存在性 及其演化稳定性 [4]Dufwenbery & Guth(1999)在双寡头垄断竞争的情形下比较了间接演化法和策略代 理方法 [5]Guttman(2000)用演化博弈论研究了互惠主体在有机会主义存在的群体中是否能 够存活的问题 [6]青木昌彦(2001)从认知的角度提出了一个关于演化博弈论的主观博弈模型 [7]Haruvy & Prasad (2001)运用演化博弈论研究了在具有网络外部性的条件下免费软 件的最优价格和质量 [8]Kosfeld(2002)建立了德国超市购物时间反常的演化博弈模型 [9]Nyborg & Rege (2003)用演化博弈理论研究了顾忌别人感受的吸烟行为的社会规范 的形成 [10]Jasmina & John (2004)研究了不同的学习规则在公共物品博弈中仿制人类行为时 谁表现的更好的问题

[11]Daniel,Arce & Todd(2005)研究了四种不同类型的囚徒困境博弈,指出要达成合作所需的演化和信息要求 [12]Josef Hofbauera & William H. Sandholmb(2007)讨论了具有随机扰动得益的演化博弈问题并将其应用于种群博弈问题的研究 国内相关研究曾涉及的问题: 土地制度变迁的演化博弈分析;电子商务中企业行为分析;企业会计信息披露博弈;金融体制改革风险研究;农民工权益维护分析;信息安全问题研究;营销合作系统中的竞争与合作;知识链组织间知识共享的研究;经济组织多样性研究;“以市场换技术”的演化博弈分析;新型农村资金合作体系的构建分析;零售业业态创新研究;区域经济协调发展研究(改革&保守);水污染控制系统;电力市场竞价分析;….. 博弈情形的具体分类: 有限群体/无限群体;连续时间/离散时间;同质/异质;双人/多人;对称/非对称;有限记忆/无限记忆;各种不同学习方式;各种噪音;… 部分演化博弈论研究者的主要贡献: 国外近五年来相关文献研究内容:

博弈论基础

博弈论 博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。参见:行为生态学(behavioral ecology)。 约翰·冯·诺依曼 博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。博弈论思想古已有之,中国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论著作。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。 博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。 近代对于博弈论的研究,开始于策墨洛(Zermelo),波雷尔(Borel)及冯·诺伊曼(von Neumann)。 1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。 1950~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的 策墨洛(Zermelo) 基础。纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出

演化博弈论简介

演化博弈论简介 说明:这篇东西是我上周六在浙大思想讨论班上做演讲的讲稿和主要内容。讲完以后,叶航老师提出了很多宝贵的意见。我也正好乘这机会把没有讲或者没有讲清楚的东西梳理了一下。整理过程中还发现了了很多问题,请大家批评。 丁丁1994年有一篇重要的文章,介绍发展经济学的最新进展。他比较了诺斯(North)的制度变迁理论,罗默(Romer),卢卡斯(Lucas)等的内生增长理论,哈耶克的“自发秩序论”,重复博弈和演化博弈论等理论,这些理论的共同特点是“动态”(dynamic)。传统新古典经济学是静态的,重视均衡点,但很难进行历史的研究。正因为如此,这些新理论才显示出强大 的生命力,获得广泛运用。 我们这里讲演化博弈(evolutionary game theory),它显然有2条理论来源,一是演化理论,一是博弈论。 先来看演化理论,我首先要纠正一个常见的误解,即演化均衡是帕累托最优的,或者说最大化整个社群的福利。我们要注意到,演化均衡不等于一般均衡,等会我会给出一些严格的定义。从福利经济学第一定理可以得知,一般均衡必然是帕累托最优的,即所谓的看不见的手的含义,但是演化均衡并没有类似的定理。我们用常识来分析,如果演化均衡最大化社群的福利,那么什么是社群的福利呢?是个体的总数最大吗,是个体的多样性最多吗,抑或是个体预期存活概率最大?即使我们能为适应性(fitness)找出合适的测量方法,我们也无法保证演化是朝向个体适应性最大的方向演化。我这里用演化,避免用演进,可以减少误解。 演化理论中有两条最重要的机制。一个叫自然选择,即不是每种生物都有相同的概率在下一期存活。在这个世界上,有些生物个体(或者人)特别幸运,他们能活下去,但还有些个体就倒霉了,他们会被淘汰。我们今天都活着,可见我们的祖先都还是幸运的,他们有后代继承了他们的基因。我特别要强调自然选择,对于我们来说是被选择(be selected),我们能决定我们的行为和策略,但不能决定我们是否被选择,那是上帝的事情。严复说物竞天择,就是这个意思。 另一种机制叫突变机制(mutant),这保证了种群的变化。如果没有突变,那么这个世界上存活下来的物种就会越来越少,最后只剩下一种。对于突变机制,我也要强调它是没有方向性的,可能会提高个体的适应性,但更有可能降低个体的适应性。突变同样是上帝的选择,微观个体无能为力。 接下来,我们就可以回顾演化经济学的思想史了。我在幻灯片里给出了一长串人的名字,他们都可以看作是具有演化思想的经济学家,都是演化经济学的先驱。斯密,马克思,门格尔,马歇尔,凡勃仑,熊彼特,直到哈耶克。我尤其要强调雄彼特的贡献,他研究经济发展和经济周期,提出了著名的“创新”思想。这带有明显的动态的特征,并影响了随后的尼尔森和温特。 安德森把熊彼特以后,尼尔森-温特以前这段时间(1930-1970)比作黑暗时代(当然这仅指演化经济学而言,对于新古典经济学无疑是黄金时代呢),这段时间很少有人关心动态的演化的经济学理论。(阿尔奇安也许是个例外) 从70年代初开始,尼尔森和温特提出了一系列演化经济学模型。同时,梅纳德.史密斯在1973年提出了著名的演化稳定策略,奠定了演化经济学的基础。从此,演化经济学可以算真正诞生了。 尼尔森自称是熊彼特的忠实信徒,而温特是达尔文进化论的信徒,他们的演化理论非常鲜明地具有这些特征。计算机能够很好地模拟生态学上物种数量的演化,因而也被广泛地用于经济模型的演化模拟。尼尔森-温特的多数模型都很容易被改编成计算机模型,用现实数据进

《博弈与信息—博弈论概论》odd12

ODD Answers to Odd-Numbered Problems,4th Edition of Games and Information, Rasmusen PROBLEMS FOR CHAPTER12:Bargaining .26March2005.11November2005.Erasmuse@https://www.sodocs.net/doc/ff15930889.html,.https://www.sodocs.net/doc/ff15930889.html,. This appendix contains answers to the odd-numbered problems in the fourth edition of Games and Information by Eric Rasmusen,which I am working on now and perhaps will come out in2006.The answers to the even-numbered problems are available to instructors or self-studiers on request to me at Erasmuse@https://www.sodocs.net/doc/ff15930889.html,. Other books which contain exercises with answers include Bierman&Fernandez (1993),Binmore(1992),Fudenberg&Tirole(1991a),J.Hirshleifer&Riley(1992),Moulin (1986),and Gintis(2000).I must ask pardon of any authors from whom I have borrowed without attribution in the problems below;these are the descendants of problems that I wrote for teaching without careful attention to my sources.

演化博弈论小结

演化博弈论和学习行为的小结 1.RD 模型 ()[()()]()s s x u x u x F s =-= 该模型的来源由Van Damme(1991)的基因复制动态过程的非代际交叠模型和Binmore(1992), Samue(1997)的基因复制动态过程的代际交叠模型分别得出。 2.ESS 的概念 定义:①(,(1))(,(1))u x x y u y x y εεεε-+>-+ ②(1)(,)(,)(1)(,)(,)u x x u x y u y x u y y εεεε-+>-+ ③(,)(,)u x x u x y >或者如果(,)(,)u x x u x y =那么有 EGT 其他引申出的均衡、定理等 ESS 概念 学习模型 模仿 信念学习 路径学习 RD 模型

(,)(,)u x y u y y > PS:NSS 就是在ESS 的定义中将大于号变为大于等于号。 3.其他引申出的一些均衡、均衡之间的关系以及一些定理 3.1 ①EE : 是演化动态过程的任一渐进稳定不动点。其判定方法可以如下: ()0F s =;()/0dF s ds <。 ②ES : (对称二人博弈中)如果x *是X 的子集,且满足条件: a 、x *中每个元素都是一个NSS b 、x X *∈,(,)(,)u x x u y x =且(,)(,)u x y u y y =,则有y X *∈。 ③REE 对称策略(x,x )是REE 充分必要条件是存在某个 ε∈(0,1),使如果x x '≠且 (0,)εε∈,有((1)x B R x x εε ''?+- ④EES x X '∈是EES 的充分必要条件是, 它是最小的非空子集使得:

博弈论 武警工程学院 考试题

第1部分《信息经济学》课程考试内容 1.Neumann-Mogenstern效用函数 参考资料:高山晟ch5、Geoffrey ch2 ?期望效用函数 ?Neumann-Morgenstern公理(简称N-M 公理) ?对风险的态度 ?风险的度量(绝对风险厌恶的Arror-Pratt系数) 2.完全信息静态博弈 参考资料:张维迎ch1.1,Gibbons ch1.1 ?本章要求掌握内容 ?博弈论基本概念 ?博弈的战略式表述 ?理解Nash均衡 ?占优战略均衡 ?重复剔除劣战略的占优均衡 ?混合战略Nash均衡(概念与求解)(Gibbons1.3、zwy1.4) ?Cournot双头垄断模型 ?Hotelling价格竞争模型(zwy1.3-2) ?公共地悲剧(Gibbons1.2.D、zwy1.3-3) ?本章选读文献 3.完全信息动态博弈 ?完全信息动态博弈的扩展式表述(Gibbons2.4.A、zwy2.1) ?子博弈精练Nash均衡(Gibbons2.4.B、zwy2.3-1) ?求解完全信息动态博弈的逆向归纳法(Gibbons2.1.A、zwy2.3-2) ?有限阶段重复博弈(Gibbons2.3.A) ?无限阶段重复博弈(理解触发战略(严酷战略)、无名氏定理(Friedman定理))(Gibbons2.3.B、zwy2.5一二节) ?序贯谈判(讨价还价)模型(Gibbons2.1.D)

·2· ?Cournot双头垄断模型(Gibbons)(Gibbons2.1.B) ?有工会企业的工资与就业(Gibbons2.1.C) ?工作竞赛模型(Gibbons2.2.D) ?Gournot双头垄断下的串谋(Gibbons2.3.C) ?效率工资(Gibbons2.3.D) 4.不完全信息静态博弈 ?不完全信息静态博弈的标准式表述(Gibbons3.1.B) ?贝叶斯Nash均衡的定义(Gibbons3.1.C) ?非对称信息下的Gournot模型(Gibbons3.1.A) ?一级密封价格拍卖(Gibbons3.2.B) ?双向拍卖(Gibbons3.2.C) 5.不完全信息的动态博弈 ?精练贝叶斯Nash均衡(Gibbons4.1、zwy4.1) ?信号传递(理解三种均衡形式并会求解)(Gibbons4.2.A、zwy4.1)?Spence就业市场信号模型(Gibbons4.2.B) ?精练贝叶斯均衡的再精练(结合市场就业模型)(Gibbons4.4)6.信息经济学基本模型 ?模型描述(Stadler2.2) ?对称信息合约下的最优支付机制(Stadler2.3.1) ?对称信息合约下的最优努力水平(Stalder2.3.2) 7.道德风险问题 ?不对称信息下的道德风险模型构建(Stalder3.2) ?两种努力水平下的代理人选择(Stalder3.3) ?简单的连续努力水平下代理人选择(Stalder) ?委托-代理模型的一个例子(zwy5.5) 8.复杂的委托代理理论与模型 ?多阶段博弈动态模型 ?声誉模型(zwy6.1-1) ?棘轮效应(zwy6.1-2) ?效率工资下的监督问题(要求掌握)(zwy6.4-1) ?激励工资下的监督问题(要求掌握)(zwy6.4-2)

演化博弈论

演化博弈论 演化博弈论(evolutionary stable strategy)整合了理性经济学与演化生物学的思想,不再将人模型化为超级理性的博弈方,认为人类通常是通过试错的方法达到博弈均衡的,与生物演化具有共性,所选择的均衡是达到均衡的均衡过程的函数,因而历史、制度因素以及均衡过程的某些细节均会对博弈的多重均衡的选择产生影响。在理论应符合现实意义上,该理论对于生物学以及各种社会科学尤其是经济学,均大有用场。 演化博弈理论最早源于Fisher,Hamilton,Tfive~等遗传生态学家对动物和植物的冲突与合作行为的博弈分析,他们研究发现动植物演化结果在多数情况下都可以在不依赖任何理性假设的前提下用博弈论方法来解释。但直到Smith and Price(1973)在他们发表的创造性论文中首次提出演化稳定策略(evolutionary stable strategy)概念以后,才标志着演化博弈理论的正式诞生。生态学家Taylor and Jonker(1978)在考察生态演化现象时首次提出了演化博弈理论的基本动态概念——模仿者动态(replicator dy—namic),这是演化博弈理论的又一次突破性发展。模仿者动态与演化稳定策略(RD&ESS)一起构成了演化博弈理论最核心的一对基本概念,它们分别表征演化博弈的稳定状态和向这种稳定状态的动态收敛过程,ESS概念的拓展和动态化构成了演化博弈论发展的主要内容。 编辑本段主要应用领域 演化证券学:演化证券学是运用生物进化原理系统阐释股市运行机理的新兴交叉学科,是证券投资研究的一个具有生命力和丰富内涵的新领域。与现代金融学的“理性人”、“有效市场”相关假设不同,演化证券学重视对“生物本能”和“竞争与适应”的研究,强调人性和市场环境在股市演化中的重要地位,是揭示股市生存法则最有潜力的前沿科学。其开山之作《股市真面目》颠覆了股市运行机理的传

新经济增长理论的演化解说

新经济增长理论的演化解说3 王立宏 (东北财经大学经济学院,辽宁大连116025) 摘要:新经济增长理论提出了许多经济增长模型,然而这些模型都忽视了制度演进与技术进步。制度是不断自发演进的,在制度的演进中可能存在着无效的制度并影响着技术进步与经济增长。技术进步是企业为寻找获利机会不断进行搜寻的结果,在这个过程中,企业通过不断地学习与模仿来获得新的知识与技能,由于知识的不断积累,其结果是知识产生知识,并推动了新技术的创生。因此,经济增长的过程就是市场制度和技术的共同演进的过程。 关键词:新经济增长理论;演化解说;自发秩序;技术进步 中图分类号:F06111 文献标识码:A 文章编号:1002-3291(2007)01-0117-06 一、对传统经济增长理论的回顾与评价 20世纪60年代以来,主流经济学提出了以“内生技术变化”为经济增长动力源的新经济增长理论,其代表人物有阿罗、宇泽弘文、罗默等人。新增长理论强调的是经济增长不是外部力量的结果,而是经济体系内部的因素决定的。1962年,在阿罗模型中,知识水平本身作为一个生产要素,具有递增的边际生产力,在知识水平不变的前提下,社会经济整体中的每一个厂商具有规模不变收益,劳动力和资本投入与产出的投入是同幅度增加的。然而,在扩大资本投入的同时,知识水平也随之变化,因而作为一个整体,经济就具有递增收益,而且由于知识是公共的,所以收益递增是外在于厂商的〔1〕(P155-173)。然而,进一步推动技术内生化的是宇泽弘文,他在1965年的《经济增长总量模式中的最优技术变化》一文中,运用两部门模型结构阐释了一个人力资本和物质资本都能生产的最优增长模型,他把技术变化源于专门生产思想的教育部门。假定社会把一定的资源配置到教育部门,则会产生新知识,而新知识会提高生产率并被其他部门零成本获取,进而提高生产部门的产出。宇泽弘文的这种尝试成为后来的卢卡斯人力资本积累模式以及罗默内生技术变化模式的重要的基础。在1986年,罗默在《收益递增与长期增长》一文中,提出了一个具有内生技术变化的竞争性均衡的长期增长模式,在罗默模式中,生产性投入的专业化知识(知识资本)的积累及其外溢效应是长期增长的决定性因素,它不但自身具有递增的边际生产力,而且能使资本和劳动等其他要素也产生递增收益,进而使整个经济的规模收益递增,收益递增保证了长期增长。 内生经济增长理论的人力资本理论解说。其代表人物主要有舒尔茨、卢卡斯、贝克尔等人。舒尔茨在《制度和人的经济价值的不断增长》一文中,把人力资本积累、人的经济价值上升到与制度联系起来,人的价值不断增长,这对于制度提出了新的要求,由于存在着制度对于这种新的要求的滞后性,就会导致一系列的社会问题,经济增长应该解决这些问题〔2〕(P253-263)。他的主要观点是制度是内生的,经济增长与制度创新是互为作用的,但是他没有进一步形成分析的框架。贝克尔、墨菲等在 2007年1月 第35卷 第1期 辽宁大学学报(哲学社会科学版) J ournal of L iaoning Universit y(Philosop hy and S ocial Sciences) Jan.2007 Vol.35 No.1 3收稿日期:2006-06-19 作者简介:王立宏(1965—),男,辽宁昌图人,西方经济学专业博士研究生,东北财经大学经济学院副教授。主要从事劳动经济学和制度经济学研究。 基金项目:本文是国家社会科学基金项目的前期成果(05BSH021)。

演化博弈理论

演化博弈理论综述 班级:国贸112班 姓名:赵焌茗 学号:2011095012

第一部分概述 演化博弈理论至少自Lewontin(1960)用于解释生态现象就已经产生了,并被广泛应用于生态学、社会学及经济学等领域来研究群体行为的演化过程及其结果。进化博弈理论从有限理性的个体出发,以群体为研究对象,认为现实中个体并不是行为最优化者,个体的决策是通过个体之间模仿、学习和突变等动态过程来实现的。进化博弈理论强调系统达到均衡的动态调整过程,认为系统的均衡是达到均衡过程的函数,也就说均衡依赖于达到均衡的路径。动态概念在进化博弈理论中占有相当重要的地位,许多博弈理论家对群体行为调整过程进行了广泛而深入的研究,根据他们考虑问题的角度不同而提出了不同的动态模型,如Weibull(1995) 提出的模仿动态(Imitation Dynamics)模型;B?rgers and Sarin(1995,1997)等提出的强化动态1(Reinforcement Dynamics)模型等等。但到目前为止,在进化博弈理论中应用最多的还是由Taylor and Jonke r(1978)提出的模仿者动态(Replicator Dynamics)模型。模仿者动态是进化博弈理论的基本动态,它能较好地描绘出有限理性个体的群体行为变化趋势,由之得出的结论能够比较准确地预测个体的群体行为,因而倍受博弈论理论家们的重视。本文集中介绍确定性模仿者动态概念、模型及其与经典博弈动态概念的区别。 在传统博弈理论中,常常假定参与人是完全理性的,且参与人在完全信息条件下进行的,但在现实的经济生活中的参与人来讲,参与人的完全理性与完全信息的条件是很难实现的。在企业的合作竞争中,参与人之间是有差别的,经济环境与博弈问题本身的复杂性所导致的信息不完全和参与人的有限理性问题是显而易见的。 与传统博弈理论不同,演化博弈理论并不要求参与人是完全理性的,也不要求完全信息的条件。有限理性这一概念最早是由西蒙(Simon.H.A.)在研究决策问题时提出的,它是指人的行为只能是“意欲合理,但只能有限达到”。威廉姆森在研究影响交易费用的因素时,对有限理性的问题进行了归纳总结人的有限理性是由两方面的原因引起的:一方面是由于人的感知认识能力限制,它包括个人在获取、储存、追溯和使用信息的过程中不可能做到准确无误;人的有限理性的另一方面则是来自语言上的限制,因为个人在以别人能够理解的方式通过语句、数字或图表来表达自己的知识或感情时是有限制的(这或许是因为他们没有掌握到所必需的词汇,或许是因为这些词汇还不存在),不管多么努力,人们都将发现,语言上的限制会使他们在行动中感到挫折。从这两个方面而言,完全理性的人根本就不可能存在。 演化博弈论是把博弈理论分析和动态演化过程分析结合起来的一种理论。在方法论上,它不同于博弈论将重点放在静态均衡和比较静态均衡上,强调的是一种动态的均衡。演化博弈理论源于生物进化论,它曾相当成功地解释了生物进化过程中的某些现象。如今,经济学家们运用演化博弈论分析社会习惯、规范、制度或体制形成的影响因素以及解释其形成过程,也取得了令人瞩目的成绩。演化 1其实质就是个体与群体进行博弈,即个体通过对群体选择不同策略的个体数的观察来确定自己的选择。1Selten(1980)通过对个体引入角色限制,首次考察了非对称博弈中的均衡问题,并证明了“在非对称博弈中进化稳定均衡等价于严格纳什均衡”。

博弈论知识点总结

博弈论知识总结 博弈论概述: 1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 博弈论研究的假设: 1、 决策主体是理性的,最大化自己的收益。 2、 完全理性是共同知识 3、 每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念 与预期 2、和博弈有关的变量: 博弈参与人:博弈中选择行动以最大化自己受益的决策主体。 行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。 信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息) 等的信息。 完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息。 不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。 支付:决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。 从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别: 3、博弈论与传统决策的区别: 1、 传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己 效用,研究工具是无差异曲线。可表示为:maxU(P ,I),其中P 为市场价格,I 为消费者可支配收入。 2、 其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定 下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式:战略式博弈和扩展式博弈 战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。 战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合 : 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn). 扩展式博弈:是博弈问题的一种规范性描述。 与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。 包含要素: 1、 参与人集合 {1,2,...,}n Γ={1,2,...,}n Γ=11 (,...,,...,)n i i n i s s s s ==∏

博弈论简明教材

博弈论 第一节博弈问题概述 一、博弈的基本概念 博弈论是近年经济学中发展得很快的一个分支。博弈论(game theory)是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题的。换句话说,博弈论研究当某一经济主体的决策既受到其它经济主体决策的影响,而且该经济主体的相应决策又反过来影响到其它经济主体时的决策问题和均衡问题。 在前面几讲中,除了寡头市场外,消费者的效用或厂商的利润都只依赖于他自己的选择,而与其他人的选择无关。在这里,经济作为一个整体,各个经济主体的选择是相互影响的。但对于单个的消费者或厂商来说,所有其它经济主体的行为都被包括在一个参数里。这个参数就是价格。除此以外,经济主体在决策时,面临的似乎是一个非人格化的东西。经济主体既不需要考虑他人的选择对自己选择的影响,也何必需要考虑自己的选择对他人的影响。而在本讲所介绍的博弈论中,消费者的效用或厂商的利润不仅依赖于自己的选择,而且依赖于具体的某一个或某一些其它经济主体的选择。 在经济学中,博弈论通常是放在寡头市场的分析中,因为在寡头市场上,某一寡头企业在决策时,不得不考虑其他寡头企业的反应。但事实上,博弈行为是广泛存在的。 博弈分析的目的是使用博弈规则决定均衡。 博弈论的基本概念包括:参与人、行动、战略、博弈规则、信息、报偿、均衡。 参与人是指博弈中选择行动以最大化自身利益(效用、利润等)的决策主体(如个人、厂商、国家)。 行动是指参与人作的决策。 战略是指参与人选择行动的规则,它告诉参与人在什么情况下选择什么行动。 例如,“人不犯我、我不犯人;人若犯我、我必犯人”是一种战略。这里,“犯”与“不犯”是两种不同的行动。战略规定了什么时候选择“犯”,什么时候选择“不犯”。 博弈规则是指参与人共同接受的不同情况下的最优战略。信息是指参与人在博弈中的知识,特别是有关其他参与人(对手)的特征和行动的知识。 报偿是参与人从博弈中获得的结果,它取决于所有参与人的行动或战略。 把全体参与人可能采取的不同战略及其报偿都列出来,称为报偿矩阵。 均衡是所有参与人的最优战略或行动的组合。 二、博弈的分类 可以从不同的角度对博弈进行分类。 根据博弈者选择的战略,可以将博弈分成合作博弈 (cooperative games) 与非合作博弈 (non-cooperative games). 合作博弈与非合作博弈之间的区别,主要在于博弈的当事人之间能否达成一个有约束力的协议。如果有,就是合作博弈;反之,就是非合作博弈。例如,如果几家寡头通过订立并实行协议,限制产量,制定垄断高价,则称这种博弈为合作博弈。若寡头们在市场竞争中没有达成有约束里的协议,每个企业仅仅是在考虑到

博弈论蒋文华浙江大学

第一讲、博弈论概述 献给诸位 知人者智,自知者明; 胜人者力,自胜者强; 小胜者术,大胜者德。 第一章何为“博弈” 博:博览全局弈:对弈棋局→谋定而动 是指在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与人依据所掌握的信息,选择各自的策略(行动),以实现利益最大化的过程。 第一节从一个简单的故事说起 博弈时要搞清楚对手是谁!博弈时要搞清楚和别人比什么! 行为选择既跟对手的情况有关,又跟所遇到的外部环境的变化有关。 特别提示: 博弈既可以是竞争,也可以是合作! 特别提示: 博弈,必须学会换位思考! 特别提示: 博弈,只需领先一步,高人一筹! 博弈就是你中有我,我中有你。由于直接相互作用(互动),每个博弈参与者的得益不仅取决于自己的策略(行动),还取决于其他参与者的策略(行动)。博弈的核心在于整体思维基础上的理性换位思考,用他人的得益去推测他人的

策略(行动),从而选择最有利于自己的策略(行动)。 特别提示: 站在别人的立场上想一想,就是为自己未来的遭遇着想。——米兰·昆德拉 特别提示: 如果因为对方眼中的你的傻,而让对方更愿意和你合作,何乐而不为呢(大智若愚) 特别提示: 请不要在一个充分竞争的市场去追求成功! 特别提示: 选对市场(对手)比选对策略更重要! 特别提示: 在博弈之前,博弈就已经开始了! 第二节博弈的渊源 一、中国的理解 博+弈=下围棋 略观围棋,法于用兵,怯者无功,贪者先亡。 ----汉代刘向,《围棋赋》 二、西方的理解 game(规则) 费厄泼赖(fairplay)

第三节学习博弈论的收益 一、当局者清 更有利的选择 更快速的反应 二、旁观者更清 理解历史与现实 预测未来的发展 三、提出完善游戏规则(制度)的建议 第二章发展简史 第一节最初的探索和应用 一、古诺模型 参加博弈的双方以各自在同一时间内相互独立的产量作为决策的变量,是一个产量竞争模型。 二、伯川德模型 该模型与古诺模型的不同之处在于,企业把其产品的价格而不是产量作为竞争手段和决策变量,通过制定一个最优的销售价格来实现利润最大化。 三、斯塔克尔伯格模型 该模型分析的是这么一种市场竞争:企业A先决定一个产量,然后企业B 可以观察到这个产量,并根据所观察到的产量来决定它自己的产量。 第二节理论的诞生与发展 1、20世纪40年代的社会变化。 2、约翰·冯·诺依曼(JohnVonNeumann,1903-1957)的卓越贡献。1944

博弈论概论

博弈论概述由于现代经济活动的规模越来越大,对抗性、竞争性越来越强,特别是寡头垄断或垄断竞争市场,竞争和决策较量更是厂商经营活动的核心内容,这些都使得人们越来越重视经济活动的环境条件及其变化,越来越重视竞争者或合作者的反应,因此经济决策的“博弈性”越来越强。而且,博弈论在许多情况下所得出的结论更加符合经济现实和更加具有应用性,对参与经济互动的各方或国家政府的决策互动有更强的指导作用。所以,研究博弈论是很必要的。一.基本概念博弈:即一些个人,队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各允许选择的行为或策略中进行选择并加以实施,各自取得相应的结果的过程。从上述定义可以看出,规定或定义一个博弈需要设定下列四个方面。(1)、博弈的参加者(Players)。即在所定义的博弈中究竟有哪几个独立决策、独立承担结果的个人或组织。对我们来说,只要在一个博弈中统一决策,统一行动、

统一承担结果,不管一个组织有多大,哪怕是一个国家,甚至是由许多国有组成的联合国,都可以作为博弈中的一个参加方。并且,在博弈的规则确定之后,各参加方都是平等的,大家都必须严格按照规则办事。(2)、各博弈方各自可选择的全部策略(Strategies)或行为(Actions)的集合。即规定每个博弈方在进行决策时,可以选择的方法,做法或经济活动的水平,量值等。在不同博弈中可供博弈方选择的策略或行为的数量很不相同,在同一个博弈中,不同博弈方的可选策略或行为的内容或数量也常不同,有时只有有限的几种,甚至只有一种,而有时又可能有许多种,甚至无限多种可选策略或行为。 (3)、进行博弈的次序(Order)。在现实的各种决策活动中,当存在多个独立决策方进行决策时,有时候需要这些博弈方的决策又有先后之分,并且有时一个博弈方还要作不止一次的决策选择。这就免不了有一个次序问题。因此规定一个博弈必须规定其中的次序,次序不同一般就是不同的博弈,即使博弈的

相关主题