搜档网
当前位置:搜档网 › 博弈论蒋文华浙江大学

博弈论蒋文华浙江大学

博弈论蒋文华浙江大学
博弈论蒋文华浙江大学

第一讲、博弈论概述

献给诸位

知人者智,自知者明;

胜人者力,自胜者强;

小胜者术,大胜者德。

第一章何为“博弈”

博:博览全局弈:对弈棋局→谋定而动

是指在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与人依据所掌握的信息,选择各自的策略(行动),以实现利益最大化的过程。

第一节从一个简单的故事说起

博弈时要搞清楚对手是谁!博弈时要搞清楚和别人比什么!

行为选择既跟对手的情况有关,又跟所遇到的外部环境的变化有关。

特别提示:

博弈既可以是竞争,也可以是合作!

特别提示:

博弈,必须学会换位思考!

特别提示:

博弈,只需领先一步,高人一筹!

博弈就是你中有我,我中有你。由于直接相互作用(互动),每个博弈参与者的得益不仅取决于自己的策略(行动),还取决于其他参与者的策略(行动)。博弈的核心在于整体思维基础上的理性换位思考,用他人的得益去推测他人的

策略(行动),从而选择最有利于自己的策略(行动)。

特别提示:

站在别人的立场上想一想,就是为自己未来的遭遇着想。——米兰·昆德拉

特别提示:

如果因为对方眼中的你的傻,而让对方更愿意和你合作,何乐而不为呢(大智若愚)

特别提示:

请不要在一个充分竞争的市场去追求成功!

特别提示:

选对市场(对手)比选对策略更重要!

特别提示:

在博弈之前,博弈就已经开始了!

第二节博弈的渊源

一、中国的理解

博+弈=下围棋

略观围棋,法于用兵,怯者无功,贪者先亡。

----汉代刘向,《围棋赋》

二、西方的理解

game(规则)

费厄泼赖(fairplay)

第三节学习博弈论的收益

一、当局者清

更有利的选择

更快速的反应

二、旁观者更清

理解历史与现实

预测未来的发展

三、提出完善游戏规则(制度)的建议

第二章发展简史

第一节最初的探索和应用

一、古诺模型

参加博弈的双方以各自在同一时间内相互独立的产量作为决策的变量,是一个产量竞争模型。

二、伯川德模型

该模型与古诺模型的不同之处在于,企业把其产品的价格而不是产量作为竞争手段和决策变量,通过制定一个最优的销售价格来实现利润最大化。

三、斯塔克尔伯格模型

该模型分析的是这么一种市场竞争:企业A先决定一个产量,然后企业B 可以观察到这个产量,并根据所观察到的产量来决定它自己的产量。

第二节理论的诞生与发展

1、20世纪40年代的社会变化。

2、约翰·冯·诺依曼(JohnVonNeumann,1903-1957)的卓越贡献。1944

年冯诺依曼和摩根斯坦发表《博弈论和经济行为》

3、约翰·福布斯·纳什(JohnForbesNash)的发扬光大

1994年纳什、海萨尼和泽尔腾获诺贝尔经济学奖——约翰·海萨尼(2000年去世,终年80岁)

4、后来的发展方向

其一个对纳什均衡的弱化(或一般化),

其二是对纳什均衡的精炼(或筛选)。

其三是对博弈论的基本假设的研究。

其四是对博弈论的应用研究。

2005年奥曼和谢林诺贝尔经济学奖——奥曼从数学的角度,谢林从经济学的角度用博弈论重塑了对人类社会相互行为影响的分析框架

特别提示:

学习博弈论,让我们学会更好地和他人合作,善莫大焉!

第三章术语解读

第一节博弈的术语

1、参与人(players):理性选择的主体。

2、信息(information):参与者有关博弈的知识。“知己知彼,百战不殆。”

3、行动(action):参与者能够选择的变量。

4、策略(strategies):参与者在行动之前所准备好的一套完整的行动方案(预案)。

(1)完整性

(2)多样性

(3)不可观察性

人不犯我,我不犯人;人若犯我,我必犯人

5、损益(payoff):参与者的得与失。

6、结局(outcome):所有参与者选择各自策略后的结果。

7、均衡(equilibrium):所有参与者的最优策略组合。

8、博弈的规则(rulesofthegame):参与者、行动和结果合起来称为博弈的规则。

博弈论(gametheory):是一种研究人们怎么做策略(行动)选择及其最后的均衡结果会是什么的理论。

好的应急预案:

1、what(信息分类)

2、who(责任到人)

3、action(措施具体)

4、when(时效性)

特别提示:

策略让我们建立起了从信息到行动的快速反应机制,从而能够以最快的速度做出行动选择。

第二节博弈的分类

合作博弈和非合作博弈

合作博弈:指参与者能够达成一种具有约束力的协议,在协议范围内选择有利于双方的策略。

非合作博弈:指参与者无法达成这样一种协议。

静态博弈和动态博弈

静态博弈:指在博弈中,参与者同时选择,或虽非同时选择,但是在逻辑时间上是同时的。

动态博弈:指在博弈中,参与者的行动有先后顺序,且后行动者能够观察到先行动者的行动。

完全信息博弈和不完全信息博弈

完全信息博弈:指在博弈中,每个参与者对其他参与者的类型、策略空间及损益函数都有准确的信息。

不完全信息博弈:总有一些信息不是所有参与者都知道的。

零和博弈与非零和博弈

零和博弈:指博弈前的损益总和与博弈后的损益总和相等。

非零和博弈:指博弈后的损益大于(小于)博弈前的损益总和。(正和或负和)

特别提示:

不玩负和游戏,少玩零和游戏,多玩正和游戏。

第二讲基本假设

第四章基本假设

第一节理性假设

一、认知理性

人是自我利益的判断者

偏好的完备性(completeness)(只有A>B,A

偏好的传递性(transitivity)(A>B,B>C,则A>C)

中庸之道(综合激励)(若A~B,C=(A+B)/2,则C>A或B)

二、行为的理性

自我利益的追求者(行为者)

利益最大化(两利相权取其重,两害相权取其轻)

参照

特别提示:

顾客需要的不是便宜,而是占到了便宜。

参照系(牢牢掌握在自己的手里)

特别提示:

如果不给对方您的两利让其相权,那么对方就很可能会把您的一利和他人的一利相权,从而离您而去。(当我们让别人做选择时,要多做选择题,少做判断题)

特别提示:

1、让对方在2个或3个里面做选择。

2、给对方的几个选项必须有明显区别。

特别提示:

人虽然不是完全理性的(有限理性),但是一定不能被认为是完全非理性的。

特别提示:

愿意吃亏,与那些比你更愿意吃亏的人做朋友。

特别提示:

笑容让人类更容易建立合作关系。学会微笑,会让你受益匪浅!

第二节共同知识假设

共同知识(commonknowledge):指各参与者在无穷递归意义上均知悉的事实。即每个人知道事件E,每个人知道每个人知道事件E,每个人知道每个人知道每个人知道事件E……一直到无穷层次。

特别提示:

达成共识是一件非常困难的事情。

特别提示:

在信息不对称的情况下,有时候博弈的结果不取决于大家是怎么想的,而取决于大家认为大家是怎么想的。

特别提示:

民主谁也挡不住,要么开门让他进来;要么看着它破门而入。这只是时间问题。

第三讲囚犯困境和破解之道

第五章囚犯困境及原因

第一节囚犯困境的来源

占优策略:

是指无论其他参与者采取什么策略,某参与者采用该策略的结果都优于其他策略。

占优策略均衡:

是指由博弈中的所有参与者的占优策略组合所构成的均衡。

特别提示:

游戏规则决定游戏的结局

均衡的结果跟所谓的事实的真相是没有任何关系的

第二节囚犯困境的定义及原因分析

一般条件下的囚犯困境

1、双方都有占优策略,即:

a1>a3,a2>a4,b1>b2,b3>b4

在a1>a3,a2>a4的条件下,张三选择背叛是占优策略;在b1>b2,b3>b4的条件下,李四选择背叛是占优策略

2、存在一个合作解,使双方的收益都优于其在占优策略均衡下的收益,即:a1

如果双方能够选择合作,本可以得到更好的结果。

对称条件下的囚犯困境

在一个2人双策略对称博弈中,如果满足以下条件:P>S>R>T,那么其占优策略均衡(R,R)就构成了囚犯困境。(个人理性与集体非理性)特别提示:

表面上看囚犯对自身利益的追求是导致囚犯困境的原因,其实,真正的原因是:囚犯们在追求自身利益的同时,以更多地损害他人利益为代价。(君子爱财,取之以道)

特别提示:

囚犯困境的根本原因在于:私人成本与社会成本的差异,即个人行为的负外部性。

特别提示:

损人利己和损己利人本质上是一样的,是一个硬币的正反两面;从一方来

看是损己利人的行为,在另一方来看是损人利己的行为,问题的关键是所损(失)的部分和所利(得)的部分哪个更多。(盗窃与抢劫)

特别提示:

如果有一种制度,在该制度下,每个人都只能通过利人才能实现利己的目标,这一定是一种好的制度。(市场的逻辑)

第六章真实世界的囚犯困境

第一节大萧条与凯恩斯革命

一、大萧条

二、凯恩斯对大萧条的解释

1、消费需求不足

2、投资需求不足

3、价格刚性

第二节价格战

第三节独裁与多数人的懦弱

第四节民主与多数人的暴政

一、我所记忆的建国后开展的历次运动:

(1)土地改革运动

(2)镇压反革命运动

(3)抗美援朝运动

(4)建国后第一次整风运动

(5)连队民主运动

(6)三查运动

(7)忠诚老实政治自觉运动

(8)清理“中层”运动

(9)民主改革运动

(10)电影《武训传》和宣传武训的批判运动

(11)三自革新学习与教会民主改革运动

(12)农业生产互助合作运动

(13)文化教育战线和各种知识分子自我教育和自我改造运动

(14)反贪污、反浪费、反官僚主义的三反运动

(15)文学艺术界整风学习运动

(16)爱国增产节约运动

(17)教育、文艺、科学等方面在三反运动中仍进行思想改造学习运动

(18)中央希望华东、中南、西北三大区在大规模的学校教师思想改造会议上,推动学校教师及教育行政人员的思想改造工作

(19)反对行贿、反对偷税漏税、反对盗窃国家财产、反对偷工减料和反对盗窃国家经济情报的五反运动

(20)反对违法乱纪运动(又称新三反)

(21)整党建党运动

(22)学习运动

(23)从批判胡风文艺思想到肃清胡风反革命集团运动

(24)肃清暗藏的反革命分子运动

(25)胡适思想批判运动

(26)整风运动

(27)反右派运动

(28)工商界整风运动

(29)以除四害为中心的爱国卫生运动

(30)大跃进运动

(31)人民公社化运动

(32)农村工具改良运动

(33)农村社会主义和共产主义教育运动

(34)反对右倾思想运动

(35)增产节约运动

(36)养猪运动

(37)整风运动

(38)整风整社运动(又名农村三反运动)

(39)技术革新和技术革命运动

(40)爱国卫生运动

(41)工业企业学解放军运动

(42)学习雷锋运动

(43)干部参加劳动运动

(44)农村社会主义教育运动(又名四清运动,在城市叫五反运动)

(45)群众性设计革命运动

(46)增产节约运动

(47)文化大革命运动

(48)清查“五一六”运动

(49)批陈整风运动

(50)批林批孔运动

(51)开展对《水浒》评论的运动

(52)“批邓、反击右倾翻案风”运动

----摘录于胡甫臣《对建国后历次政治运动的认识》

特别提示:

民主必须与法治(不是法制)相辅相成,才能避免多数人的暴政。

法治:ruleoflaw,是最高准则,最高理念,社会意识

法制:rulebylaw,通过法律治理国家,是统治的工具

第七章如何破解囚徒困境

第一节如何利用他人的囚犯困境

货比三家

分而治之

第二节如何破解囚犯困境

一、道德教化(文化建设)

社会学基本定理

金迪斯():如果一个社会都是由自利主义者构成的,那么,长期而言,这个社会将消亡。而如果一个社会,通过“说服教育”以及其他说教机构的努

力,长期保持一定比例的利他主义者,它就能够稳定地繁衍下去。

二、财产私有(制度建设)

圈地运动(个人成本与社会成本相一致)

人民公社(偷懒是一种占优策略)

三、温故知新

1、让历史告诉未来(重复博弈)

2、学习《博弈论基础》课程

第四讲万元陷阱和智猪博弈

第八章万元陷阱

自古以来,人类为捕杀动物所设的‘陷阱’,有三个特征:

有一个明显的诱饵。

通往诱饵之路是单向的,可进不可出。

越想挣脱,就越陷越深。

沉没成本效应与路径依赖

投资已经过半之后,如果要改变投资方向或暂停投资,都是一个颇为困难的事儿。

沉没成本和转移成本的比较

沉没成本是指由于过去的决策已经发生了的,而不能由现在或将来的任何决策改变的成本。

我们把这些已经发生不可收回的支出,如时间、金钱、精力等称为“沉没成本”(SunkCost)。

在经济学和商业决策制定过程中会用到“沉没成本”的概念。

沉没成本会导致路径依赖。

转移成本是消费者在购买一件商品以取代原有商品的过程中,过渡所需要支付的费用。

Paulklemperer基于经验产品的角度解释转移成本的构成:

第一、学习的成本。如从QWERTY键盘转移到Dvorak键盘将花费的培训和学习费用,这已经成为市场失灵的经典案例。

第二、交易的成本。如更换供应商所面临的风险以及交易费用。

第三、机会成本(ArtificialSwitchingCost)。如“老客户优惠”的损失等。

这里的转移成本应该是消费者承担的成本和新供应商承担的成本总和。转移成本衡量了顾客对某一位供应商的锁定程度。

转移成本是对路径依赖程度和锁定程度的衡量。

社会心理学家泰格对参加拍卖游戏的人加以分析,发现掉入‘陷阱’的人通常有两个动机,一是经济(理性)的、一是非经济(感性)的。

经济动机包括渴望赢得钞票、想赢回他的损失、想避免更多的损失;

非经济动机包括渴望挽回面子、证明自己是最好的玩家及处罚对手等。

确立你投入的极限及预先的约定:譬如投资多少钱或多少时间

极限一经确立,就要坚持到底。(止损)

→止盈容易止损难!原因:①贴现;②人对亏损比盈利要敏感得多(亏损带来的难受程度不等价于同样收益带来的满足程度)。人在正常情况下是厌恶风险的,但是一旦亏损,会立马从一个厌恶风险的人转变成一个偏好风险的人。学会止损会让你活得更久!

3.自己打定主意,不必看别人。

特别提示:

既然事情已经发生,请坦然接受!

特别提示:

每个人都有犯错的时候,请把注意力放在以后如何避免犯同样的错!

蒋文华的补充建议是:

不要指望能够以很低的价格买入。(绞刑架,可竞争市场)

尽快传递势在必得的信号。(破釜沉舟)

只争馒头不争气,没了馒头终断气。(务实)

高瞻远瞩,深谋远虑。(三思而后行)

特别提示:

抢占成本的最低点,就是抢占竞争的制高点

第九章智猪博弈

第一节智猪博弈:多劳不多得

特别提示:

智猪博弈是一个搭便车的博弈。一方付出了相应的代价,双方共享了所得到的收益。

第二节智猪博弈的扩展

1、当A≥10时,大猪小猪都选择不去按。

2、当6≤A<10时,双方都选择等待。

3、当1≤A<6时,小猪等待,大猪去按。

4、当A<1时,任一方去按的收益都大于0。(斗鸡)

若干启发

个体理性与集体理性相冲突,还是相一致,取决于制度安排(游戏规则)。

解决个体理性与集体理性之间的冲突不是靠否定个体理性,而是靠修改制度(游戏规则),从而在满足个体理性的基础上实现集体理性。

从智猪博弈中还可以发现,在A<10时,任一方去按都是集体理性的选择,而收入分配的不均将有助于减少个体理性与集体理性的冲突。

特别提示:

搭便车的同时,别忘了给对方以回报。

特别提示:

富人愿意行善,离不开穷人的点赞。

特别提示:

能力越大,责任越大。

第三节实例分析

一、山寨现象(盗版)

二、网络购物

三、抄(复印)笔记

四、汽车定位系统

五、好货不便宜,便宜没好货

第五讲懦夫博弈和性别战

第十章懦夫博弈

第一节基本模型

鹰鸽博弈

当A>C时,老鹰—老鹰是纳什均衡。

当A

πA老鹰=α(A-C)+(1-α)×2A

πA鸽子=α·0+(1-α)A

两点推论:

1、A增加,双方采取老鹰的概率会上升;

2、C增加,双方采取老鹰的概率会下降。

课堂讨论:

1、C增加后,对双方有好处吗

α=A/C

πA鸽子=(1-α)A=A(1-A/C)

各自的期望收益=A(1-A/C)

故C增加对双方有好处。

核恐怖带来的恰恰是核安全。

人的理性其实是从试错中慢慢总结出来的。(用脚投票)课堂讨论:

2、A增加后,对双方有好处吗

各自的期望收益=A(1-A/C)

当A≤C/2增加时,对双方有好处;

当A>C/2增加时,对双方没有好处。

特别提示:

奖励要适度,过犹不及。

特别提示:

赢者通吃的行业,容易出现过度竞争(winner-take-all)

赢者通吃的行业(能够低成本复制的行业):运动员、搜索引擎、通讯行业、软件行业、公开课、互联网、畅销书、演艺界、博彩业、战争、竞技体育(二八现象:20%的人获得了80%的收入)

非赢者通吃的行业:教育行业

特别提示:

竞技体育很多时候就是个万元陷阱,除非它本身就能给你带来快乐!

特别提示:

奥运会就是一帮最需要运动的人在观看一帮最需要休息的人在剧烈运动。

第二节实例分析

一、路权之争

二、谁打电话

三、责任分散效应

第三节公共物品的提供

一、公共物品的特点

1、非排他性

2、非竞争性

二、谁来提供

1、囚犯困境(需要政府提供)

2、智猪博弈

3、斗鸡博弈

类似的例子(竞争关系)

1、停车占位(协调机制)

2、升官发财(选拔机制)

3、找工作(招聘管理)

4、抢市场(竞争机制)

5、填志愿(录取机制)

第十一章性别战

第一节基本模型

第二节实例分析

类似的例子(合作关系)

1、约会

2、恋爱与结婚

3、聚餐

4、通讯(MSN)

5、语言(世界

基于博弈论的夫妻冲突分析

一个女人能有多美,通常是由与她相伴的男人来决定;一个男人能走多远,往往是由与他相随的女人来决定。夫妻之间的物质生活水平,通常是由收入较高的一方来决定;夫妇之间的精神生活水平,往往是由素质较低的一方来决定。 囚徒困境 在囚徒困境这个例子中,两个囚犯的上策都是坦白,因此最容易出现的结局也就是两人都被判5年。这个结局构成了一种博弈均衡状态,当对局者选择的都是上策的时候,这种均衡叫做上策均衡。在博弈论中,所谓均衡是指一种稳定的结局,当这种结局出现的时候,所有对局者都不想再改变他们所选择的策略。二.情侣冷战对峙 现将囚徒困境的报酬矩阵分析引入到一对情侣的冷战对峙中,见下图: H表示主动的一方感觉自己付出更多从而受到伤害,生出不平衡感;E代表不主动的一方有种优越成就感谈过恋爱的人都会对此有深刻的体会吧。闹矛盾有别扭之后,有时也可能两人都想主动了,但谁也不先迈出这一步,在不知道对方策略和想法的情况下,一权衡一算计就总害怕自己亏了,又或者碍于情面拉不下面子,不肯服个软。于是乎,秋水望穿了,花瓣也掰完了,最后是怎样呢?在这个矩阵中我们需要考虑的是,或者说我们的假设前提是,双方都是完全理性的,是完全以利己目的和最大化利益为原则行事的人。上策均衡显然并非最好的结局,但却是博弈双方经过反复权衡后所采取的认为对自己最有利的选择。但我们知道,所谓的爱情是没有理性可言的,它是一种激情,一旦斤斤计较反复权衡利弊得失,那就不叫爱。所以非常有意思的是,这个矩阵中出现的上策均衡(O,O——OVER),即双方都不主动从而导致感情破裂爱情失败的结局,正说明了爱情只要一权衡一算计,俩人都矜持和自私的话,那么最终铁定玩完。 三、夫妻关系的博弈分析 感情,爱情,亲情夫妻关系尴尬的了现实的活动中,夫妻关系既有和谐、融洽的一面,也存在冲突、矛盾的一面。每5对佳侣新婚燕尔之时,就有一对夫妻分道扬镳。 无论是丈夫还是妻子,双方都有自己的利益追求和价值取向,而家庭生活成为他们博弈的载体和工具。

博弈论期末习题

《博弈论》期末习题 专业:经济学学号:2 ;姓名:王兆丽 一、试写出掷硬币博弈的局中人及其策略与得益函数,并写出双变量得 益矩阵。 答:局中人:盖硬币者和猜硬币者。 策略:有正面和反面两种可选择策略,若猜对,猜者得1盖者-1.否则猜者-1盖者1.由于每一方都不会让对方在选择之前知道自己的决策,所以可以看做是同时做决策的。 双变量得益矩阵; 猜硬币方 二、试举生活中的一例,说明囚徒困境是如何产生的?并试分析可能走 出囚徒困境的途径。 答:例子:中国移动和中国联通之间的价格战。 产生原因:囚徒困境是在个体之间存在行为和利益相互制约的博弈结构中,以个体理性和个体选择为基础的分散决策方式,无法有效地协调各方面的利益,并实现整体、个体利益共同的最优。简单的说,囚徒困境问题都是个体理性与集体理性的矛盾引起的。 可能走出的囚徒困境途径:(1)惩罚。如果政府对实行价格战以获利的企业实行惩罚,那么就会制止这种现象发生。(2)忠诚文化。有时候,建立一种相互忠诚的文化也可以帮助走出囚徒困境。在很多组织中,团体产生所面临的囚徒困境问题的轻重程度是不同的,这种差异的根本来源就是各个组织有自己的文化。(3)长期关系和重复博弈。建立长期关系使得囚徒困境博弈可以多次重复,如果这个“多次”足够长,那么人们就有可能为了长远的将来利益而牺牲眼前的一笔横财,合作也是可以达成的。

三、用逆向归纳法求解下面的博弈的子博弈完美纳什均衡。 答:1、该博弈共包括四个子博弈:(1)从博弈方1选择R 以后博弈方2的第二 阶段选择开始的三阶段动态博弈;(2)从博弈方2第二阶段选择R 以后博弈方1 的开始选择的两个阶段动态博弈;(3)第三阶段博弈方1选择A 以后博弈方2 的单人博弈;(4)第三阶段博弈方1选择B 以后博弈方2的单人博弈 2、根据逆推归纳法先讨论博弈方2在第四阶段的选择。由于选择C 、D 个中 任何一个的得益都相同,因此在这阶段随意选择一个都可以。倒退回第三阶段, 博弈方1选择AB中任何一个都可以。再推回第二阶段,博弈方2选择L将得到 3选择R得到2,因此选择L;最后回到第一阶段,博弈方1选择L得到2选择 R得到3,。所以该博弈的子博弈完美纳什均衡为:博弈方1第一阶段选择R, 博弈方2第二阶段选择L,即(3,1)是该博弈的完美纳什均衡。 四、两个寡头企业进行价格竞争博弈,企业1的利润函数是 q c aq p ++--=21)(π,企业2的利润函数是p b q +--=22)(π,其中p 是企业1 的价格,q 是企业2的价格。求: 1.两个企业同时决策的纯战略纳什均衡; 两个企业同时定价。根据两个企业的得益函数,很容易导出它们各自的反应 函数:απ1 /αp = -2(p-aq+c)=0 ____ p=aq-c απ2/αq = -2(q-b)=0 ______ q=b

基于博弈论的恋爱模型

《数学建模》 课程考核论文 姓名:王湘衡齐久坤张程勇 学号:08100225 08100217 08100232 班级:08信息2班 2011年5 月10日

基于博弈论的恋爱数学模型 摘要 本文用数学建模的方法研究博弈论中的问题,从不完全信息静态博弈建立模型建立模型,并利用纳什均衡原理程序来确定纳什均衡点,对不同均衡点进行分析,从而来确定最佳策略。然后通过海萨尼转换将不完全信息静态博弈转换成不完全信息动态博弈,来模拟现实社会中的恋爱,再利用恋爱者不同类型的分布概率,求出恋爱者的期望,最终来决策恋爱者自己下一步的策略。 关键词:恋爱模型博弈论贝叶斯纳什均衡

1、问题重述 随着社会的进步和发展,现在恋爱问题越来越成为生们关注的热门话题,那么如何利用数学知识来确定恋爱中双方能找到适合自己的恋人,成为现在数学建模中研究的一个重要领域。恋爱模型可以用博弈论来确定双方的合适恋人,这其中将恋爱双方都理想化,这样将给我们研究恋爱问题和建立数学模型带来方便,使我们能将恋爱模型数学化,从而确定恋爱者的进一步决定。 2.模型假设及符号说明 模型假设: 1、恋爱双方都有自己明确的恋爱目标 2、恋爱双方从始至终都保持着自己的理性 3、恋爱双方都有自己喜欢类型的人,并且不会随时间变化 4、恋爱的男女通过对方的行为能够明确的判断出对方为哪种类型的人 5、恋爱的参与生都选择的是均衡战略 符号说明: 3. 问题分析与模型建立 3.1 问题分析 谈恋爱作为一个日常生活中最常见的现象要模型化却也并不简单。我们不妨

这样来看,谈恋爱的男女双方,各有不同类型,我们简单将其分为为了寻找真正爱情的人和为了骗财骗色的人。虽然这样不免有所武断,但我们分析的是一般现象,寻求的是一般解释。有了这样的分类便有了不同的组合,有了我们这个世界的爱恨情仇。我们的分析中有现代版的陈世美,却不会让他得逞,原因是理性经济人的假设。有人说这一点说不通,我不这样认为,经济学说所有人都是理性的并不影响不理性家伙们的存在,能解释一切的理论只能是没有内容的套套逻辑。一个理论的解释力只不过是它一般化的程度罢了。 简单的博弈理论己深入人心,显然上面的问题是不完全信息博弈,无论是男追女还是女追男,信息的不完全或是不对称是显而易见的,用博弈论的话说是对对方的了解不够精确。因此,我们依据博弈论理论可以将其分为静态博弈和动态博弈。静态分析是找出其静态均衡,动态分析是揭示现实中生的行为。 3.2 模型的建立 3.2.1不完全信息静态博弈模型 所谓静态是指所有参与生都同时行动,不会以别人行动的信息来更改自己的行动。我们以最常见的男追女为例,一个男生追求一个女生,在此情况下女生最苦恼的是不知男生是A类型的人还是B类型的人,虽然自己可以从各种渠道了解男生,但知生知面不知心,风险还是存在的。在这种情况下女生所遇到的就是不确定性条件下的选择问题,因为女生不仅不知道男生的类型(A还是B),而且还不知道不同类型的分布概率,但她对自己所属的类型是清楚的,这是她的私人信息。同理男生也是这样。 下面来设定支付函数的权值,以便求出纳什均衡点,设男A类追求者,只要他追求A类女生就得到10,他不追求A类女生就得到-10,A类女生接受得到10,拒绝得到-10;男B类追求者,他追求A类女生得到10,不追求得到-10,A类女生接受得到-10,拒绝得到10;男A类追求者,他追求B类女生得到-10,不追求得到10,B类女生接受得到10,拒绝得到-10;男B类追求者,他追求B类女生得到10,不追求得到0,B类女生接受得到10,拒绝得到0;他们的支付函数的权值依赖追求者的类型。这里用下面四张表说明:

浙江大学申报教授(研究员)职务人员主要业绩(任现职以来)

浙江大学申报卫生技术正高级职务人员主要业绩(任现职以来) 医院:浙医一院科室:眼科姓名:韩伟性别:男出生年月:1971年10月兼任党政职务:无最后学历及毕业时间:博士(2005年3月)继续教育:合格 现任专业技术职务及晋升时间:副主任医师(2004.12)拟升职务:主任医师 一、教学工作: 1、共开设课程1门,授课时数共计360学时。其中必修课1门,必修课开课情况如下: 教学年度课程名称授课对象学生数周学时×周数2005 眼科01七年制90 6×12 2006 眼科02七年制30 16×9 (中班病例讨论,床边教学,临床技能培训) 2007 眼科香港理工大学眼视光学系 4 12×4 (病例讨论,床边教学,临床技能培训) 2008 眼科香港理工大学眼视光学系 6 12×4 (病例讨论,床边教学,临床技能培训) 2009 眼科香港理工大学眼视光学系 3 12×4 (病例讨论,床边教学,临床技能培训) 2、指导硕士生2名,协助指导博士生2人(请列出研究生姓名、专业、年级)。 (1) 指导硕士生: 姓名专业年级 余燕曙眼科学2008级 王琳玲眼科学2009级 (2) 协助指导博士生: 姓名专业年级 姜波眼科学2007级 朱苗苗眼科学2008级 二、临床工作: 每年完成临床工作48周,其中普通门诊96次,专家门诊192次,主持查房48次,参加院内外会诊20次。 三、科研项目 1、共参加科研项目 1 项,共计科研经费21 万元,其中本人完成21 万元。 2、作为项目负责人承担项目:[项目范围以浙大发人(2006)47号文件为准] (1)A类项目1项 (2)B类项目项 (3)C类项目项 项目名称项目来源项目编号经费总额起止年月(起始时间以批文时间为准)本人排名/总人数高度近视候选基因单核国家自然基金委3060069321万2007.1-2009.12 1/9苷酸多态性位点的检测 及基于家系的关联分析

博弈论经典案例分析

博弈论经典案例分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

《经济博弈论》期末考试复习

《经济博弈论》期末考试复习资料 第一章导论 1.博弈的概念: 博弈即一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,并从中各自取得相应结果的过程。它包括四个要素:参与者,策略,次序和得益。 2.一个博弈的构成要素: 博弈模型有下列要素:(1)博弈方。即博弈中决策并承但结果的参与者.包括个人或组织等:(2)策略。即博弈方决策、选择的内容,包括行为取舍、经济活动水平或多种行为的特定组合等。各博弈方的策略选择范围称策略空间。每个博弈方各选一个策略构成一个策略组合。(3)进行博弈的次序:次序不同一般就是不同的博弈,即使博弈的其他方面都相同。(4)得益。各策略组合对应的各博弈方获得的数值结果,可以是经济利益,也可以是非经济利益折算的效用等。 3.合作博弈和非合作博弈的区别: 合作博弈:允许存在有约束力协议的博弈;非合作博弈:不允许存在有约束力协议的博弈。主要区别:人们的行为互相作用时,当事人能否达成一个具有约束力的协议。 假设博弈方是两个寡头企业,如果他们之间达成一个协议,联合最大化垄断利润,并且各自按这个协议生产,就是合作博弈。 如果达不成协议,或不遵守协议,每个企业都只选择自己的最优产品(价格),则是非合作博弈。 合作博弈:团体理性(效率高,公正,公平) 非合作博弈:个人理性,个人最优决策(可能有效率,可能无效率) 4.完全理性和有限理性: 完全理性:有完美的分析判断能力和不会犯选择行为的错误。 有限理性:博弈方的判断选择能力有缺陷。 区分两者的重要性在于如果决策者是有限理性的,那么他们的策略行为和博弈结果通常与在博弈方有完全理想假设的基础上的预测有很大差距,以完全理性为基础的博弈分析可能会失效。所以不能简单地假设各博弈方都完全理性。 5.个体理性和集体理性: 个体理性:以个体利益最大为目标;集体理性:追求集体利益最大化。 第一章课后题:2、4、5 2.设定一个博弈模型必须确定哪几个方面? 设定一个博弈必须确定的方面包括:(1)博弈方,即博弈中进行决策并承担结果的参与者;(2)策略(空间),即博弈方选择的内容,可以是方向、取舍选择,也可以是连续的数量水平等;(3)得益或得益函数,即博弈方行为、策略选择的相应后果、结果,必须是数量或者能够折算成数量;(4)博弈次序,即博弈方行为、选择的先后次序或者重复次数等;(5)信息结构,即博弈方相互对其他博弈方行为或最终利益

浙江大学申报教授研究员职务人员主要业绩任

浙江大学申报技术研发与知识转化高级职务人员主要业绩表 (任现职以来) 单位:医学院附属第一医院姓名:靳昌忠申报职务:副研究员 性别:男出生年月:1981.06 从事现岗位时间:3年最后学历及毕业时间:博士,2011.03 现任专业技术职务:助理研究员晋升时间:2011年12月兼任党政职务:无 一、研发项目: 作为技术负责人承担省部级及以上科研项目9 项,企业委托项目项,新产品研发项,工程设计项,企业较大技改革新项目项,政府、企业咨询项目项,成果转化项,人才培训项。 1、承担省部级及以上科研项目情况: 项目名称项目来源项目编号经费总额起止年月(以批文时间为准)本人排名/总人数

2、承担企业委托、新产品开发、工程设计、企业较大技改革新项目情况: 项目名称起止年月委托(验收)单位验收年月本人排名/总人数 3、为政府和企业提供政策咨询、成果转化、人才培训服务等情况: 项目名称起止年月服务单位规模效果本人排名/总人数 二、论文著作: 1、共发表论文10 篇: (1)其中作为第一作者发表论文 5 篇: 论文题目所载刊物发表年月作者名本人排名/总人数期刊级别

(2)以通讯作者或第二作者发表论文 5 篇:

2、出版著作共本,总字数为万字。其中本人字数在5万字以上的本, 列出本人字数在5万字以上的著作情况: 著作书名著作类型出版年月出版社名称本人字数/总字数 3、研究、咨询、验收报告或总结篇。按照下列格式列出: 报告题目本人字数/总字数用途采纳/咨询单位本人排名/总人数 三、成果奖励: 1、作为负责人或主要完成人获成果奖项,请按下列获奖类别分别列出: 2、作为负责人或主要完成人授权发明专利项,国家实用新型专利项: 专利名称专利类型专利单位专利号本人排名/总人数 四、社会经济效益(300字以内,重点介绍新产品开发,重大技改、革新项目、工程设计、政策咨询和人才培训等所产生的社会经济效益): 申请人对艾滋病发病机制及抗病毒治疗免疫重建进行了深入研究,详细阐述了我国儿童艾滋病抗病毒免疫重建规律,为艾滋病抗病毒治疗和免疫重建提供了新思路。相关成果共以第一作者发表SCI论文7篇,授权发明专利1项,获省科学技术二等奖一次,医药卫生科技一等奖一次(均排名第二)。 此外,申请者积极参与P3实验室的建设和能力提升工作,为我省重大传染病的防治研究提供了技术支持。本人积极参与包括H1N1流感、H7N9禽流感、埃博拉病毒病等在内的重大传染病疫情的防治研究,进行了病毒分离、鉴定以及疫苗的研发等工作。特别是对H7N9疫情,本人参与及时分离出了H7N9病毒株,有力的配合了临床诊治,为H7N9疫情的控制做出了贡献,取得良好社会效应。 五、其他: 1、主要学术兼职: Current HIV Research、Clinical and Experimental Immunology、Journal of Cellular and Molecular Medicine、国际流行病学传染病学杂志审稿人 2、主要荣誉奖励: 六、备注(任现职以来可补充说明的内容):

基于博弈论的爱情浅析

基于经济学的爱情攻略浅析 摘要 随着市场经济的发展,人们对事物认知态度的变化,经济学的应用范围进一步扩大,人们的行事原则越来越趋向于经济学上的“理性”。就现状而言,经济学的分析不仅局限于某些领域,只要存在人类的社会活动,就存在经济,就存在资源合理配置问题,也就有经济分析的必要。谈恋爱是校园中的一个普遍现象,本文从经济学的视野中透视,爱情中的微观经济学问题,包括从预算线角度分析择偶以及爱情中的博弈关系,并试图以经济学的理论提出缓解和解决有关爱情现象问题的建议。 关键词:微观经济学;爱情;预算线;博弈论

Analysis based on the economics of love Raiders 【Abstract】:With the development of market economy, people's attitudes change perception of things, to further expand the scope of application of economics. More and more people tend to act on the principle of "rational" economics. On the current situation, the analysis is not limited to certain areas of economics. As long as the existence of human social activities, there is the economy. There is a reasonable allocation of resources, there is need for economic analysis. Love is a common phenomenon in the campus. This paper is from the perspective of economy. The love of microeconomics issues, including the budget line from the perspective of the relationship between mate and love the game, and tried to ease the economic theory proposed and recommendations to address issues related to the phenomenon of love. 【Key words】:Game theory; microeconomics; love; budget line

法律博弈论及其核心构造

法律博弈论及其核心构造* 金梦 内容提要法律博弈论把博弈理论运用到法经济学研究的全新视域中,研究法律策略主体在行为直接发生相互作用时的策略选择以及这种策略选择所产生的均衡问题。法律博弈论的核心是法律均衡,法律均衡是通过法律博弈最终实现“法律的帕累托最优”。公平正义法律价值的实现,是“法律的帕累托最优”状态的展现,也是法律博弈的终极目标和价值追求。 关键词博弈论法律博弈论法律均衡 法律博弈论从法经济学作为独立学科之日起就已经贯穿其研究的始终。博弈论①为研究法律问题提供了新的方法和视域。如果说科斯定理的提出是法经济学作为一门独立学科的标志,那么从理论上说,自从有了科斯定理,法经济学就成了法律博弈论。②而且博弈理论在经济学领域的充分运用和对经济学的完善与改造引起了诸多法学学者的关注。艾尔斯在评论埃里克·拉斯穆森的《博弈与信息》一书时,提及了博弈论在法律中的应用及其趋势,着重论述了法律规则的策略选择问题。③布里梅耶运用博弈论分析法律冲突问题。④拜尔、格纳特和皮克在合著的《法律的博弈分析》一书中指出,现代博弈理论为人们理解法律规则如何影响人的行为提供了非常深刻的洞察力。此书是第一本全面系统运用博弈论分析法律问题的著作,它的出版开启了法律博弈论研究的新篇章。⑤ 时至今日,作为法经济学的主导分析范式,法律博弈论在一定程度上具有法学方法论的意义。博弈论在法学研究和法律实践中被游刃有余、“无孔不入”地运用,使得法学这门古老又常新的社会学科更加年轻化、精量化和现实化。为了更好地使用博弈论分析和解决法律问题,亟需解释法律博弈论的涵义到底是什么?法律博弈论的运作机理是怎样的?作为一种纯理论⑥,法律博弈论在 法律冲突、法律价值选择和司法实践中如何具体操作适用?以上是本文关注的重点问题。 何谓“法律博弈论” (一)法律博弈论的涵义 “博弈论”,英文的表达是Game Theory或者Theory of Games;“法律博弈论”,英文的表达一般是Law and Game Theory或者Legal Game Theory,很多学者也使用Game Theory and Law,翻译成中文是“法律的博弈分析”抑或“博弈论与法律”。“法律博弈论”在国内外还没有学者作出专门系统且深入的研究,更没有一个确定的涵义和深厚的理论基础。使用“法律博弈论”一词通常是在运用博弈论分析具体法律问题时,所以在通常意义上讲,学者所做的研究叫做“法律的博弈分析”,而不是“法律博弈论”。“法律博弈论”的使用和表达方式首先是把它看做一种独立成家的理论,而不仅仅是博弈方法在法学中的运用。既然是一种理论,就必须明确其定义,厘清其组成要素和适用方法,同时还需要深入考察其是否具有体系化的特征。 在给“法律博弈论”下定义之前,需要先明确“博弈论”的定义。通说认为,博弈论是研究公式化了的激励结构(游戏或者博弈)间的相互作用以及具有斗争或竞争性 822*本文系国家社科基金重大项目“完善以宪法为核心的中国特色社会主义法律体系研究”(项目号:14ZDC008)的阶段性成果。

浙江大学申报教授(研究员)职务人员主要业绩(任现职以来)

浙江大学申报卫生技术副高级职务人员主要业绩(任现职以来) 医院:儿童医院科室:中心实验室姓名:杨莉丽性别:女出生年月:1980.04 兼任党政职务:无最后学历及毕业时间:硕士研究生2006.07 继续教育:合格现任专业技术职务及晋升时间:主管技师2008.09 拟升职务:副主任技师 一、临床工作: 每年完成临床工作52 周,其中普通门诊次,专家门诊次,主持查房次,参加院内外会诊次。 二、教学工作: 1、共开设课程门,授课时数共计学时。其中必修课门,必修课开课情况如下: 2、承担临床教学指导教师工作情况: 3、协助指导硕士生名(请列出研究生姓名、专业、年级)。 三、科研项目 1、共参加科研项目 4 项,共计科研经费70 万元,其中本人完成20 万元。 2、作为项目负责人承担项目按照下列项目分类列出: (1)省部级及以上项目项 3、作为主参(前3名)人员参与项目: 四、发表论文: 共发表论文 3 篇,其中作为第一、通讯作者按照下列期刊分类列出:

五、成果奖励: 共获成果奖项,其中教材奖项,教学成果奖项,科研成果奖项,请按下列获奖类别分别列出 (1)国家级奖项 (2)省部级一、二等奖项 (3)省部级三等奖项 (4)省部级优秀奖项 (5)厅级奖项 六、主要工作业绩综述: 反映临床技术水平、诊断符合率、抢救危重病人、独立解决疑难问题的能力等。(要求条理清晰、分项列出、突出重点,限300字内) 任职以来,在领导及上级技师的关心及指导下,熟练掌握实验室各种检测项目,掌握新生儿筛查实验技术,参与建立及不断优化遗传代谢病筛查和诊断方法。同时,作为World Journal of Pediatrics的责任编辑,负责稿件的组织,审稿,校对和出版等工作,参与建立投稿系统及期刊在线出版,为期刊发展做出努力。具备独立解决问题和团队合作精神,水平得到同事和领导的肯定。 积极参与教学工作,参与组织新生儿疾病筛查实验室读书报告及实验技能培训等。 有较强的科研能力,发表SCI论文4篇。主参国家自然基金等项目两项。 七、其他 1、主要学术兼职: 2、主要荣誉奖励: 2012年度浙江大学医学院附属儿童医院院级先进 八、备注(任现职以来可补充说明的内容): 1、作为主要骨干承担厅局级以上项目 2、作为第二作者在SCI上发表的论文 3、出版著作教材情况―――――――――――――――――――――――――――――――――――――――――― 个人承诺 本人慎重保证所从事的学术研究符合学术道德规范,所提供的材料客观真实。 承诺人: ――――――――――――――――――――――――――――――――――――――――――单位推荐意见:负责人签字:

博弈论经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A来说,囚徒B有坦白和不坦白两种可能的选择,假设囚徒B的选择是不坦白,则对囚徒A来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B选择的是坦白,则囚徒A不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B采取何种策略囚徒A的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 嫌疑犯乙

案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 价格战 案例:假设市场中仅有A 、B 两家企业,每家企业可采取的定价策略都是10元或15元,我们可以得出得益矩阵如下: 分析:无论对企业A 还是企业B 来说,低价都是他们的占优战略。从表可见,企业A 的占优战略是10元,因为无论B 采取什么战略,企业A 都能获取比定价15元更多的利润。 如果企业B 定价10元,企业A 定价10元能够获利80万元,而定价15元只能获得30万元;如果企业B 定价15元,企业A 定价10元可获利170万元,而定价15元却只能获利120万元。同样地,企业B 的占优战略也是定价10元的策略。 企业B 男

博弈期末考试总结

博弈与决策答案 一、名词解释(每小题2分,共16分) 1、博弈 博弈是指一些个人、团队或其他组织,面对一定的环境条件,在一定的规则约束下,依靠掌握的信息,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以施,并从中各自取得相应结果或收益的过程, 2、占优战略均衡 占优战略均衡是指在博弈中,如果所有参与人都有占优策略存在,博弈将在所有参与人的优策略的基础上达到均衡. 3、重复博弈 重复博弈是指同一个博弈在相同的环境、规则下反复多次执行的博弈问题, 4、序列博弈 序列博弈是指对局者选择策略有时问先后的顺序,某些对局者可能率先采取行动.序列博也是一种动态博弈. 5、动态博弈 动态博弈是指在博弈中,参与人的行动有先后顺序且后行动者能够观察到先行动者所选择的行动. 6、占优战略均衡--占优战略均衡是指在博弈中,如果所有参与人都有占优策略存在,博弈将在所有参与人的占优策略的基础上达到均衡. 7、完全信息---完全信息是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息. 8、得益 得益是参与人在博弈结束后从博弈中获得的效用,一般是所有参与人的策略或行动的函数,这是每个参与人最关心的东西. 9,博弈论:博弈论就是系统的研究各种各样的博弈问题,寻求各博弈方合理选择策略的情况下博弈的解,并对这些解进行讨论分析的理论。 10,纳什战略均衡:纳什战略均衡指在均衡中,每个博弈参与人都确信,在给定其他参与人选择的策略的情况下,该参与人选择了最优策略以回应对手的策略。 11,静态博弈:静态博弈是指在博弈中,参与人同时选择或非同时选择但后行动者并不知道先行动者采取了什么具体行动。 二、、简答题(每小题6分,共24分) 1、占优战略均衡和纳什均衡的联系与区别如下: 1)每一个占优战略均衡都是纳什均衡,而每一个纳什均衡却未必是占优战略均衡; 2)用重复剔除严格劣战略方法,保留下的唯一的重复剔除的占优均衡,就是纳什均衡. 3)纳什均衡,不会被重复剔除严格劣战略方法剔除掉(但弱劣战略剔除,可能会剔除纳什衡): 4)经重复剔除严格劣战略之后,有不唯一的多个哉略组合保留,其中有的战略组合不一定纳什均衡.即重复剔除严格劣战略方法,无法确保将所有非纳什均衡战略剔除,没有被剔的战略组合不一定是纳什均衡. 5)没有占优战略均衡的博弈,不能用重复剔除严格劣战略方法求解的博弈,可以有纳什均衡2,博弈的构成要素有哪些?并对其进行说明。 2、博弈一般由以下几个要素组成,包括:参与人、行动、信息,策略、得益、结果、均衡等.

博弈论的读书笔记

博弈论的读书笔记 【篇一:博弈论读书笔记】 博弈论读书笔 博弈论 :亦名“对策论”、“赛局理论”,属应用数学的一个分支,主要研究公式化了的激励结构间的相互作用。是研究决策主体的行 为发生直接相互作用时候的决策以及这种决策的均衡问题,具有斗 争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优 化策略。 博弈论的目的在于巧妙的策略,而不是解法。我们学习博弈论的目的,不是为了享受博弈分析的过程,而在于赢得更好的结局。博弈 的思想既然来自现实生活,它就可以高度抽象化地用数学工具来表述,也可以用日常事例来说明,并运用到生活中去。没有高深的数 学知识,我们同样通过博弈论的学习成为生活中的策略高手。孙膑 没有学过高等数学,但是这并不影响他通过运行策略来帮助田忌赢 得赛马。 博弈时时存在,它就在你的身边。本书就是试图通过日常生活中常 见的例子,来介绍博弈论的基本思想及运用,并且寻求用种智慧来 指导生活决策的方法。 在李凌、王翔的《论博弈论中的策略思维》中,作者从博弈论的起 源谈起,回顾了博弈论在诺贝尔经济学奖上所取得的成就,把博弈 论中的经典案例同生活中的实际例子联系起来进行分析,从合作、 模仿、创新、拍卖、战争和群居等实例表明博弈论中的策略思维是 如何影响人们的行为的, 又是如何使得博弈达到均衡的。最后,围 绕演进博弈论的基础理论与实例案例来分析对传统博弈论的冲击, 及其使博弈论的发展上升到了一个新的阶段和深度。

! 以下是对这篇文章中的囚徒困境、智猪博弈和演进博弈论的简述和分析: 一、囚徒困境—合作还是不合作 在这个模型中,合作还是不合作问题得到了很好的解释,纳什均衡解就是都选择坦白,也就是跟对方囚徒不合作,但这个解对两个囚徒来说并不是帕累托最优解,囚徒困境反映了集体理性和个人理性的矛盾。联系到实际生活中的例子政府提供公共物品,如果让使用资源者自愿承担费用,则会由于搭便车现象的出现,而无法实现共同提供公共物品的目标,所以需要政府通过纳税的方式来提供,以实现帕累托最优,达到资源的有效配置。囚徒困境有限次重复博弈中,当一次性违约的收益大于失信所必须付出的代价时, 企业就存在偏离合同规 定行事的激励,这种内生的激励表明,“损人利己”也是行为人的理性选择。在无限次重复博弈中,如果企业之间致力于长期合作, 就应当设法改变合作机制, 降低合作企业发生机会主义行为的概率。除了健全社会诚信体系之外, 一种行之有效的方法便是提高失信成本。然而在实际生活中的局中人可能受各种外部环境因素或者市场地位的影响,并非是完全理性的,所以在合作方面还存在着一定的风险,这就需要订立合作契约,将这种风险最小化,从现实经济利益的角度提高失信成本,使失约威胁实现真正的可置信。 二、智猪博弈—创新还是模仿 在智猪博弈中,在理性人的假设下,大猪和小猪的支付矩阵决定了大猪选择按,小猪选择等待。类似的,在股票市场中,大户是大猪, 他们进行技术分析, 收集信息、预测股价走势, 所付出的成本高,而相应得到的收益也比较高,而大量散户就是小猪, 他们几乎不花成本去进行技术分析, 而是跟着大户的投资策略进行股票买卖, 这就是股票市场上著名的“散户跟大户”现象。在股份公司中, 大股东是大猪, 他们收集信息、监督经理, 拥有决定经理任免的投票权,

浙江大学申报教授研究员职务人员主要业绩任

浙江大学独立学院申报教授(研究员)职务人员主要业绩(任现职以来) 学院:城市学院姓名:刘加海性别:男出生年月:1960.12 所在二级学科: 最后学历及毕业时间:2001.7 毕业学校:浙江大学所学专业:计算机科学与应用现任专业技术职务:副教授晋升时间:1998.8 拟升职务:教授 一、教学工作(近五年): 1、共开设必修、专业选修课程18 门,授课时数共计2706 学时。必修课开课情况如下: 教学年度授课对象课程名称学生数周学时× 周数 201009-201101 城市学院本科生嵌入式系统原理设计80 32 201009-201101 城市学院本科生嵌入式系统原理设计实验40 32 201009-201101 城市学院本科生嵌入式系统原理设计实验40 32 201009-201101 城市学院本科生人机工程学70 32 201009-201101 城市学院本科生人机工程学70 32 201009-201101 城市学院本科生设计概论120 32 201009-短学期浙大计算机学院本科生Linux程序设计36 32 201009-短学期浙大软件学院本科生Linux程序设计32 32 201002-201007 城市学院本科生嵌入式系统原理设计68 32 201002-201007 城市学院本科生嵌入式系统原理设计实验39 32 201002-201007 城市学院本科生工业设计概论78 32 201002-201007 城市学院本科生工业设计概论70 32 201002-201007 城市学院本科生设计概论112 32 200909-201001 城市学院本科生嵌入式系统设计40 32 200909--201001 城市学院本科生嵌入式系统原理设计69 32 200909--201001 城市学院本科生嵌入式系统设计实验13 32 200909--201001 城市学院本科生嵌入式系统原理设计实验29 32 200909-9-201001 城市学院本科生人机工程学70 32 200909-短学期浙大计算机学院本科生Linux程序设计38 32 200909-短学期浙大软件学院本科生Linux程序设计100 32 200909-200911 浙大软件学院研究生嵌入式系统设计33 32 200902-200907 城市学院本科生VB界面设计60 32 200902-200907 城市学院本科生VB界面设计实验38 32 200902-200907 城市学院本科生设计概论80 32 200809-200901 普通高校本科生大学计算机基础100 48 200809-200901 普通高校本科生大学计算机基础120 48

博弈论经典模型全解析

博弈论经典模型全解析(入门级) 1. 囚徒困境这是博弈论中最最经典的案例了——囚徒困境,非常耐人寻味。“囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不

会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到,他的同伙也不是傻子,也会这样来设想他。所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。企业在信息化过程中需要与咨询企业、软件供应商打交道的。在与这些企业打交道的过程中,我们不可避免地也会遇到类似的两难境地,这个时候需要相互之间有足够的了解与信任,没有起码的信任做基础,切不可贸然合作。在对对方有了足够的信任之后,诚意也是必不可少的,如果没有诚意或者太过贪婪,就可能闹到双方都没有好处的糟糕情况,造成企业之间的双输。 2. 智猪博弈在博弈论(Game Theory)经济学中,“智猪博弈”是一个着名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是

博弈论试题及答案

诚信考试沉着应考杜绝违纪 《博弈论》试卷 课堂周四(7/8) 院系专业万方电气系通信工程 学号 余数 0 姓名

河南理工大学2010–2011学年第1学期 《博弈论》课程期末考试试卷 开课学院:经济管理学院,考试形式:开卷,允许带___________入场 考试时间:2010年12月25日-12月25日, 所需时间:周 考生姓名:学号:专业: 题序一二三四五六七八总分得分 评卷人 1、第一题:(10分) (1)举一个你所经历情侣博弈的情形,在实际博弈中你采取什么行动让自己收益最大; 答:作为一个男生,我想很多机会都是把握在自己手中的,情侣博弈有二个“纳什均衡”,一次博弈的结局究竟落到哪一个“纳什均衡”,关键就是要看遇事时自己如何去选择了。 例如:周末和女朋友去逛商场,应该客观地按照需求去采购,在了解女朋友的爱好的前提下,想办法引导她去看性价比最高的商品,并给予一定建议。遇到她特别喜欢的衣服或饰物,只要价格合理,又能满足生活需要,在对方征求意见时应该支持购买并给予肯定答复;当遇到不合理的购买选择时,应简明扼要地说出其不适之处,并建议对方到其它她喜欢的物品处,挑选令其满意的商品。购物中间一旦遇到对方生气或者发火,可以宽容地对待对方,以显示出自己的城府,若对方为无理取闹,应该坦诚地向对方说明情况,让对方明白自己在为她考虑,说明都说清楚了事情也就简化了。另外,在购物结束前,可以给女朋友买些她喜欢的零食,或者一起去对方喜欢的餐饮店,休息的同时也可调节一下情调,让双方都能够感觉到两个人在一起的幸福与甜蜜。 总结一下,在这场情侣博弈中,要想让自己获得最大收益,必须努力做到认真、善意、宽容、强硬、简单明了各种措施相结合。 2、第二题:(20分) 请举例说明下列说法是否正确,构造博弈模型具体说明,阐述原因。 (1)判断分析“先下手为强” 答:“先下手为强”并不满足所有的情形。 博弈中,在有多个"纳什均衡"的情况下,常常是先动手的一方会占一些优势,这和课例中“囚徒困境”情形类似,有一个最佳策略,古代的很多例子也证明了此点,如:诸葛亮先下手为强,占据荆州要势;日本先下手为强,偷袭美国的珍珠港,不然就不会有第二次世界大战;三国曹操先下手为强,迎接汉献帝,后挟天子以令诸侯等。要指出的是,“动态博弈”中也是有很多后动优势的情形,一般是在方案已经制定,自身实力比较弱,需要选择决策的时候,主动放弃先发权利,变先动劣势为后动优势。如:三人参加选举,支持率分别为15%,35%,50%,这个时候,如果15%者先采取行动,可能会立刻被强敌灭掉,所以他必须保存实力,保持低调,不介入强者的争斗,由另两位先动手,争取灭掉一方后均分失败者的支持率,虽然这样扔处于劣势,但比最初情况要好很多。所以,在面对选择

相关主题