搜档网
当前位置:搜档网 › 博弈论导论

博弈论导论

博弈论导论
博弈论导论

博弈论导论

《博弈论》

主讲:李少斌 Tel:85221808 Email:tlishb@https://www.sodocs.net/doc/c218731139.html,

第0章《博弈论》导论

《博弈论》研究什么, Game Theory

游戏理论,对策论,博弈论

下棋与博弈: 博弈论研究的问题决策及其均衡问题理性经济人(智能的) 行为互动假设:相互影响

经济学研究假设基础

经济学研究内容: 经济学研究的假设基础: 理性经济人新古典经济学的两个基本假定: 完全竞争市场不存在信息不对称问题

博弈论的研究范式

传统经济学研究范式:生产或消费的决策者在做出决策时,假设价格是固定不变的,以此使其效用最大化。决策者是价格的接受者博弈论的突破:决策时考虑到主体的决策行为是互相影响的,即局中人决策时将考虑到其竞争对手的行为,并且预料到竞争对手对其行为的策略式反应;个人的最优选择是其他人选择的函数。价格影响者:互动,相互影响

一、生活中的博弈现象

海滩占位问题 :

二人对称矩阵博弈:

二人矩阵博弈:智猪博弈

公共产品供给问题:

1、海滩占位问题

两个卖矿泉水的小商贩为了争夺在海滩上日光浴的顾客,假若晒太阳的人们在1公理长的沙滩上均匀分布,试问:两个商贩将如何布局,

海滩占位问题求解

帕累托最优:

纳什均衡:

类似的例子

电视台的娱乐节目竞争现象(节目克隆) 总统竞选的竞选纲领问题(尽量争取中间选民) 超市的布局问题不同航空公司飞往同一目的地的航班现象地方政府竞相设立开发区

支付函数的矩阵博弈问题

在现实中最常见的博弈问题通常是二人博弈问题,每一博弈方的行动选择通常只有两种,在这样的博弈问题中双方的得益函数通常可用一个矩阵来描述。如图:

参与人B 参与人A U L a, e R b, f

D

c, g

d, h

2、二人对称矩阵博弈

考查二人对称博弈。双方各有合作和不合作两种策略,其得益支付矩阵如下。由其相对大小确定了不同类型的博弈问题。这里,合作理解为投对方所好,或者说选择对方所希望的策略;不合作可理解为背叛。参与人B 合作不合作合作参与人A 不合作 r, r t, s s,

t p, p

(1)囚徒困境博弈(t,r,p,s)

两个小偷被控有罪,法官对其分别审判,每个小偷决定是坦白还是抵赖,其得益矩阵如下。小偷将如何行动, 囚徒困境博弈中的合作策略指什么策略, 囚徒B

抵赖

抵赖囚徒A 坦白 ,1,,1 0,,10

坦白

,10, 0 ,8,,8

纳什均衡与划线法

对矩阵博弈而言,纳什均衡是指这样一种策略(行动)组合,局中人谁都没有动机单方面偏离该状态。矩阵博弈的纳什均衡求解――划线法: 对于参与人B的每一个给定策略选择,在A的最优策略下划一横线,然后再用类似的方法找出B 的最优策略。

囚徒困境博弈的划线法求解

囚徒B 抵赖抵赖囚徒A ,1,,1 坦白 ,10, 0

坦白

0,,10

,8,,8

囚徒困境博弈的启示

囚徒困境博弈:深刻地反映了个体理性与集体理性的冲突。类似的例子有:卡特尔组织、公共产品的供给问题(搭便车现象,如两户穷人修路问题)、产品定价问题(价格战)、军备竞赛、经济改革、贸易壁垒问题(关税等)。其特点

是:t,r,p,s。

素质教育还是应试教育,

教师B(家长B) 减负增负教师A (家长A) 减负增负 1,1 2,-1 -1, 2 0,0

孩子该不该上各种课外辅导班,

(2)胆小鬼博弈(t,s,r,p)

争路博弈:两个小孩争着过独木桥,若双方互不退让时,双方都将掉到河中,

若只有一方退让时,退让者将获得胆小鬼称号。胆小鬼博弈中的合作策略指什么策略,

B W(退) T

W(退)

A T

0,0

2,1

1,2

,2,,2

胆小鬼博弈的启示

胆小鬼博弈,又称争路博弈,斗鸡博弈。类似的例子有: 冷战期间美苏争抢

地盘夫妻间矛盾问题警察与游行队伍的进退问题公共产品的供给问题胆小鬼博弈的分类

胆小鬼博弈的特点是:t,s,(,,,)r ,p,对于s和 r的相对大小又有三种可能

的情形: (1)争路博弈(t,s,r,p); (2) t,s,r,p; (3)货币当局与财政当局的博弈(t,r, s,p)

胆小鬼博弈(t,r,s,p)

货币当局与财政当局博弈:货币当局的收益取决于是否控制住通货膨胀

(π,0),财政当局的收益取决于是否实行扩张性的财政政策(d,1)。财政当局B

退d,0 退π,1

货币当局A 1,1 2,0

进d,1

0,2 ,2,,2

进π,0

(3)求同存异博弈(t,s,p?r)

性别战问题:如何度周末,一对恋人各自决定,看芭蕾舞还是足球赛, 性别战博弈中

的合作策略指什么策略,

芭蕾舞

足球赛女芭蕾舞 ,1,,1 2,1

足球赛

1,2 0,0

类似的例子

一对恋人选修课程: 政治外交等博弈问题: 董事会内部对两个投资项目意见分歧的决

策内部矛盾与一致对外基金抱团取暧其特点是: t,s,p?r。

(4)共同投资问题 (r,t,p, s)

当参与者共同投资大项目时将获得更高的收益,但当另一方玩花样而投资于小项目时,

大项目投资者将被套。 B

联合单独

0,1

A

联合

2,2

单独

1,0

1,1

在该博弈中,双方都投资于小项目是风险占优均衡。

类似的例子

共同打猎问题: 考试作弊: 其特点是:r,p,(,)t, s。

考试作弊

两位考生考试的得益矩阵如下。在该博弈中,双方都不作弊是风险占优均衡。 B

作弊不作弊 0,8

A

作弊

9,9

不作弊

8,0

7,7

二人对称矩阵博弈小结

参与人B

合作不合作 s, t p, p

参与人A

合作不合作

r, r t, s

囚徒困境博弈: t,r,p,s 胆小鬼博弈: t,s,(,,,)r,p 求同存异博弈: t,s ,p,r 共同投资问题: r,p,(,)t, s

3、二人矩阵博弈

二人矩阵博弈中更为普遍的是非对称博弈。

参与人B

L 参与人A U D a, e c, g R b, f d, h

智猪博弈

自动控制的食槽有10个单位的食物,按控制键的成本为2,若大猪按小猪等待,则双方分吃的食物为6和4,若大猪等待小猪按,则双方分吃的食物为9和1,若同时按,则双方分吃的食物为7和3。利益矩阵如下:

小猪按等待

大猪等待

5,1

9,,1

4,4

0,0

类似的例子

大股东和小股东对经理监督股票市场的散户跟庄现象大企业与小企业关于技术的研究与开发新产品广告改革的推动公共产品的供给问题:富户和穷户的修路问题 OPEC的成功:归因于沙特阿拉伯扮演大猪角色股改对价博弈:

4、一个公共产品供给问题的例子

公共产品的供给问题:供给不足存在多种模型解释: 囚徒困境博弈胆小鬼博弈智猪博弈共同投资问题

公共产品供给,,囚徒困境博弈

两户穷人修路问题:修路带给每家的收益均为3,修路的成本为4。 B

修修 A 不修

1,1 3,-1

不修

-1,3 0,0

公共产品供给,,胆小鬼博弈

两户富人修路问题:修路带给每人的收益均为5,修路的成本为4。 B

修修 A 不修

3,3 5,1

不修

1,5 0,0

公共产品的供给,,智猪博弈

富户和穷户的修路博弈:修路带给富户和穷户的收益分别为5和3,修路的成本为4。穷户修修富户不修

3,1 5,-1

不修

1,3 0,0

公共产品供给,,共同投资博弈

在以上分析中,一个隐含条件是各家都有能力单独将路修好。若假设每家不能单独将路修好,则博弈演化为共同投资问题。修路问题,,口头承诺:修路带给每家的收益均为3 ,修路的成本为4 ,每家承诺投入资金2。

B 修不修

-2,0 0,0

A

修不修

1,1 0,-2

热点问题思考

尝试运用博弈模型分析: 人民币汇率博弈: 楼市调控博弈: 股市投资风格博弈: 宏观经济政策博弈: 中日争端博弈:

二、博弈论概论

博弈论的研究内容博弈论的发展脉络博弈论与经济学博弈论在经济金融领

域中的运用

1、博弈论的研究内容

博弈论是在考虑到决策主体的行为互动条件下研究理性经济人的决策及其均

衡问题的理论。行为互动假设理性经济人决策及其均衡问题

2、博弈论的发展脉络

(1)博弈论的思想渊源孙武:《孙子兵法》

孙膑:齐王与田忌赛马

古诺(Cournot, 1838)、伯特兰(Betrand, 1883)和艾奇沃斯(Edgeworth, 1925)等人关于两寡头的产量和价格垄断模型

(2)博弈论理论的发展

冯? 诺依曼和摩根斯坦:《博弈论与经济行为》(1944) 五十年代的合作博弈论:讨价还价模型、核的概念; 非合作博弈论:纳什提出了纳什均衡(1950),

Tucker(1950)定义了“囚徒困境” 。泽尔腾(Selten, 1965)提出了精炼纳什均

衡,海萨尼 (Harrsanyi, 1967,1968)则通过海萨尼转换把不完全信息引入博弈论的研究。克瑞普斯(Kreps, 1982)等则研究了动态不完全信息博弈。

(3)博弈的分类

从信息角度看,博弈可分为:

完全信息博弈:指局中人对于自己以及其他局中人的策略空间、盈利函数等知识有完全的了解。

不完全信息博弈:

从局中人行动的先后秩序看,博弈可分为:

静态博弈:局中人同时选择行动;

动态博弈:局中人的行动有先后顺序,且后行动者可以观察到先行动者的行动后再行动。

四类博弈

因此,博弈可分为四类: 完全信息静态博弈: 完全信息动态博弈: 不完全信息静态博弈: 不完全信息动态博弈:

非合作博弈与合作博弈

以决策者是否能进行信息沟通可将博弈分为: 合作博弈:强调效率、公正、公平联盟型博弈:卡特尔联盟谈判理论非合作博弈:博弈论的主要研究对象,强调个人理性、个人最优决策

(4)博弈论中的理性问题

在经济学研究中普遍采用“理性经济人” 假设。对理性的理解有: 理性意识和理性能力: 理性意识是狭义的理性,是决策者始终以自身利益最大化为目标。行为的理性和知识的理性: 行为的理性指决策者对不同的行动方案具有稳定的偏好序。个体理性、集体理性

和交互理性:

博弈论中的完全理性假设

博弈论中的理性假设是完全理性:包括理性的和智能的两层含义。理性的:如果一个决策者在追逐其目标时能前后一致地做出决策,即行为理性。智能的:决策者进行决策时能策略性地做出反应,包括决策者的理性能力、交互理性和知识理性、理性的共同知识。

博弈论中的理性解释(1)

决策者的理性能力:指有理性意识的经济主体具有的、实现主观愿望所需要的客观能力,在计算和逻辑推理方面有很高要求。交互理性:是人们的利益相互取决于其他人的行为时的理性。知识理性(贝叶斯理性):指在有不确定性的情况下,最大限度地获得信息,形成准确判断的能力。

博弈论中的理性解释(2)

理性的共同知识:每个博弈方都知道所有博弈方都是理性的,都知道其他博弈方知道所有博弈方都是理性的,都知道其他博弈方知道其他博弈方知道所有博弈方都是理性的……

理性概念的发展

从完全理性到有限理性: 有限理性:有理性意识,但理性能力有限。进化博弈论: 模仿模型学习模型:

(5)博弈论研究的前沿问题

博弈论中完全理性的局限性: 对理性概念的突破,博弈论与相关学科交叉融合,产生了一批新兴学科: 进化博弈论(生物进化理论) 实验经济学(实验理论) 行为经济学(心理学) 行为金融学(金融学、心理学)

3、博弈论与经济学

从经济学的各个分支如产业组织理论、现代企业理论、信息经济学、金融学等到政治、文化、日常生活等各个方面无不渗透着博弈论的思想。

(1)博弈论对西方经济学的改造

自使用资源的方式。威廉姆森是新制度经济学”的命名者,特别是在企业边界方面的研究。其理论显示,企业能够扮演解决冲突的角色。过去三十年,他们的研究促使经济管理从经济学边缘研究成为前沿研究。

4、博弈论在经济金融领域中的运用

信息经济学中的运用产业组织理论中的运用金融理论中的运用

(1)信息经济学中的运用

信息不对称与机制设计委托代理中的激励约束问题逆向选择和道德风险问题(保险市场和旧货市场) 信号传导机制(劳动力市场的教育信号博弈模型)

(2)产业组织理论中的运用

产业组织理论是博弈论最早和最成功运用的领域之一。从寡头垄断及垄断竞争的市场结构理论,到现代企业的生产、管理、营销、新产品开发无不渗透着博弈论的思想。常见模型有:市场竞争模型、限制性定价、拍卖投标、搜索模型等。

(3)金融领域中的运用

宏观金融政策决策中央银行的货币政策决策及其传导问题:货币政策传导依赖于中央银行与企业、居民之间的相互博弈。当前宏观经济政策的博弈问题货币政策取向货币政策调整

资本市场中博弈问题

IPO价格的询价博弈: 投资者抉择:股民还是基民, 投资者博弈:大股东与其他投资者的博弈,大小非解禁与流通股东的博弈,主力和游资、机构与散户等博弈问题证券市场

政策博弈:政策决策者与各类市场参与者投资者股票抉择:大盘股还是中小盘股,二八转换博弈监管与投机炒作博弈:监管机构、上市公司、中介机构与投资者

国际金融领域

国际金融中的均衡汇率问题: 如人民币汇率升值博弈问题: 国际游资投机与国家金融稳定: 国际游资投机与一国外汇监管当局的博弈问题:亚洲金融风暴、香港金融危机美国次贷危机及全球救市合作: 次贷危机引发的全球金融动荡及各国政府救市更是一个复杂的博弈问题

保险中的博弈问题

保险合同条款设计保险中的道德风险问题保险中的逆向选择问题

行为金融理论

综合运用心理学、社会学、金融学、实验经济学、数学等学科来研究人类的金融行为,涉及到金融学的投资、融资、筹资等诸多领域,是一门方兴未艾的边缘学科。行为金融学主要研究人们在投资决策过程中认知、感情、态度等心理特征,以及由此而引起的市场非有效性。

(4)思考与作业

针对你熟悉的经济金融热点问题或社会生活现象,尝试构建一个简单博弈模型进行分析。

三、课程安排与参考书目

课程安排: 讲授10周:3-12周讨论与复习2周:13-14周考试1周:15周考试与论文: 平时作业与考勤:占30% 课程论文与开卷考试(可选):占70% 参考书目,,教材类

张维迎:《博弈论与信息经济学》,上海人民出版社、上海三联书店。艾里克? 拉斯缪森:《博弈与信息》,北京大学出版社,刊中关于博弈论在经济金融领域的相关论文。《经济研究》、《金融研究》等中文期刊中的相关论文。

(完整版)博弈论知识点总结

博弈论知识总结 博弈论概述: 1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 博弈论研究的假设: 1、 决策主体是理性的,最大化自己的收益。 2、 完全理性是共同知识 3、 每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念 与预期 2、和博弈有关的变量: 博弈参与人:博弈中选择行动以最大化自己受益的决策主体。 行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。 信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息) 等的信息。 完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息。 不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。 支付:决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。 从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别: 3、博弈论与传统决策的区别: 1、 传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己 效用,研究工具是无差异曲线。可表示为:maxU(P ,I),其中P 为市场价格,I 为消费者可支配收入。 2、 其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定 下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式:战略式博弈和扩展式博弈 战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。 战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合 : 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn). 扩展式博弈:是博弈问题的一种规范性描述。 与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。 包含要素: 1、 参与人集合 {1,2,...,}n Γ={1,2,...,}n Γ=11(,...,,...,)n i i n i s s s s ==∏

博弈论复习题及答案(DOC)

囚徒困境说明个人的理性选择不一定是集体的理性选择。(√) 子博弈精炼纳什均衡不是一个纳什均衡。(×) 若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。()博弈中知道越多的一方越有利。(×) 纳什均衡一定是上策均衡。(×) 上策均衡一定是纳什均衡。(√) 在一个博弈中只可能存在一个纳什均衡。(×) 在一个博弈中博弈方可以有很多个。(√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。(√) 在博弈中纳什均衡是博弈双方能获得的最好结果。(×) ~ 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(×)上策均衡是帕累托最优的均衡。(×) 因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。 (×) 在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×) 在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(√)不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√) — 多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(√) 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t

博弈论案例分析

博弈论 博弈论(Game Theory),亦名―对策论‖、―游戏理论‖,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。 博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自选择的行为或是策略进行选择并加以实施,并从各自取得相应结果或收益的过程,在经济学上博奕论是个非常重要的理论概念。 什么是博弈论?古语有云,世事如棋。生活中每个人如同棋手,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们―出棋‖ 招数中理性化、逻辑化的部分,并将其系统化为一门科学。换句话说,就是研究个体如何在错综复杂的相互影响中得出最合理的策略。现在,我们就一些例子来讨论博弈论相关内容。 一、从“囚徒困境”开始 在博弈论中,含有占优战略均衡的一个著名例子是由塔克给出的―囚徒困境‖(prisoners’ dilemma)博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。下表给出了这个博弈的支付矩阵。 表囚徒困境博弈 [Prisoner's dilemma] 我们来看看这个博弈可预测的均衡是什么。对A来说,尽管他不知道B作何选择,但他知道无论B选择什么,他选择―坦白‖总是最优的。显然,根据对称性,B也会选择―坦白‖,结果是两人都被判刑8年。但是,倘若他们都选择―抵赖‖,每人只被判刑1年。在表2.2中的四种行动选择组合中,(抵赖、抵赖)是帕累托最优的,因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。不难看出,―坦白‖是任一犯罪嫌疑人的占优战略,而(坦白,坦白)是一个占优战略均衡。 要了解纳什的贡献,首先要知道什么是非合作博弈问题。现在几乎所有的博弈论教科书上都会讲―囚犯的两难处境‖的例子,每本书上的例子都大同小异。 话说有一天,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人,斯卡尔菲丝和那库尔斯,并从他们的住处搜出被害人家中丢失的财物。但是,他们矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离,分别关在不同的房间进行审讯。由地方检察官分别和每个人单独谈话。

博弈论知识点总结

博弈论知识总结 博弈论概述: 1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 博弈论研究的假设: 1、 决策主体是理性的,最大化自己的收益。 2、 完全理性是共同知识 3、 每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念 与预期 2、和博弈有关的变量: 博弈参与人:博弈中选择行动以最大化自己受益的决策主体。 行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。 信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息) 等的信息。 完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息。 不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。 支付:决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。 从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别: 3、博弈论与传统决策的区别: 1、 传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己 效用,研究工具是无差异曲线。可表示为:maxU(P ,I),其中P 为市场价格,I 为消费者可支配收入。 2、 其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定 下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式:战略式博弈和扩展式博弈 战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。 战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合 : 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn). 扩展式博弈:是博弈问题的一种规范性描述。 与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。 包含要素: 1、 参与人集合 {1,2,...,}n Γ={1,2,...,}n Γ=11(,...,,...,)n i i n i s s s s ==∏

博弈论知识点总结

博弈论知识点总结

博弈论知识总结 博弈论概述: 1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 博弈论研究的假设: 1、决策主体是理性的,最大化自己 的收益。 2、完全理性是共同知识 3、每个参与人被假定为可以对所处 环境以及其他参与者的行为形成正确的 信念与预期 2、和博弈有关的变量: 博弈参与人:博弈中选择行动以最大化自己受益的决策主体。 行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。 信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完 全信息)等的信息。

1、

2、 既定下,消费者效用只依赖于自己 的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式:战略式博弈和扩展式博弈 战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。 战略式博弈是一种假设每个参与人仅 选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合 : 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn). 扩展式博弈:是博弈问题的一种规范性描述。 与战略式博弈侧重博弈结果的描述相 比,扩展式博弈更注重对参与人在博弈过程 {1,2,...,} n Γ=11 (,...,,...,) n i i n i s s s s ==∏

博弈论基础作业及答案

博弈论基础作业 一、名词解释 纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡 贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识 见PPT 二、问答题 1.举出囚徒困境和智猪博弈的现实例子并进行分析。 囚徒困境的例子:军备竞赛;中小学生减负;几个大企业之间的争相杀价等等; 以中小学生减负为例:在当前的高考制度下,给定其他学校对学生进行减负,一个学校最好不减负,因为这样做,可以带来比其他学校更高的升学率。给定其他学校不减负,这个学校的最佳应对也是不减负。否则自己的升学率就比其他学校低。因此,不论其他学校如何选择,这个学校的最佳选择都是不减负。每个学校都这样想,所以每个学校的最佳选择都是不减负,因此学生的负担越来越重。 请用同样的方法分析其他例子。 智猪博弈的例子:大企业开发新产品;小企业模仿;股市中,大户搜集分析信息,散户跟随大户的操作策略 以股市为例:给定散户搜集资料进行分析,大户的最佳选择是跟随。而给定散户跟随,大户的最佳选择是自己搜集资料进行分析。但是不论大户是选择分析还是跟随,散户的最佳选择都是跟随。因此如果大户和散户是聪明的,并且大户知道散户也是聪明的,那么大户就会预见到散户会跟随,而给定散户跟随,大户只有自己分析。 请用同样的方法分析其他例子。 2.请用博弈论来说明“破釜沉舟”和“穷寇勿追”的道理。 破釜沉舟是一个承诺行动。目的是要断绝自己的退路,让自己无路可退,让自己决一死战变得可以置信。也就是说与敌人对决时,只有决一死战,这样才可以取得胜利。否则,如果不破釜沉舟,那么遇到困难时,就很有可能退却,也就无法取得胜利。穷寇勿追就是要给对方一个退路,由于有退路,对方就不会殊死抵抗。否则,对方退无可退,只有坚决抵抗一条路,因而必然决一死战。自己也会付出更大的代价。

博弈论导论

第一部分 理性决策制定

1 单人决策问题 晨起穿衣,你准备享用早餐。天生也幸,你生活在一个提供丰富自助餐的大学生宿舍,桌上食物种类繁多,可以左挑右拣。也可能你是一位不那么走运的研究生,工作间的壁橱里只有两盒半空的荞麦食品,所选乏味之极。但无论是哪种情况,你都面临着同样一个问题:你该如何享用你的早餐? 这类情况正是随处可见的决策问题的一个例子。不管是作为个人还是群体(如企业和其他组织),我们每天都要面对各种各样的决策问题。此种例子不胜枚举:企业经理需要就是否开展一项新的研发计划做出决策;国会议员需要决定是否投票赞成某项法案;本科生需要选择自己的主修科目;棒球投手想要掷出何种类型的球;再如迷路的驴友们困惑于该朝哪个方向走。这种情况的列表可以无穷无尽。 有些决策微不足道,比如你如何选择早餐。举个例子,如果Apple Jacks和Bran Flakes是你的壁橱里仅有的两种荞麦食品,而且如果你不喜欢Bran Flakes(它们属于你的室友),那么你的选择显然会是吃Apple Jacks。与此相比,一名经理是否选择启动一项有风险的研发项目,或者一个立法者对法案的抉择则是一些更加复杂的决策问题。 本章将介绍一种分析语言,它可以给出严格的基础以支持博弈中潜在的策略互动这一思想。这种分析语言是比较形式化的,它可以表达各类问题中的决策主体,为我们思考决策问题在结构方式方面提供一套工具。这种分析上的正式性帮助我们澄清思想,磨砺思维。当然,在保持问题更为现实层面的能力和意愿上,这种形式化的努力不能在分析的内核上对之有所冲淡。 引入这种形式语言,我们必须就决策者或者参与人的行为给出一套假设。有时候,这些假设似乎接受起来不会遇到什么质疑。不过在另外一些时候,这些假设却不大能为我们所接受,因为它们可能会构成对我们信念的重大挑战。尽管如此,正如我们的分析所将展示的那样,我们还是会由衷的赞叹由这些假设出发而得到的结论其洞察力是何等的敏锐。 和任何理论框架一样,我们从中所得到的结论的价值,最多只能和我们在假设上的洞察力一样好。在计算机科学中有一句名言——“垃圾进,垃圾出!”——意思是说,如果进入计算系统的数据有问题,那么最终结果也会有问题。尽管

博弈论 蒋文华 浙江大学

第一讲、博弈论概述 献给诸位 知人者智,自知者明; 胜人者力,自胜者强; 小胜者术,大胜者德。 第一章何为“博弈” 博:博览全局弈:对弈棋局→谋定而动 是指在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与人依据所掌握的信息,选择各自的策略(行动),以实现利益最大化的过程。 第一节从一个简单的故事说起 博弈时要搞清楚对手是谁!博弈时要搞清楚和别人比什么!

行为选择既跟对手的情况有关,又跟所遇到的外部环境的变化有关。 特别提示: 博弈既可以是竞争,也可以是合作! 特别提示: 博弈,必须学会换位思考! 特别提示: 博弈,只需领先一步,高人一筹! 博弈就是你中有我,我中有你。由于直接相互作用(互动),每个博弈参与者的得益不仅取决于自己的策略(行动),还取决于其他参与者的策略(行动)。博弈的核心在于整体思维基础上的理性换位思考,用他人的得益去推测他人的策略(行动),从而选择最有利于自己的策略(行动)。 特别提示: 站在别人的立场上想一想,就是为自己未来的遭遇着想。——米兰·昆德拉

如果因为对方眼中的你的傻,而让对方更愿意和你合作,何乐而不为呢?(大智若愚)特别提示: 请不要在一个充分竞争的市场去追求成功! 特别提示: 选对市场(对手)比选对策略更重要! 特别提示: 在博弈之前,博弈就已经开始了! 第二节博弈的渊源 一、中国的理解 博+弈=下围棋 略观围棋,法于用兵,怯者无功,贪者先亡。

----汉代刘向,《围棋赋》二、西方的理解 game(规则) 费厄泼赖(fairplay) 第三节学习博弈论的收益一、当局者清 更有利的选择 更快速的反应 二、旁观者更清 理解历史与现实 预测未来的发展

博弈论经典案例分析

博弈论经典案例分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

用博弈论分析生活中的现象

上海第二工业大学 2012-2013学年第二学期 用博弈论分析生活现象论文

博弈论分析生活中现象 博弈论它较好地解决了对竞争等问题的可操作性分析,成为经济学中激荡人心的一个研究领域,主要是研究各相关行为主体的决策行为相互影响、相互作用的假定条件下,博弈论就是分析博弈行为和博弈决策的一门科学。其实博弈现象不只现身于经济领域对于我们日常生活中也是处处可见的,所以博弈论的思想不仅仅能够用来分析经济从而获得最大的盈利,我们也可以尝试将博弈论的思想运用到生活实践中从而获得最优的策略。 比如某一天你觉得应该是你女朋友的生日,但又不能肯定,如果是女朋友的生日的话,你可以送一束花,女朋友会特别高兴,你不送花,女朋友会埋怨你忘了她的生日如果不是女朋友的生日的话,你可以送女朋友一束花女朋友感到意外的惊喜,你不送花结果生活同往常一样。 生日非生日 买花 1 ,1 2 ,1 不买花-1,-1 0 ,0 确定今天是女朋友的生日或确定今天不是女朋友的生日,但你的最好行动都是买花。 谈到博弈论我们不得不说到囚徒困境,其内容大致为两名罪犯A 和B隔离审讯。如果两个都不招,因为证据不充分,两人都只能判1年。如果一方招了,属立功表现,功罪相抵,无罪释放;而另一方则属抗拒从严,判10年刑但如果两人都招了,则各判 5 年。结果大家都知道:两个人争先恐后地招了,结结实实地各判了5年。两个犯

人陷入的就是囚徒困境, A B 招不招 招 5 ,5 无罪释放,10 不招10,无罪释放 1 ,1 其结果就是A和B都招,判5年刑。如果两人协商后选择不招,但如果A或B其中一人招了,另一人就会判10年,而招的一人就会无罪释放,这样的诱惑足以让两名罪犯违背两人协议。而选择招。这样最有可能就是俩人都招。 人际交往中的博弈 人与人之间的相互矛盾和相互冲突的关系实际上就是一种博弈关系。矛盾冲突的结果也有三种情况负和游戏、零和游戏和正和游戏。“负和游戏”是一种两败俱伤的游戏故也称为双输博弈。在人与人的交往时由于相互的冲突和矛盾不能达到统一交际双方都不让步,最后使交际活动不能展开,结果是交际的双方都从中受损两败俱伤。如果是朋友,也会因不断发生“负和游戏”而逐渐疏远,夫妻间经常出现“负和”现象感情自然会受到影响。交际中之所以经常会发生“负和博弈”现象,大多是因为心胸狭窄,遇事爱使性负气,必然会出现“负和”局面。如果不使性负气,而是互相谅解,与人交往采取合作态度,便能使有矛盾和冲突的交际活动朝好的方向发展。在交际中如果遇到了和交际对象发生冲突的时候能够想着退一步海阔天高,采取一种和对方合作的态度就一定能避免交际中“负和游戏”的发生。至于“零和游戏”这种简单的“你输我赢”的思考方式往往会给人们带来更大的麻烦。其实在人与人之间的交往中双方的关系并不是简单

博弈论课后习题

第一章导论 1、什么是博弈?博弈论的主要研究内容是什么? 2、设定一个博弈模型必须确定哪几个方面? 3、举出烟草、餐饮、股市、房地产、广告、电视等行业的竞争中策略相互依存的例子。 4、“囚徒的困境”的内在根源是什么?举出现实中囚徒的困境的具体例子。 5、博弈有哪些分类方法,有哪些主要的类型? 6、你正在考虑是否投资100万元开设一家饭店。假设情况是这样的:你决定开,则的概率你讲收益300万元(包括投资),而的概率你将全部亏损;如果你不开,则你能保住本钱但也不会有利润,请你(a)用得益矩阵和扩展形式表示该博弈;(b)如果你是风险中性的,你会怎样选择?(c)如果你是风险规避的,且期望得益的折扣系数为,你的策略选择是什么?(d)如果你是风险偏好的,期望得益折算系数为,你的选择又是什么? 7、一逃犯从关押他的监狱中逃走,一看守奉命追捕。如果逃犯逃跑有两条可选择的路线,看守只要追捕方向正确就一定能抓住逃犯。逃犯逃脱可以少坐10年牢,但一旦被抓住则要加刑10年;看守抓住逃犯能得到1000元奖金。请分别用得益矩阵和扩展形式表示该博弈,并作简单分析。 第二章完全信息静态博弈 1、上策均衡、严格下策反复消去法和纳什均衡相互之间的关系是什么? 2、为什么说纳什均衡是博弈分析中最重要的概念? 3、找出现实经济或生活中可以用帕累托上策均衡、风险上策均衡分析的例子。 4、多重纳什均衡是否会影响纳什均衡的一致预测性质,对博弈分析有什么不利影响? 5、下面的得益矩阵表示两博弈方之间的一个静态博弈。该博弈有没有纯策略纳什均衡?博弈的结果是什么? 6、求出下图中得益矩阵所表示的博弈中的混合策略纳什均衡。 7、博弈方1和2就如何分10 000元进行讨价还价。假设确定了以下规则:双方同时提出自己要求的数额S1和S2,0≤s1,s2≤10 000,如果s1+s2≤10 000,则两博弈方的要求都得到满足,即分别得到s1和s2,但如果是s1+s2>10 000,则该笔钱就被没收。问该博弈的纯策略纳什均衡是什么?如果你是其中一个博弈方,你会要求什么数额,为什么? 8、设古诺模型中有n家厂商、qi 为厂商i的产量,Q=q1+…+qn 为市场总产量、P为市场出清价格,且已知P=P(Q)=a-Q(当Q<a时,否则P=0)。假设厂商i生产qi产量的总成本为Ci=Ci(qi)=cqi,也就是说没有固定成本且各厂商的边际成本都相同,为常数c(c<a).假设各厂商同时选择产量,该模型的纳什均衡是什么?当n趋向于无穷大时博弈分析是否仍然有效? 9、两寡头古诺模型,P(Q)=a-Q等与上题相同,但量厂商的边际成本不同,分别为c1和c2。如果0<ci <a/2,问纳什均衡产量各为多少?如果c1<c2<a,但2c2>a+c1,则纳什均衡产量又为多少? 10、甲乙两公司分属两个国家,在开发某种新产品方面有下面得益矩阵表示的博弈关系(单位:百万美元)。该博弈的纳什均衡有哪些?如果乙公司所在国政府想保护本国公司利益,有什么好的办法? 11、设一个地区选民的观点标准分布于【0,1】上,竞选一个公职的每个候选人同时宣布他们的竞选立场,即选择0到1之间的一个点。选民将观察候选人们的立场,然后将选票投给立场与自己的观点最接近的候选人。例如有两个候选人,宣布的立场分别为x1=和x2=,那么观点在x=左边的所有选民都会投候选人1的票,而观点在x=右边的选民都会投候选人2的票,候选人1将以60%的选票获胜。再设如果又候选人的立场相同,那么立场相同的候选人将平分该立场所获得的选票,得票领先的候选人票数相同时则用抛硬币决定哪个候选人当选。我们假设候选人唯一关心的知识当选(即不考虑自己对观点的真正偏好),如果又两个候选人,问纯策略纳什均衡是什么?如果又三个候选人,也请作出一个纳什均衡。 12、运用本章的均衡概念和思想讨论下列得益矩阵表示的静态博弈。

博弈论案例分析

(1)失火了,你往哪个门跑 失火了,你往哪个门跑——这就是博弈论 一天晚上,你参加一个派对,屋里有很多人,你玩得很开心。这时候,屋里突然失火,火势很大,无法扑灭。此时你想逃生。你的面前有两个门,左门和右门,你必须在它们之间选择。但问题是,其他人也要争抢这两个门出逃。如果你选择的门是很多人选择的,那么你将因人多拥挤、冲不出去而烧死;相反,如果你选择的是较少人选择的,那么你将逃生。这里我们不考虑道德因素,你将如何选择?这就是博弈论! 你的选择必须考虑其他人的选择,而其他人的选择也考虑你的选择。你的结果——博弈论称之为支付,不仅取决于你的行动选择——博弈论称之为策略选择,同时取决于他人的策略选择。你和这群人构成一个博弈(game)。 上述博弈是一个叫张翼成的中国人在1997年提出的一个博弈论模型,被称之为少数者博弈或少数派博弈(Minority Game)。当然,原来的博弈形式不是这么简单,这里我把它简化了,我们在第三部分论述归纳推理时还要谈这个博弈模型。现在很多学者在研究这个问题。 生活中博弈的案例很多,你会见到很多例子。只要涉及到人群的互动,就有博弈。 什么叫博弈?博弈的英文为game,我们一般将它翻译成“游戏”。而在西方,game的意义不同于汉语中的游戏。在英语中,game即是

人们遵循一定规则下的活动,进行活动的人的目的是使自己“赢”。奥林匹克运动会叫Olympic Games。在英文中,game有竞赛的意思,进行game的人是很认真的,不同于汉语中游戏的概念。在汉语中,游戏有儿戏的味道。因此将关于game的理论,即game theory翻译成博弈论或者对策论,是恰当的。本书下面统称game theory为博弈论。 博弈论的出现只有50多年的历史。博弈论的开创者为诺意曼与摩根斯坦,他们1944年出版了《博弈论与经济行为》。诺意曼是着名的数学家,他同时对计算机的发明作出了巨大贡献,他去世时博弈论还未对经济学产生广泛影响,否则经济学的诺贝尔奖肯定有他的名字,因为诺贝尔奖有规定,只颁发给在世的学者。谈到博弈论,不能忽略博弈论天才纳什(John Nash)。纳什的开创性论文《n人博弈的均衡点》(1950)、《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。今天博弈论已发展成一个较完善的学科。 博弈论对于社会科学有着重要的意义,它正成为社会科学研究范式中的一种核心工具,以至于我们可称博弈论是“社会科学的数学”,或者说是关于社会的数学。从理论上讲,博弈论是研究理性的行动者(agents)相互作用的形式理论,而实际上它正深入到经济学、政治学、社会学等等,被各门社会科学所应用。甚至有学者声称要用博弈论重新改写经济学。1994年经济学诺贝尔奖颁发给三位博弈论专家:纳什、塞尔屯、哈桑尼(),而像1985年获得诺贝尔奖的公共选择学派的领导者布坎南,1995年获得诺贝尔奖的理性主义学派的领袖卢

博弈论导论

Game Theory? Theodore L.Turocy Texas A&M University Bernhard von Stengel London School of Economics CDAM Research Report LSE-CDAM-2001-09 October8,2001 Contents 1What is game theory?4 2De?nitions of games6 3Dominance8 4Nash equilibrium12 5Mixed strategies17 6Extensive games with perfect information22 7Extensive games with imperfect information29 8Zero-sum games and computation33 9Bidding in auctions34 10Further reading38 ?This is the draft of an introductory survey of game theory,prepared for the Encyclopedia of Information Systems,Academic Press,to appear in2002.

Glossary Backward induction Backward induction is a technique to solve a game of perfect information.It?rst consid-ers the moves that are the last in the game,and determines the best move for the player in each case.Then,taking these as given future actions,it proceeds backwards in time, again determining the best move for the respective player,until the beginning of the game is reached. Common knowledge A fact is common knowledge if all players know it,and know that they all know it,and so on.The structure of the game is often assumed to be common knowledge among the players. Dominating strategy A strategy dominates another strategy of a player if it always gives a better payoff to that player,regardless of what the other players are doing.It weakly dominates the other strategy if it is always at least as good. Extensive game An extensive game(or extensive form game)describes with a tree how a game is played. It depicts the order in which players make moves,and the information each player has at each decision point. Game A game is a formal description of a strategic situation. Game theory Game theory is the formal study of decision-making where several players must make choices that potentially affect the interests of the other players.

博弈论的经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两 人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A来说,囚徒B有坦白和不坦白两种可能的选择,假设囚徒B的选择是不坦白,则对囚徒A来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B选择的是坦白,则囚徒A不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B采取何种策略囚徒A的选择只有一种,即坦白,因为在 另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B的唯一 的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则 使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已 经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的 也就会与她一起看时装表演。

博弈论导论

博弈论导论 《博弈论》 主讲:李少斌 Tel:85221808 Email:tlishb@https://www.sodocs.net/doc/c218731139.html, 第0章《博弈论》导论 《博弈论》研究什么, Game Theory 游戏理论,对策论,博弈论 下棋与博弈: 博弈论研究的问题决策及其均衡问题理性经济人(智能的) 行为互动假设:相互影响 经济学研究假设基础 经济学研究内容: 经济学研究的假设基础: 理性经济人新古典经济学的两个基本假定: 完全竞争市场不存在信息不对称问题 博弈论的研究范式 传统经济学研究范式:生产或消费的决策者在做出决策时,假设价格是固定不变的,以此使其效用最大化。决策者是价格的接受者博弈论的突破:决策时考虑到主体的决策行为是互相影响的,即局中人决策时将考虑到其竞争对手的行为,并且预料到竞争对手对其行为的策略式反应;个人的最优选择是其他人选择的函数。价格影响者:互动,相互影响 一、生活中的博弈现象 海滩占位问题 : 二人对称矩阵博弈: 二人矩阵博弈:智猪博弈 公共产品供给问题: 1、海滩占位问题

两个卖矿泉水的小商贩为了争夺在海滩上日光浴的顾客,假若晒太阳的人们在1公理长的沙滩上均匀分布,试问:两个商贩将如何布局, 海滩占位问题求解 帕累托最优: 纳什均衡: 类似的例子 电视台的娱乐节目竞争现象(节目克隆) 总统竞选的竞选纲领问题(尽量争取中间选民) 超市的布局问题不同航空公司飞往同一目的地的航班现象地方政府竞相设立开发区 支付函数的矩阵博弈问题 在现实中最常见的博弈问题通常是二人博弈问题,每一博弈方的行动选择通常只有两种,在这样的博弈问题中双方的得益函数通常可用一个矩阵来描述。如图: 参与人B 参与人A U L a, e R b, f D c, g d, h 2、二人对称矩阵博弈 考查二人对称博弈。双方各有合作和不合作两种策略,其得益支付矩阵如下。由其相对大小确定了不同类型的博弈问题。这里,合作理解为投对方所好,或者说选择对方所希望的策略;不合作可理解为背叛。参与人B 合作不合作合作参与人A 不合作 r, r t, s s, t p, p (1)囚徒困境博弈(t,r,p,s)

博弈论课后习题

博弈论课后习题 Document serial number【UU89WT-UU98YT-UU8CB-UUUT-UUT108】

第一章导论 1、什么是博弈博弈论的主要研究内容是什么 2、设定一个博弈模型必须确定哪几个方面 3、举出烟草、餐饮、股市、房地产、广告、电视等行业的竞争中策略相互依存的例子。 4、“囚徒的困境”的内在根源是什么举出现实中囚徒的困境的具体例子。 5、博弈有哪些分类方法,有哪些主要的类型 6、你正在考虑是否投资100万元开设一家饭店。假设情况是这样的:你决定开,则的概率你讲收益300万元(包括投资),而的概率你将全部亏损;如果你不开,则你能保住本钱但也不会有利润,请你(a)用得益矩阵和扩展形式表示该博弈;(b)如果你是风险中性的,你会怎样选择(c)如果你是风险规避的,且期望得益的折扣系数为,你的策略选择是什么(d)如果你是风险偏好的,期望得益折算系数为,你的选择又是什么 7、一逃犯从关押他的监狱中逃走,一看守奉命追捕。如果逃犯逃跑有两条可选择的路线,看守只要追捕方向正确就一定能抓住逃犯。逃犯逃脱可以少坐10年牢,但一旦被抓住则要加刑10年;看守抓住逃犯能得到1000元奖金。请分别用得益矩阵和扩展形式表示该博弈,并作简单分析。 第二章完全信息静态博弈 1、上策均衡、严格下策反复消去法和纳什均衡相互之间的关系是什么

2、为什么说纳什均衡是博弈分析中最重要的概念 3、找出现实经济或生活中可以用帕累托上策均衡、风险上策均衡分析的例子。 4、多重纳什均衡是否会影响纳什均衡的一致预测性质,对博弈分析有什么不利影响 5、下面的得益矩阵表示两博弈方之间的一个静态博弈。该博弈有没有纯策略纳什均衡博弈的结果是什么 6、求出下图中得益矩阵所表示的博弈中的混合策略纳什均衡。 7、博弈方1和2就如何分10 000元进行讨价还价。假设确定了以下规则:双方同时提出自己要求的数额S1和S2,0≤s1,s2≤10000,如果 s1+s2≤10 000,则两博弈方的要求都得到满足,即分别得到s1和s2,但如果是s1+s2>10 000,则该笔钱就被没收。问该博弈的纯策略纳什均衡是什么如果你是其中一个博弈方,你会要求什么数额,为什么 8、设古诺模型中有n家厂商、qi 为厂商i的产量,Q=q1+…+qn 为市场总产量、P为市场出清价格,且已知P=P(Q)=a-Q(当Q<a时,否则 P=0)。假设厂商i生产qi产量的总成本为Ci=Ci(qi)=cqi,也就是说没有固定成本且各厂商的边际成本都相同,为常数c(c<a).假设各厂商同时选择产量,该模型的纳什均衡是什么当n趋向于无穷大时博弈分析是否仍然有效 9、两寡头古诺模型,P(Q)=a-Q等与上题相同,但量厂商的边际成本不同,分别为c1和c2。如果0<ci<a/2,问纳什均衡产量各为多少如果c1<c2<a,但2c2>a+c1,则纳什均衡产量又为多少

博弈论的经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

相关主题