搜档网
当前位置:搜档网 › 博弈论(2)

博弈论(2)

第一章完全信息静态博弈

博弈论的基本概念及战略式表述

纳什均衡

纳什均衡应用举例

混合战略纳什均衡

纳什均衡的存在性与多重性

第一节

博弈论的基本概念与战略式表述

博弈论的基本概念与战略式表述博弈论(game theory )是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。

博弈的战略式表述:G={N,(S i )i ∈N ,(U i )i ∈N }有三个基本要素:

(1)参与人(players )i ∈N={1,2,…,n};

(2)战略(strategies ),s i ∈S i (战略空间);

(3)支付(payoffs ),u i =u i (s -i ,s i )。

均衡与均衡结果

均衡战略(坦白,坦白)均衡支付(-6,-6)

第二节纳什均衡

占优战略均衡

重复剔除的占优战略均衡

纳什均衡

完全信息静态博弈的几点特性

同时出招,出招一次;

知道博弈结构与游戏规则(共同知识); 不管是否沟通过,无法做出有约束力的承诺(非合作)

一、占优战略均衡

占优战略:不管对手战略为何,该参与人可找到一最佳战略。

定义:在博弈G={N,(S i )i ∈N ,(U i )i ∈N }中,如果对所有的参与人i,s i *是它的占优战略,那么所有参与人选择的战略组合(s 1*,…,s n *)成为该对策的占优战略均衡。

“囚犯困境”的扩展

两个寡头企业选择产量

公共产品的供给

军备竞赛

经济改革

结论:一种制度安排,要发生效力。必须是一种纳什均衡;否则,制度安排便不能成立。

案例2:智猪博弈

猪圈里圈两头猪,一头大猪,一头小猪。猪圈的一头有一个猪食槽,另一头安装一个按钮,控制着猪食的供应。按一下按钮会有10个单位的猪食进槽,但谁按按钮谁就要付出2个单位的成本。若大

猪先到,大猪吃到9个单位,小猪只能

吃1个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃6个单位,小猪吃4个单位。支付如表。

智猪博弈的扩展

股份公司承担监督经理职能的大股东与小股东

股票市场上炒股票的大户与小户

市场中大企业与小企业在研发、广告上的博弈

公共产品的提供(富户与穷户)

改革中不同利益分配对改革的推动

二、重复剔除的占优战略均衡 绝对劣势战略:s i 是一绝对劣势战略当且仅当存在另一战略s i ’∈S i 使得u i (s i ,s -i )< u i (s i ’,s -i ) 对所有s -i ∈S -i 均成立。(s i ’未必是优势战略)

重复剔除的占优战略均衡:逐次删去绝对劣势战略得到唯一的占优战略。

三、纳什均衡

定义:指一战略组合有以下特性:当参与人持此战略后,任一参与人均无诱因偏离这一均衡;s*=(s 1*,…,s n *)=(s i *,s -i *)是一纳什均衡,当且仅当对所有参与人而言,u i (s i *,s -i *)≥u i (s i ’,s -i *)对所有s i ’∈S i 均成立。简单而言,当s 1*是对s 2*的最适反应,s 2*也是s 1*的最适反应时,(s 1*,s 2*)就是二人博弈的纳什均衡。

命题1:纳什均衡在占优战略重复剔除解法中不会被剔除 命题2:重复剔除的严格占优战略均衡一定是纳什均衡。

博弈论作业汇总

第1次作业 1、考虑一个工作申请的博弈。两个学生同时向两家企业申请工作,每家企业只有一个工作岗位。工作申请规则如下:每个学生只能向其中一家企业申请工作;如果一家企业只有一个学生申请,该学生获得工作;如果一家企业有两个学生申请,则每个学生获得工作的概率为1/2。现在假定每家企业的工资满足:W1/2

耶鲁大学公开课 博弈论 原文讲稿仔细整理注释 第2讲

ECON-159: GAME THEORY Lecture 2 - Putting Yourselves into Other People's Shoes [September 10, 2007] Chapter 1.Recap of Previous Lecture: Prisoners' Dilemma and Payoffs [00:00:00] Professor Ben Polak: Okay, so last time we looked at and played this game. You had to choose grades, so you had to choose Alpha and Beta, and this table told us what outcome would arise. In particular, what grade you would get and what grade your pair would get. So, for example, if you had chosen Beta and your pair had chosen Alpha, then you would get a C and your pair would get an A. One of the first things we pointed out, is that this is not quite a game yet. It's missing something. This has outcomes in it, it's an outcome matrix, but it isn't a game, because for a game we need to know payoffs. Then we looked at some possible payoffs, and now it is a game. So this is a game, just to give you some more jargon, this is a normal-form game. And here we've assumed the payoffs are those that arise if players only care about their own grades, which I think was true for a lot of you. It wasn't true for the gentleman who's sitting there now, but it was true for a lot of people. We pointed out, that in this game, Alpha strictly dominates Beta. What do we mean by that? We mean that if these are your payoffs, no matter what your pair does, you attain a higher payoff from choosing Alpha, than you do from choosing Beta. Let's focus on a couple of lessons of the class before I come back to this. One lesson was, do not play a strictly dominated strategy. Everybody remember that lesson? Then much later on, when we looked at some more complicated payoffs and a more complicated game, we looked at a different lesson which was this: put yourself in others' shoes to try and figure out what they're going to do. So in fact, what we learned from that is, it doesn't just matter what your payoffs are -- that's obviously important -- it's also important what other people's payoffs are, because you want to try and figure out what they're going to do and then respond appropriately. So we're going to return to both of these lessons today. Both of these lessons will reoccur today. Now, a lot of today is going to be fairly abstract, so I just want to remind you that Game Theory has some real world relevance. Again, still in the interest of recapping, this particular game is called the Prisoners' Dilemma. It's written there, the Prisoners' Dilemma. Notice, it's Prisoners, plural. And we mentioned some examples last time. Let me just reiterate and mention some more examples which are actually written here, so they'll find their way into your notes. So, for example, if you have a joint project that you're working on, perhaps it's a homework assignment, or perhaps it's a video project like these guys, that can turn into a Prisoners' Dilemma. Why? Because each individual might have an incentive to shirk. Price competition -- two firms competing with one another in prices -- can have a Prisoners' Dilemma aspect about it. Why? Because no matter how the other firm, your competitor, prices you might have an incentive to undercut them. If both firms behave that way, prices will get driven down towards marginal cost and industry profits will suffer. In the first case, if everyone shirks you end up with a bad product. In the second case, if both firms undercut each other, you end up with low prices, that's actually good for consumers but bad for firms. Let me mention a third example. Suppose there's a common resource out there, maybe it's a fish stock or maybe it's the atmosphere. There's a Prisoners' Dilemma aspect to this too. You might have an incentive to over fish. Why? Because if the other countries with this fish stock--let's say the fish stock is the Atlantic--if the other countries are going to fish as normal, you may as well fish as normal too. And if the other countries aren't going to cut down on their fishing, then you want to catch the fish now, because there aren't going to be any there tomorrow.

博弈论(课一)

课程内容和时间安排 第一讲:概述(第一、二章) 第二讲:术语解读和基本假设(第三、四章) 第三讲:囚犯困境和破解之道(第五、六、七章)第四讲:万元陷阱和智猪博弈(第八、九章) 第五讲:懦夫博弈和性别战(第十、十一章)

博弈学 -----博览全局对弈棋局课一 博弈在中国的理解--略观围棋,法于用兵,怯者无功,贪者先亡。 西方国家的理解--Game fair play。 (中国人在博弈中关注的是获胜,西方人在博弈中关注的是怎么玩的开心。) 博弈可以在工作领域,可以在社交往来,可以在家庭相处,无处不在,博大精深。 知人者智,自知者明; 胜人者力,自胜者强; 小胜者术,大胜者德。

推荐书刊 1、蒋文华:《用博弈的思维看世界》,浙江大学出版社,2014年。 2、张维迎:《博弈论与信息经济学》,上海三联书店,上海人民出版社,1996年。 3、詹姆斯·米勒:《活学活用博弈论-如何利用博弈论在竞争中取胜》,中国财政经济出版社,2006年。 4、阿维纳什·K ·迪克西特、巴里·J ·奈尔伯夫:《策略思维》,中国人民大学出版社,2002年。 5、阿维纳什·K ·迪克西特、巴里·J ·奈尔伯夫:《妙趣横生博弈论》,机械工业出版社,2009年。 博弈 指在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与人依据所掌握的信息,选择各自的策略(行动),以实现利益最大化的过程。 故事1,两人同行打猎,忽遇一猛狮。一人卸下身上物品狂奔,同伴不解,问道:“汝能胜狮?”答曰:“非需胜狮,只需胜汝!” (博弈既可以是竞争,也可以是合作! ) 游戏1,每位同学写1个介于1与100之间的自然数(整数,包括1与100在内),然后求出所有数字的平均数,如果你所写的数字最接近该平均数的二分之一,那么你将在游戏中胜出。(博弈,必须学会换位思考!)

博弈论作业

关于中国城市交通拥堵的博弈论分析 随着现代化发展和人民生活水平提高,城市马路上车流量越来越大,人们出行时感觉拥堵。公共交通优先发展是城市交通问题获得解决的有效举措,也是城市交通实现可持续发展的内在要求。目前我国很多城市相继出台和实施了多元化的优惠公交政策,鼓励公交优先发展。 博弈论是研究互动环境下具有竞争或对抗性质的博弈行为的理论和方法。博弈论作为分析和解决冲突和合作的工具,在管理科学、国际政治、生态学等领域得到了广泛的应用。博弈论研究的问题是,给定信息结构下,决策主体的决策如何使自己的效用最大化,并可以在其他决策主体中取得均衡。一个基本博弈由博弈三要素构成,即决策主体,策略集及效用。其中,决策主体是指参与人或局中人;策略集,即信息结构,是决策主体可以选择策略及行动的范围;效用,即偏好或支付函数,是指可以被量化的决策主体的利益。 在城市交通中,车辆与车辆之间、车辆与行人之间以及行人与警察之间,每天不间断地发生着竞争、互动和选择。可以说,在城市交通过程中,无时无刻不存在着博弈。用博弈论来分析城市交通问题,可使我们对身边的交通现象有更深的感悟和理解。 在城市交通博弈过程中,所对应的基本要素可理解如下: 局中人:各种交通参与者,包括机动车、非机动车、行人。 策略:出行时,采用什么出行方式是其策略,步行、骑自行车、乘公交车、自驾车等;交通过程中,遵守或不遵守交通法规也是其策略。局中人在不同的博弈中会有不同的策略。 得失:不同的出行方式,会有不同的成本和收益,出行者一般只会考虑到自己在选择某种交通方式时将要付出的成本,而不会考虑到自己的出行会给其他人带来什么影响;交通过程中,遵守或不遵守交通法规也会有不同的得失。 最后得出博弈的结果——不同的博弈会有不同的结果。 我们可以试着以博弈论的视角分析拥堵问题: 囚徒困境模型分析。囚徒困境是指两个被捕的囚徒之间的一种博弈,解释了为什么合作对双方都有利时,保持合作也是困难的,具体内容如下。警方逮捕了甲、乙两名嫌疑犯,但没有足够的证据证明二人有罪。于是警方分开囚禁两名嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证指证对方犯罪(即背叛对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。若二人都保持沉默(即双方合作),则二人同样判监1年。若二人都互相背叛,则二人分别判监8年 从上图的四种行动选择组合中,我们可以看出(沉默、沉默)是帕累托最优的,“背叛”是任一犯罪嫌疑人的占优战略,而(背叛、背叛)是一个占优战略均衡。 囚徒困境模型属于博弈论中的非零和博弈,表明个人最佳选择并非团体最佳选择。城市交通拥堵问题的本质是“公共地悲剧”。在共享公有物的社会中,每个人,也就是所有人都追求各自的最大利益,这就是悲剧的所在。因为对公共资源的无限制和过度使用,必然会给所有人带来毁灭。在城市交通领域,由于私人小汽车无限制的发展,造成了整个城市,特别是

电大 《经济学与生活》第2次平时作业答案

电大《经济学与生活》第2次平时作业答案 一、配伍题(将名词解释的标号填在名词前的括号里。每小题1分,共10分) (B)1.总效用 (C)2.边际效用 (A)3.收入效应 (D)4.替代效应 (H)5.二级价格歧视 (F)6.纳什均衡 (E)7.博弈论 (I)8.三级价格歧视 (G)9.边际效用递减规律 (J)10.巿场失灵 A.由于商品价格变动而引起的消费者实际收入的变动对需求数量产生的影响。 B.消费者在一定时间内消费一定数量商品或服务所带来的满足程度的总和。 C.在一定时间内消费者增加一个单位商品或服务所带来的新增效用。 D.指商品价格的变动而引起的相对产品价格变化对商品需求数量产生的影响。 E.研究多个个体或团队之间在特定条件制约下的对局中,利用相关方的策略而实施对应策略的学科。 F.所有参与人最优策略组成的策略组合 G.一个人连续消费某种物品时,随着所消费的该物品的数量增加,其总效用虽然相应增加,但物品的边际效用有递减的趋势。 H.即垄断厂商了解消费者的需求曲线,把这种需求曲线分为不同段,根据不同购买量,确定不同价格,垄断者获得一部分而不是全部买主的消费剩余。

I.垄断厂商对不同市场的不同消费者实行不同的价格,在实行高价格的市场上获得超额利润。 J.指巿场无法有效率地分配商品和劳务的情况。 1.消费者从物品与劳务的消费中得到的满足程度称为(B)。 A.欲望B.效用 C.边际效用 D.偏好2.某人愿意用20元买第一件衬衫,愿意用35元买头二件衬衫。第二件衬衫的边际效用是(C)。 A.55 B.35 C.15 D.27.5 3.同一条无差异曲线上的不同点表示(B)。 A.效用水平相同,所消费的两种商品组合比例也相同 B.效用水平相同,所消费的两种商品组合比例不同 C.效用水平不同,所消费的两种商品组合比例也不同 D.效用水平不同,所消费的两种商品组合比例也相同 4.在消费者收入与商品价格既定条件下,消费者所能购买到的两种商品数量的最大组合的线叫做(B)。 A.无差异曲线B.消费者预算约束线 C.等产量线 D.企业预算线 5.消费者剩余是消费者的(B)。 A.实际所得B.主观感觉

博弈论第2次作业

第2次作业 1.在三寡头的市场中,市场的逆需求函数为三家产量之和Q Q a p ,-=,每家企业的不变边际成本为c ,固定成本为0。如果企业1首先选择产量,企业2和企业3观察到企业1的产量后同时选择产量,则均衡时的市场价格。 给定企业1的产量q1,企业2和企业3的最优化问题分别为 ()23210m ax 2q c q q q a q ----≥, ()33210m ax 3q c q q q a q ----≥从而得到企业2和企 业3的最优反应函数为q 2=231q q c a ---,q 3=2 21q q c a ---,联立得纳什均衡为:q N 2=31q c a --,q N 3=3 1q c a --.给定企业2和企业3的最优反应,企业1的最优化问题为:()13210m ax 1q c q q q a N N q ----≥,由此得企业1的最优产量为 2 c a -,q 2=q 3=6 c a - 2、两个寡头企业进行价格竞争博弈,企业1的利润函数是q c aq p ++--=21)(π,企业2的利润函数是p b q +--=22)(π,其中p 是企业1的价格,q 是企业2的价格。 求: (1)两个企业同时决策的纯策略纳什均衡; (2)企业1先决策的子博弈完美纳什均衡; (3)企业2先决策的子博弈完美纳什均衡; (4)是否存在参数c b a ,,的特定值或范围,使两个企业都希望自己先决策?

(1):(a b-c ,b ) (2):(a b-c ,b ) (3):(a 2/2+ab-c ,a/2+b ) (4):a<0,b>-a/2,c

博弈论第二章

2 完全信息的动态博弈 2.1完全和完美信息的动态博弈 动态博弈(dynamic game):参与人在不同的时间选择行动。 完美信息(perfect information): 在博弈的每次行动的参与人完全知道博弈的历史。 2.1.A 理论: 逆向归纳法 简单的完全和完美信息博弈: 1. 参与人 1 选择行动a 1 2. 参与人 2 观察a 1,然后选择a 2 3. 收益是 u 1(a 1, a 2)和u 2(a 1, a 2) 求解博弈: 逆向归纳法 (backward induction) 1. 求解第二个阶段,对于a 1,求a 2 2 2max A a ∈u 2(a 1,a 2) 其解: a 2= R 2(a 1) ---- 反应函数 2. 求解第一个阶段 1 1m a x A a ∈ u 1(a 1,R 2(a 1)) 其解: a *1 逆向归纳解(outcome): (a *1, R 2(a *1) ) 注意: 在动态博弈中,行动与战略是不同的概念; 逆向归纳解与纳什均衡是不同的概念。

关于逆向归纳法的理性假定 例1 1 L R 2 2 0 L'R' 1 1 1 L''R'' 3 0 0 2 用逆向归纳法: 第3步:参与人1 选择L''; 第2步:参与人2 选择L'; 第1步:参与人1 选择L 逆向归纳解: L(在第一个阶段结束)。 如果博弈在第一个阶段中不结束,可能原因是什么? 2.1.B Stackelberg 模型 二个企业,生产产量: q1, q2 市场需求: P = a–Q, 其中Q = q1 + q2 成本: C i (q i) = cq i, i = 1, 2. 利润:πi (q1, q2) = Pq i–C i (q i) = (a– (q1 + q2))q i–cq i, 博弈的顺序: (1) 企业1 选择q1≥ 0; (2) 企业2 观察q1然后选择q2≥ 0;

博弈论作业

课程名称:信息经济学与博弈论课程编号:SX0071F23 课程类型:非学位课考核方式:考查 学科专业:管理科学与工程年级:2014 级姓名:学号:10076140185 河北工程大学2014 ~ 2015学年第2学期研究生课程论文报告 基于GA一RL的进化博弈求解主从博弈结构的供应链协调问题摘要:供应链协调问题多数基于主从博弈结构建模,但如果研究对象是相对复杂的供应链结构,理论求解主从博弈问题就变得困难。因此从求解一对一的供应链协调问题开始,针对主从博弈问题的特点,利用个体学习的进化博弈仿真手段,设计了经销商利用经验分布的预期随机需求的信念更新模式与最优反应的决策模式,为生产商分别设计了基于强化学习的信念更新模式与基于遗传算法搜索策略空间的决策模式,并将两者有机结合,取得了博弈问题的均衡解并且验证该解与理论求解结果一致,为进一步求解复杂问题提供了新的途径。 关键词:供应链协调;进化博弈论;强化学习(RL);遗传算法(GA) Coordinating supply chain of Stackelberg game model based on evolutionary game with GA一RL Abstract: Problems of coordinating supply chain are based on Stackelberg game model, but if research object is complex supply chain, it is difficult to find equilibrium of Stackelberg game ,so evolutionary Game theory was introduced. According to characteristics of leaders and followers in Stackelberg game model, learning Meehan is designed for each Player respectively. An algorithm of reinforcement learning combined with genetic searching is proposed for leaders, and a learning model of best一reply is designed for followers(retailers). Keywords: supply chain coordination; evolutionary game theory; reinforcement learning(RL);genetic algorithm(GA) 1引言 供应链协调问题是研究如何订立协调机制使分散控制的供应链中个体与整体之间的目标一致,解决供应链中企业个体自身的优化目标与供应链整体的最优解相冲突的状况。目前关于不同协调机制研究可以分为以下几类,一类是根据数量给予价格折扣,如根据经销商的销售量给予目标折扣(Sale re-bate)的问题[1],根据订货量给予线性折扣(Quantity discount)的问题[2];第二类是根据

耶鲁大学博弈论_精简版

第一讲导论-五个入门结论 1.通过成绩博弈模型可以知道,不选择严格劣势策略,因为每次博弈会得到更好的收益。 2.通过囚徒的困境博弈模型可以知道,理性选择导致次优的结果(协商难以达成目的的原因不是因为缺少沟通,而是没有强制力)。 3.通过愤怒天使博弈模型可以知道,汝欲得之,必先知之;永远选择优势策略,选择非劣势策略,损失小,如果对手有优势策略则应以此作为选择策略的指导。 4.如果想要赢,就应该站在别人的立场去分析他们会怎么做。 第二讲学会换位思考 1.构成博弈要素包括,参与人,参与人的策略以及收益。 2.所谓严格优势策略,就是指不论对方采取什么策略,采取的这个策略总比采取其他任何策略都好的策略。 3.在博弈中剔出某些选择时需要站在别人的角度去思考结果,因为对手不会选择劣势策略;同时要考虑到对手也是一个理性的参与人。 4.在博弈中剔除某些选择是一种直接思考,同时也是作为一个理性参与人的选择。 第三讲迭代剔除和中位选民定理 1.在选民投票博弈模型中,通过不断地迭代以及剔除来决定策略,由此,我们得到了一种新的选择策略的方法:迭代剔除法。 2.选民投票博弈模型的结果与现实存在偏差,主要是因为:①现实中选民并不是均匀分布的;②选民通常根据候选人的性格而非政治立场来进行投票,而政治立场只是单一维度;③只适用于只有两个候选人的情况;④同时存在弃权票;⑤选民未必相信候选人所声明的立场。 3.建立模型,是为了更好的描述事实以激发灵感,模型是有重要的事是抽象而来,逐步增加约束条件完善模型观察结果,比较分析结果的变化。 第四节足球比赛与商业合作之最佳对策 1.点球博弈模型告诉我们,不要选择一个在任何情况或信念下都不是最佳对策的策略。 2.最佳对策:①参与人针对对手策略的定义:参与人i的策略s^i(简写成BR)是对手策略S-i的最佳对策,如果参与人i在对手的策略S-i下选S^i的收益弱优于其它对策Si`,这对参与人i的所有Si`都适用,则策略S^i是其它参与人策略S-i的最佳对策。S^i最大化了对手选S-i时我的收益;②最佳对策广义定义:参与人i的策略S^i是最佳策略(你对其他参与人可能采取的策略持信念P时的最佳策略),在参与人i仍持信念P的情况下选S^i 的获得预期收益比在同样的信念P下选其它的策略获得的预期收益都要高(对于所有可选的Si`均成立)即Eu(S^i,P)≥Eu(Si`,P) Si` in Si 我从Si选择可选策略时S^i而非S-i最大化了我的预期收益。 第五讲坏风气与银行挤兑 1.纳什均衡,即对任意一个此博弈内的参与者A,他所选择的策略是其他参与人所选策略的最佳策略。

博弈论基础作业及答案

博弈论基础作业 一、名词解释 纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡 贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识 见PPT 二、问答题 1.举出囚徒困境和智猪博弈的现实例子并进行分析。 囚徒困境的例子:军备竞赛;中小学生减负;几个大企业之间的争相杀价等等; 以中小学生减负为例:在当前的高考制度下,给定其他学校对学生进行减负,一个学校最好不减负,因为这样做,可以带来比其他学校更高的升学率。给定其他学校不减负,这个学校的最佳应对也是不减负。否则自己的升学率就比其他学校低。因此,不论其他学校如何选择,这个学校的最佳选择都是不减负。每个学校都这样想,所以每个学校的最佳选择都是不减负,因此学生的负担越来越重。 请用同样的方法分析其他例子。 智猪博弈的例子:大企业开发新产品;小企业模仿;股市中,大户搜集分析信息,散户跟随大户的操作策略 以股市为例:给定散户搜集资料进行分析,大户的最佳选择是跟随。而给定散户跟随,大户的最佳选择是自己搜集资料进行分析。但是不论大户是选择分析还是跟随,散户的最佳选择都是跟随。因此如果大户和散户是聪明的,并且大户知道散户也是聪明的,那么大户就会预见到散户会跟随,而给定散户跟随,大户只有自己分析。 请用同样的方法分析其他例子。 2.请用博弈论来说明“破釜沉舟”和“穷寇勿追”的道理。 破釜沉舟是一个承诺行动。目的是要断绝自己的退路,让自己无路可退,让自己决一死战变得可以置信。也就是说与敌人对决时,只有决一死战,这样才可以取得胜利。否则,如果不破釜沉舟,那么遇到困难时,就很有可能退却,也就无法取得胜利。穷寇勿追就是要给对方一个退路,由于有退路,对方就不会殊死抵抗。否则,对方退无可退,只有坚决抵抗一条路,因而必然决一死战。自己也会付出更大的代价。

生活中的博弈论感悟(优.选)

《生活中的博弈论》学习感悟 第一讲初试博弈论 生活中的资源是有限和稀缺的,于是就产生了竞争,这种竞争就需要一种形式把大家聚在一起,这种形式就是博弈。博弈论是在力图在最简单的假设下得到最大范围的推广和应用,其伟大在于对后世的引导和激发作用。博弈论不仅从古代就散发着智慧,还体现在我们生活中的种种小事中,如双方互拨打电话,放弃球赛陪女友逛街等。博弈论是建立在博弈双方或者多方都属于理性人的基础上,通过对自己以及博弈对手状况的了解、博弈环境的要求及变化等诸多因素,博弈者做出对自己最有利最保险的决策和行动,从而使得自己能达到获利或者获胜的目的。每个人都可以成为博弈高手,但人的决策又具有有限理性,因此博弈论也不是万能的。 第二讲纳什均衡 在某一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。从“纳什均衡”中我们还可以悟出一条真理:合作是有利的“利己策略”。但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲,勿施于我。

囚徒困境博弈反映个人最佳选择并非团体最佳选择。用囚徒困境博弈对两个势均力敌的竞争对手进行分析,可以发现合作是可以实现双赢的。如:两个公司互相竞争,二公司的广告互相影响,即一公司的广告较被顾客接受则会夺取对方的部分收入。但若二者同时期发出质量类似的广告,收入增加很少但成本增加。但若不提高广告质量,生意又会被对方夺走。此二公司可以有二选择:互相达成协议,减少广告的开支。(合作)增加广告开支,设法提升广告的质量,压倒对方。(背叛)若二公司不信任对方,无法合作,背叛成为支配性策略时,二公司将陷入广告战,而广告成本的增加损害了二公司的收益,这就是陷入囚徒困境。在现实中,要二互相竞争的公司达成合作协议是较为困难的,多数都会陷入囚徒困境中。 第四讲斗鸡博弈 所谓“斗鸡博弈”就是两只公鸡面对面斗争,继续斗下去,两败俱伤;一方退却便意味着认输。在这样的博弈中,要想取胜,就要在气势上压倒对方,至少要显示出破釜沉舟、被谁一站的决心来,以迫使对方退却。但到最后的关键时刻,必有一方要退下来,除非真正抱定鱼死网破的决心。学习了知识,就要善于联想,善于联系生活。在很多的时候我们都可能是在不知不觉中就使用了或者是接触到了博弈论,就像是平常我们和其他人之间的争执问题,每次都可能弄得脸红脖子粗的,双方都不服气,最终的结果是有一个人妥协,然后彼此达成一致;冷战期间的美苏两大军事集团的争斗也是一种“斗鸡博弈”。

博弈论与策略行为

博弈论与策略行为 G a m e T h e o r y a n d S t r a t e g y B e h a v i o r 蔡继明 教授/主任 清华大学政治经济学研究中心 Center for Political Economy at Tsinghua University CPET

目录 第一讲:导论 一、博弈论的研究对象 第二讲:占优战略与社会两难第三 讲:纳什均衡和双人博弈第四讲:三 人博弈与n人博弈第五讲:纯战略和 混合战略第六讲:博弈的合作解第 七讲:序贯博弈与子博弈完美均衡第 八讲:重复博弈第九讲:企业经营决 策的博弈分析第十讲:企业内部组织 分析第十一讲:政府行为分析 第一讲 导论 博弈论是研究理性的决策主体在其行为发生直 接的相互作用时的策略选择及策略均衡的理论。 博弈分析的关键步骤是找出在别人选择既定的情况 下自己的最优反应策略(给自己带来最大 收益的策略)。 二、博弈论的产生和发展 博弈又称博戏,是一门古老的游戏。 1. 博弈在中国《学弈》(《孟子 ?告 子》):弈秋,通国 之善弈也。使弈秋侮 二人 弈,其一人专心致志,惟 弈秋之为听;一人虽 听之,一心以为有鸿 鹄将至,思援弓缴而射 之。虽与之俱学,弗若 之矣。为是其智弗若 与?吾曰:非然也。 《世本》说,“乌曹作博”,乌曹乃是 夏代著名之能工巧匠。千百年来,博 弈更是与人们的生活紧紧相连,从博 棋到牌戏,从斗戏到彩票,中华民族 的历史长河中就这样形成了别具风情 的博弈文化 从孙子兵法到三十六计 从田忌赛马到孙庞斗智 从运筹帷幄到韬光养晦 从曹刿论战到论持久战

1

博弈论复习大纲下

博弈论第六讲--第九讲复习大纲 第六讲声誉和对称信息重复博弈 1、重复博弈(Repeated Game):是动态博弈的一种特殊情况。在重复博弈里,完全相同的环境一次次重复出现,参与人在重复出现的相同环境中做出决策。重复博弈是一类很重要的动态博弈。 2、有限次重复博弈例子:连锁店悖论:现象---博弈的重复进行对进入威慑博弈和囚徒困境的结果基本上没有影响;结论---在位者在包括第1个市场的所有市场上都将选择合谋。这个结论称为连锁店悖论。 通过对连锁店悖论的分析,得出结论:如果当事人完全理性,有限次重复博弈的均衡解和一次博弈没有区别。把这个结论推广到囚徒困境博弈中,就是说,尽管两个人都选择不坦白是集体最优的,但如果同样的博弈重复有限次,这个重复博弈的均衡仍然是(坦白,坦白)。 重复博弈比不重复进行的一次性博弈要复杂得多。在现实中,如果当事人不那么理性,或者看起来不那么理性,那么有限次重复博弈的结果有可能和一次博弈不同。那么在有限次博弈的囚徒困境中,就有可能实现(抵赖、抵赖)的结果。 3、无名氏定理:重复博弈中最重要也是最有名的结果是“无名氏定理”,该定理认为,只要局中人有足够的耐心,那么任何理性的可行盈利都可以在均衡中得以实施。换句话说,只要局中人的耐心足够地大,一次博弈中可行的理性结局总是可以与重复博弈中某均衡结局相一致。 无名氏定理告诉我们:在无限次重复博弈中声称完美均衡导致了某一特定的行为是没有意义的。 4、声誉:在重复进行的囚徒困境博弈里,只有博弈将重复进行无限次时,参与人才会选择合作。这是声誉的一个大问题。因为每个人都知道一个参与人将在最后一期选择坦白,那么为什么他们还要假设这个参与人会在目前建立起自己的声誉呢? 声誉应用: 5、折现率的概念以及无限次重复博弈中合作条件的推导,以产量卡特尔为例。 6、价格竞争对制造商的影响 7、进化与囚徒困境,鸽鹰博弈

博弈论作业上课用

1.可口可乐与百事可乐(参与者)的价格决策:双方都可以保持价格不变或者提高价格(策略);博弈的目标和得失情况体现为利润的多少(收益);利润的大小取决于双方的策略组合(收益函数);博弈有四种策略组合,其结局是: (1)如果双方都不涨价,各得利润10单位; (2)如果可口可乐不涨价,百事可乐涨价,可口可乐利润100,百事可乐利润-30; (3)如果可口可乐涨价,百事可乐不涨价,可口可乐利润-20,百事可乐利润30; (4)如果双方都涨价,可口可乐利润140,百事可乐利润35; 请写出博弈的战略式表述并求出纳什均衡。 2. 北方航空公司和新华航空公司分享了从北京到南方冬天度假胜地的市场。如果它们合作,各获得500000元的垄断利润,但不受限制的竞争会使每一方的利润降至60000元。如果一方在价格决策方面选择合作而另一方却选择降低价格,则合作的厂商获利将为零,竞争厂商将获利900000元。 (1)将这一博弈用战略式表述方式加以表示。 (2)解释为什么均衡结果可能是两家公司都选择竞争性策略。 3. 设啤酒市场上有两家厂商,各自选择是生产高价啤酒还是低价啤酒,相应的利润(单位:万元)由下图的得益矩阵给出:

(1 )有哪些结果是纳什均衡? (2)两厂商合作的结果是什么? 4. 根据两人博弈的损益矩阵回答问题: 甲 乙 左 右 上 下 (1)写出两人各自的全部策略。 (2 )找出该博弈的全部纯策略纳什均衡。 (3)求出该博弈的混合策略纳什均衡。 5.求出下面博弈的纳什均衡(含纯策略和混合策略)。 甲 乙 L R U D 6.企业甲和企业乙是两家彩电制造商,都可以选择生产低档产品和高档产品,每个企业在不同情况下的利润如以下支付矩阵所示,如果企业甲先于企业乙进行产品选择并投入生产,即企业乙在决定生产时已经知道企业甲的选择,而且这一点双方都清楚。 (1)用扩展式表述表示这一博弈。

经济博弈论第1次作业

博弈论第1次作业 1、两个人分4只乒乓球,每个人同时独立地提出自己想得到的球数。设参与人1想得到s 1只,参与人2想得到s 2只球,分配的规则是:如果s 1 + s 2 ≤4,那么每个参与人均能得到自己想要的数量;如果s 1 + s 2 >4,那么两个参与人什么也得不到。 (1)写出参与人1,2的战略空间S 1,S 2; (2)画出该博弈的双变量收益矩阵; (3)用划线法找出该博弈的全部纯战略纳什均衡。 2、精神病医生A 、B 同时在一条很长的公路边选择各自的诊所位置,这条公路用从0到1的区间表示。公路0到1/4这个区间属于俄勒冈州,从1/4到1这个区间属于加利福尼亚州。医生A (参与人1)同时拥有俄勒冈州和加利福尼亚州的行医执照,而医生B (参与人2)只有俄勒冈州的行医执照。假设病人沿这条公路是均匀分布的,每个病人都就近看病,每个医生的收益就是到他诊所就诊的病人比例。设医生A (参与人1)的战略空间(选择诊所的位置)为{}10,1/8,1/4,3/8,1/2,5/8,3/4,7/8,1 S =;医生B (参与人2)的战略空间为{}20,1/8,1/4S =。 (1) 试画出博弈的双变量收益矩阵; (2) 利用划线法找出该博弈的纯战略纳什均衡。 3、在下图所示的战略式表述的博弈中,有没有占优战略均衡?有没有重复剔除严格劣战略的占优均衡?有没有纳什均衡?如果有,请写出相应的均衡。 参与人2 参与人1 L M R U M D 4、下图是两人博弈的战略式表述形式,其中参与人1的战略空间S 1={U,D},参与人2的战略空间S 2={L,R}。

参与人2 L M 参与人1 U D 这里a ,b ,c ,d ,e ,f ,g ,h 为参数。 (1) 设S*=(U,L )是此博弈的严格占优战略均衡,问:上述参数之间应满 足哪些条件? (2) 设S*=(U,R )是此博弈的重复剔除严格劣战略的占优均衡,问:上述 参数之间应满足哪些条件?(用两种剔除顺序讨论) (3) 设S*=(D ,R )是此博弈的纳什均衡,问:上述参数之间应满足哪些 条件? (4) 设S 1*=(U ,L )和S 2*=(D ,R )是此博弈的纳什均衡,问:上述参数 之间应满足哪些条件?这时两个参与人有无严格劣战略? 5、求下图所示战略式表述的博弈的混合战略纳什均衡。 参与人2 L R 参与人1 U D 6 B A L R U D 7、A 、B A 企业可以获得18万元利润,B 企业可以获得10万元利润;若A 企业做广告,B 企业不做广告,A 企业可以获得30万元利润,B 企业可以获得4万元利润;若A 企业不做广告,B 企业做广告,A 企业可以获得13万元利润,B 企业可以获得16万元利润;若A 、B 两企业都不做广告,A 企业可以获得35万元利润,B 企业可以获得8万元利润。 试求:(1)画出A 、B 企业的支付矩阵。(2)求出该博弈的纯策略纳什均衡。 8、两个厂商生产一种完全同质的商品,该商品的市场需求函数为P Q -=100,设厂商1和厂商2都没有固定成本。若他们在相互知道对方边际成本的情况下,同时作出产量决策是分别生产20单位和30单位。问这两个厂商的边际成本各是多少?各自的利润是多少?

耶鲁大学——博弈论

中文片名: 耶鲁大学开放课程:博弈论 英文片名: Open Yale course:Game Theory 剧集分类: 悬疑 影片类型: 教学 资源格式: RMVB 上影时间: 2010 导演: 主演: 对白语言: 英语 字幕语种: 中英 介绍: 中文名: 耶鲁大学开放课程:博弈论 英文名: Open Yale course:Game Theory 版本: 更新完毕[MOV] 发行时间: 2009年 地区: 美国 对白语言: 英语 字语言: 英文 简介: 课程类型:经济 课程介绍: 这门课程是系统介绍有关博弈论和战略思想。比如支配思想、落后的感应、纳什均衡、进化稳定性、承诺,信誉,信息不对称,逆向选择等。并在课堂上提供了各种游戏以及经济、政治,电影和其他方面的案例来讨论。 关于课程主讲人: Ben Polak教授任职于耶鲁大学管理学院经济系。他在剑桥大学Trinity College获得学士学位,在西北大学获得硕士学位,在哈佛大学获得博士学位。他是微观经济理论和经济史方面的专家。他的论文在Economic Letters、Journal of Economic Theory、Journal of Economic History、Journal of Legal Studies、Journal of Theoretical and Institutional Economics、Econometrica等学术期刊多次发表。他最近的研究是“广义功利主义和海萨尼的公正观察员定理”和“平均分散的偏好” 课程结构: 本耶鲁大学课程每周在学校上两次课,每次75分钟,2007年秋季拍摄作为耶鲁大学开放课程之一。 课程安排: 1. Introduction: five first lessons

相关主题