第一章完全信息静态博弈
博弈论的基本概念及战略式表述
纳什均衡
纳什均衡应用举例
混合战略纳什均衡
纳什均衡的存在性与多重性
第一节
博弈论的基本概念与战略式表述
博弈论的基本概念与战略式表述博弈论(game theory )是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。
博弈的战略式表述:G={N,(S i )i ∈N ,(U i )i ∈N }有三个基本要素:
(1)参与人(players )i ∈N={1,2,…,n};
(2)战略(strategies ),s i ∈S i (战略空间);
(3)支付(payoffs ),u i =u i (s -i ,s i )。
均衡与均衡结果
均衡战略(坦白,坦白)均衡支付(-6,-6)
第二节纳什均衡
占优战略均衡
重复剔除的占优战略均衡
纳什均衡
完全信息静态博弈的几点特性
同时出招,出招一次;
知道博弈结构与游戏规则(共同知识); 不管是否沟通过,无法做出有约束力的承诺(非合作)
一、占优战略均衡
占优战略:不管对手战略为何,该参与人可找到一最佳战略。
定义:在博弈G={N,(S i )i ∈N ,(U i )i ∈N }中,如果对所有的参与人i,s i *是它的占优战略,那么所有参与人选择的战略组合(s 1*,…,s n *)成为该对策的占优战略均衡。
“囚犯困境”的扩展
两个寡头企业选择产量
公共产品的供给
军备竞赛
经济改革
结论:一种制度安排,要发生效力。必须是一种纳什均衡;否则,制度安排便不能成立。
案例2:智猪博弈
猪圈里圈两头猪,一头大猪,一头小猪。猪圈的一头有一个猪食槽,另一头安装一个按钮,控制着猪食的供应。按一下按钮会有10个单位的猪食进槽,但谁按按钮谁就要付出2个单位的成本。若大
猪先到,大猪吃到9个单位,小猪只能
吃1个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃6个单位,小猪吃4个单位。支付如表。
智猪博弈的扩展
股份公司承担监督经理职能的大股东与小股东
股票市场上炒股票的大户与小户
市场中大企业与小企业在研发、广告上的博弈
公共产品的提供(富户与穷户)
改革中不同利益分配对改革的推动
二、重复剔除的占优战略均衡 绝对劣势战略:s i 是一绝对劣势战略当且仅当存在另一战略s i ’∈S i 使得u i (s i ,s -i )< u i (s i ’,s -i ) 对所有s -i ∈S -i 均成立。(s i ’未必是优势战略)
重复剔除的占优战略均衡:逐次删去绝对劣势战略得到唯一的占优战略。
三、纳什均衡
定义:指一战略组合有以下特性:当参与人持此战略后,任一参与人均无诱因偏离这一均衡;s*=(s 1*,…,s n *)=(s i *,s -i *)是一纳什均衡,当且仅当对所有参与人而言,u i (s i *,s -i *)≥u i (s i ’,s -i *)对所有s i ’∈S i 均成立。简单而言,当s 1*是对s 2*的最适反应,s 2*也是s 1*的最适反应时,(s 1*,s 2*)就是二人博弈的纳什均衡。
命题1:纳什均衡在占优战略重复剔除解法中不会被剔除 命题2:重复剔除的严格占优战略均衡一定是纳什均衡。
第1次作业 1、考虑一个工作申请的博弈。两个学生同时向两家企业申请工作,每家企业只有一个工作岗位。工作申请规则如下:每个学生只能向其中一家企业申请工作;如果一家企业只有一个学生申请,该学生获得工作;如果一家企业有两个学生申请,则每个学生获得工作的概率为1/2。现在假定每家企业的工资满足:W1/2 ECON-159: GAME THEORY Lecture 2 - Putting Yourselves into Other People's Shoes [September 10, 2007] Chapter 1.Recap of Previous Lecture: Prisoners' Dilemma and Payoffs [00:00:00] Professor Ben Polak: Okay, so last time we looked at and played this game. You had to choose grades, so you had to choose Alpha and Beta, and this table told us what outcome would arise. In particular, what grade you would get and what grade your pair would get. So, for example, if you had chosen Beta and your pair had chosen Alpha, then you would get a C and your pair would get an A. One of the first things we pointed out, is that this is not quite a game yet. It's missing something. This has outcomes in it, it's an outcome matrix, but it isn't a game, because for a game we need to know payoffs. Then we looked at some possible payoffs, and now it is a game. So this is a game, just to give you some more jargon, this is a normal-form game. And here we've assumed the payoffs are those that arise if players only care about their own grades, which I think was true for a lot of you. It wasn't true for the gentleman who's sitting there now, but it was true for a lot of people. We pointed out, that in this game, Alpha strictly dominates Beta. What do we mean by that? We mean that if these are your payoffs, no matter what your pair does, you attain a higher payoff from choosing Alpha, than you do from choosing Beta. Let's focus on a couple of lessons of the class before I come back to this. One lesson was, do not play a strictly dominated strategy. Everybody remember that lesson? Then much later on, when we looked at some more complicated payoffs and a more complicated game, we looked at a different lesson which was this: put yourself in others' shoes to try and figure out what they're going to do. So in fact, what we learned from that is, it doesn't just matter what your payoffs are -- that's obviously important -- it's also important what other people's payoffs are, because you want to try and figure out what they're going to do and then respond appropriately. So we're going to return to both of these lessons today. Both of these lessons will reoccur today. Now, a lot of today is going to be fairly abstract, so I just want to remind you that Game Theory has some real world relevance. Again, still in the interest of recapping, this particular game is called the Prisoners' Dilemma. It's written there, the Prisoners' Dilemma. Notice, it's Prisoners, plural. And we mentioned some examples last time. Let me just reiterate and mention some more examples which are actually written here, so they'll find their way into your notes. So, for example, if you have a joint project that you're working on, perhaps it's a homework assignment, or perhaps it's a video project like these guys, that can turn into a Prisoners' Dilemma. Why? Because each individual might have an incentive to shirk. Price competition -- two firms competing with one another in prices -- can have a Prisoners' Dilemma aspect about it. Why? Because no matter how the other firm, your competitor, prices you might have an incentive to undercut them. If both firms behave that way, prices will get driven down towards marginal cost and industry profits will suffer. In the first case, if everyone shirks you end up with a bad product. In the second case, if both firms undercut each other, you end up with low prices, that's actually good for consumers but bad for firms. Let me mention a third example. Suppose there's a common resource out there, maybe it's a fish stock or maybe it's the atmosphere. There's a Prisoners' Dilemma aspect to this too. You might have an incentive to over fish. Why? Because if the other countries with this fish stock--let's say the fish stock is the Atlantic--if the other countries are going to fish as normal, you may as well fish as normal too. And if the other countries aren't going to cut down on their fishing, then you want to catch the fish now, because there aren't going to be any there tomorrow. 课程内容和时间安排 第一讲:概述(第一、二章) 第二讲:术语解读和基本假设(第三、四章) 第三讲:囚犯困境和破解之道(第五、六、七章)第四讲:万元陷阱和智猪博弈(第八、九章) 第五讲:懦夫博弈和性别战(第十、十一章) 博弈学 -----博览全局对弈棋局课一 博弈在中国的理解--略观围棋,法于用兵,怯者无功,贪者先亡。 西方国家的理解--Game fair play。 (中国人在博弈中关注的是获胜,西方人在博弈中关注的是怎么玩的开心。) 博弈可以在工作领域,可以在社交往来,可以在家庭相处,无处不在,博大精深。 知人者智,自知者明; 胜人者力,自胜者强; 小胜者术,大胜者德。 推荐书刊 1、蒋文华:《用博弈的思维看世界》,浙江大学出版社,2014年。 2、张维迎:《博弈论与信息经济学》,上海三联书店,上海人民出版社,1996年。 3、詹姆斯·米勒:《活学活用博弈论-如何利用博弈论在竞争中取胜》,中国财政经济出版社,2006年。 4、阿维纳什·K ·迪克西特、巴里·J ·奈尔伯夫:《策略思维》,中国人民大学出版社,2002年。 5、阿维纳什·K ·迪克西特、巴里·J ·奈尔伯夫:《妙趣横生博弈论》,机械工业出版社,2009年。 博弈 指在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与人依据所掌握的信息,选择各自的策略(行动),以实现利益最大化的过程。 故事1,两人同行打猎,忽遇一猛狮。一人卸下身上物品狂奔,同伴不解,问道:“汝能胜狮?”答曰:“非需胜狮,只需胜汝!” (博弈既可以是竞争,也可以是合作! ) 游戏1,每位同学写1个介于1与100之间的自然数(整数,包括1与100在内),然后求出所有数字的平均数,如果你所写的数字最接近该平均数的二分之一,那么你将在游戏中胜出。(博弈,必须学会换位思考!) 关于中国城市交通拥堵的博弈论分析 随着现代化发展和人民生活水平提高,城市马路上车流量越来越大,人们出行时感觉拥堵。公共交通优先发展是城市交通问题获得解决的有效举措,也是城市交通实现可持续发展的内在要求。目前我国很多城市相继出台和实施了多元化的优惠公交政策,鼓励公交优先发展。 博弈论是研究互动环境下具有竞争或对抗性质的博弈行为的理论和方法。博弈论作为分析和解决冲突和合作的工具,在管理科学、国际政治、生态学等领域得到了广泛的应用。博弈论研究的问题是,给定信息结构下,决策主体的决策如何使自己的效用最大化,并可以在其他决策主体中取得均衡。一个基本博弈由博弈三要素构成,即决策主体,策略集及效用。其中,决策主体是指参与人或局中人;策略集,即信息结构,是决策主体可以选择策略及行动的范围;效用,即偏好或支付函数,是指可以被量化的决策主体的利益。 在城市交通中,车辆与车辆之间、车辆与行人之间以及行人与警察之间,每天不间断地发生着竞争、互动和选择。可以说,在城市交通过程中,无时无刻不存在着博弈。用博弈论来分析城市交通问题,可使我们对身边的交通现象有更深的感悟和理解。 在城市交通博弈过程中,所对应的基本要素可理解如下: 局中人:各种交通参与者,包括机动车、非机动车、行人。 策略:出行时,采用什么出行方式是其策略,步行、骑自行车、乘公交车、自驾车等;交通过程中,遵守或不遵守交通法规也是其策略。局中人在不同的博弈中会有不同的策略。 得失:不同的出行方式,会有不同的成本和收益,出行者一般只会考虑到自己在选择某种交通方式时将要付出的成本,而不会考虑到自己的出行会给其他人带来什么影响;交通过程中,遵守或不遵守交通法规也会有不同的得失。 最后得出博弈的结果——不同的博弈会有不同的结果。 我们可以试着以博弈论的视角分析拥堵问题: 囚徒困境模型分析。囚徒困境是指两个被捕的囚徒之间的一种博弈,解释了为什么合作对双方都有利时,保持合作也是困难的,具体内容如下。警方逮捕了甲、乙两名嫌疑犯,但没有足够的证据证明二人有罪。于是警方分开囚禁两名嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证指证对方犯罪(即背叛对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。若二人都保持沉默(即双方合作),则二人同样判监1年。若二人都互相背叛,则二人分别判监8年 从上图的四种行动选择组合中,我们可以看出(沉默、沉默)是帕累托最优的,“背叛”是任一犯罪嫌疑人的占优战略,而(背叛、背叛)是一个占优战略均衡。 囚徒困境模型属于博弈论中的非零和博弈,表明个人最佳选择并非团体最佳选择。城市交通拥堵问题的本质是“公共地悲剧”。在共享公有物的社会中,每个人,也就是所有人都追求各自的最大利益,这就是悲剧的所在。因为对公共资源的无限制和过度使用,必然会给所有人带来毁灭。在城市交通领域,由于私人小汽车无限制的发展,造成了整个城市,特别是 电大《经济学与生活》第2次平时作业答案 一、配伍题(将名词解释的标号填在名词前的括号里。每小题1分,共10分) (B)1.总效用 (C)2.边际效用 (A)3.收入效应 (D)4.替代效应 (H)5.二级价格歧视 (F)6.纳什均衡 (E)7.博弈论 (I)8.三级价格歧视 (G)9.边际效用递减规律 (J)10.巿场失灵 A.由于商品价格变动而引起的消费者实际收入的变动对需求数量产生的影响。 B.消费者在一定时间内消费一定数量商品或服务所带来的满足程度的总和。 C.在一定时间内消费者增加一个单位商品或服务所带来的新增效用。 D.指商品价格的变动而引起的相对产品价格变化对商品需求数量产生的影响。 E.研究多个个体或团队之间在特定条件制约下的对局中,利用相关方的策略而实施对应策略的学科。 F.所有参与人最优策略组成的策略组合 G.一个人连续消费某种物品时,随着所消费的该物品的数量增加,其总效用虽然相应增加,但物品的边际效用有递减的趋势。 H.即垄断厂商了解消费者的需求曲线,把这种需求曲线分为不同段,根据不同购买量,确定不同价格,垄断者获得一部分而不是全部买主的消费剩余。 I.垄断厂商对不同市场的不同消费者实行不同的价格,在实行高价格的市场上获得超额利润。 J.指巿场无法有效率地分配商品和劳务的情况。 1.消费者从物品与劳务的消费中得到的满足程度称为(B)。 A.欲望B.效用 C.边际效用 D.偏好2.某人愿意用20元买第一件衬衫,愿意用35元买头二件衬衫。第二件衬衫的边际效用是(C)。 A.55 B.35 C.15 D.27.5 3.同一条无差异曲线上的不同点表示(B)。 A.效用水平相同,所消费的两种商品组合比例也相同 B.效用水平相同,所消费的两种商品组合比例不同 C.效用水平不同,所消费的两种商品组合比例也不同 D.效用水平不同,所消费的两种商品组合比例也相同 4.在消费者收入与商品价格既定条件下,消费者所能购买到的两种商品数量的最大组合的线叫做(B)。 A.无差异曲线B.消费者预算约束线 C.等产量线 D.企业预算线 5.消费者剩余是消费者的(B)。 A.实际所得B.主观感觉 第2次作业 1.在三寡头的市场中,市场的逆需求函数为三家产量之和Q Q a p ,-=,每家企业的不变边际成本为c ,固定成本为0。如果企业1首先选择产量,企业2和企业3观察到企业1的产量后同时选择产量,则均衡时的市场价格。 给定企业1的产量q1,企业2和企业3的最优化问题分别为 ()23210m ax 2q c q q q a q ----≥, ()33210m ax 3q c q q q a q ----≥从而得到企业2和企 业3的最优反应函数为q 2=231q q c a ---,q 3=2 21q q c a ---,联立得纳什均衡为:q N 2=31q c a --,q N 3=3 1q c a --.给定企业2和企业3的最优反应,企业1的最优化问题为:()13210m ax 1q c q q q a N N q ----≥,由此得企业1的最优产量为 2 c a -,q 2=q 3=6 c a - 2、两个寡头企业进行价格竞争博弈,企业1的利润函数是q c aq p ++--=21)(π,企业2的利润函数是p b q +--=22)(π,其中p 是企业1的价格,q 是企业2的价格。 求: (1)两个企业同时决策的纯策略纳什均衡; (2)企业1先决策的子博弈完美纳什均衡; (3)企业2先决策的子博弈完美纳什均衡; (4)是否存在参数c b a ,,的特定值或范围,使两个企业都希望自己先决策?耶鲁大学公开课 博弈论 原文讲稿仔细整理注释 第2讲
博弈论(课一)
博弈论作业
电大 《经济学与生活》第2次平时作业答案
博弈论第2次作业