搜档网
当前位置:搜档网 › 博弈论与策略思维

博弈论与策略思维

博弈论与策略思维
博弈论与策略思维

(完整版)博弈论知识点总结

博弈论知识总结 博弈论概述: 1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 博弈论研究的假设: 1、 决策主体是理性的,最大化自己的收益。 2、 完全理性是共同知识 3、 每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念 与预期 2、和博弈有关的变量: 博弈参与人:博弈中选择行动以最大化自己受益的决策主体。 行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。 信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息) 等的信息。 完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息。 不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。 支付:决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。 从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别: 3、博弈论与传统决策的区别: 1、 传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己 效用,研究工具是无差异曲线。可表示为:maxU(P ,I),其中P 为市场价格,I 为消费者可支配收入。 2、 其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定 下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式:战略式博弈和扩展式博弈 战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。 战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合 : 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn). 扩展式博弈:是博弈问题的一种规范性描述。 与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。 包含要素: 1、 参与人集合 {1,2,...,}n Γ={1,2,...,}n Γ=11(,...,,...,)n i i n i s s s s ==∏

策略博弈(第二版)

《策略博弈》(第二版) 书名:《策略博弈》(第二版) 书号:978-7-300-10135-4 著译者:阿维纳什·迪克西特苏珊·斯克丝著 蒲勇健译 开本:16 开 出版时间:2009.02 定价:65.00元 ◆作者简介◆ 阿维纳什·迪克西特(Avinash.Dixit)教授是美国当代最负盛名的经济学家之一,1968年获美国麻省理工学院经济学博士学位,1977年当选计量经济学会院士,自1981年起一直在普林斯顿大学任经济学教授,同时被世界多所知名大学聘为客座教授,曾在加州伯克利大学、牛津大学任教。他于1992年当选为美国艺术和科学研究院院士,2001年任计量经济学会会长,2002年任美国经济学联合会副会长,2005年当选国家科学院院士,曾在加州伯克利大学、牛津大学任教。研究领域广泛,在微观经济理论、博弈论、国际贸易、产业组织、增长和发展理论、公共经济学以及新制度经济学等多个领域有重要建树,近年来主要致力于政策制定中的政治经济学的研究。他著作甚丰,除在《美国经济评论》、《经济学季刊》、《政治经济学杂志》、《经济研究评论》等顶级专业期刊上发表多篇学术论文外,他还撰写了一系列著作,其中大部分均已成为经济学相关研究领域的名著或经典教科书。 迪克西特教授的代表著作《策略思维》、《经济政策的制定》、《不确定条件下的投资》、《法律缺失与经济学》均由中国人民大学出版社出版。 ◆内容简介◆ 《策略博弈》(第二版)是其在《策略思维》基础上进一步完善写作和案例上之后的通俗博弈论力作。如果说《策略思维》是20世纪80年代国际上最为流行的通俗博弈论教科书之一,那么《策略博弈》就是20世纪90年代以来国际上最为流行的通俗博弈论教科书之一。知识渊博的迪克西特在本书中通过运用标准的博弈论方法,通过对日常生活中的智慧、经济活动中的竞争与合作、政治活动中的技巧、军事活动及战争中的策略等的演绎,比较系统但又很简要地介绍了博弈论的有关基础知识,语言生动诙谐,故事精彩有趣,使得读者在漫游于引人入胜的故事情景之中的同时也可以通过博弈论的精致分析工具去了解其所以然。 ◆名家推荐◆ 迪克西特与斯克丝认识到了在大学课程计划的开始阶段教授博弈论概念的可能性;这是一个非常大的进步,值得赞许。通过使用《策略博弈》这本书,每一个地方的学生——正

《经济博弈论》期末考试复习

《经济博弈论》期末考试复习资料 第一章导论 1.博弈的概念: 博弈即一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,并从中各自取得相应结果的过程。它包括四个要素:参与者,策略,次序和得益。 2.一个博弈的构成要素: 博弈模型有下列要素:(1)博弈方。即博弈中决策并承但结果的参与者.包括个人或组织等:(2)策略。即博弈方决策、选择的内容,包括行为取舍、经济活动水平或多种行为的特定组合等。各博弈方的策略选择范围称策略空间。每个博弈方各选一个策略构成一个策略组合。(3)进行博弈的次序:次序不同一般就是不同的博弈,即使博弈的其他方面都相同。(4)得益。各策略组合对应的各博弈方获得的数值结果,可以是经济利益,也可以是非经济利益折算的效用等。 3.合作博弈和非合作博弈的区别: 合作博弈:允许存在有约束力协议的博弈;非合作博弈:不允许存在有约束力协议的博弈。主要区别:人们的行为互相作用时,当事人能否达成一个具有约束力的协议。 假设博弈方是两个寡头企业,如果他们之间达成一个协议,联合最大化垄断利润,并且各自按这个协议生产,就是合作博弈。 如果达不成协议,或不遵守协议,每个企业都只选择自己的最优产品(价格),则是非合作博弈。 合作博弈:团体理性(效率高,公正,公平) 非合作博弈:个人理性,个人最优决策(可能有效率,可能无效率) 4.完全理性和有限理性: 完全理性:有完美的分析判断能力和不会犯选择行为的错误。 有限理性:博弈方的判断选择能力有缺陷。 区分两者的重要性在于如果决策者是有限理性的,那么他们的策略行为和博弈结果通常与在博弈方有完全理想假设的基础上的预测有很大差距,以完全理性为基础的博弈分析可能会失效。所以不能简单地假设各博弈方都完全理性。 5.个体理性和集体理性: 个体理性:以个体利益最大为目标;集体理性:追求集体利益最大化。 第一章课后题:2、4、5 2.设定一个博弈模型必须确定哪几个方面? 设定一个博弈必须确定的方面包括:(1)博弈方,即博弈中进行决策并承担结果的参与者;(2)策略(空间),即博弈方选择的内容,可以是方向、取舍选择,也可以是连续的数量水平等;(3)得益或得益函数,即博弈方行为、策略选择的相应后果、结果,必须是数量或者能够折算成数量;(4)博弈次序,即博弈方行为、选择的先后次序或者重复次数等;(5)信息结构,即博弈方相互对其他博弈方行为或最终利益

博弈论习题

、选择题 A. 策略是局中人选择的一套行动计划; B. 参与博弈的每一个局中人都有若干个策略; C. 一个局中人在原博弈中的策略和在子博弈中的策略是相同的; D. 策略与行动是两个不同的概念,策略是行动的规则,而不是行动本身。 A. 双方都独立依照自己的利益行事,则双方不能得到最好的结果; B. 如果没有某种约束,局中人也可在(抵赖,抵赖)的基础上达到均衡; C. 双方都依照自己的利益行事,结果一方赢,一方输; D 每个局中人在做决策时,不需考虑对手的反应 A. 策略式博弈无法刻划动态博弈; B. 策略式博弈无法表明行动顺序; C. 策略式博弈更容易求解; D. 策略式博弈就是一个支付矩阵。 B. 混合策略是博弈方根据一组选定的概率,在两种或两种以上可能的行为 中随机选择的策略; C. 有些博弈不存在纯策略纳什均衡,但存在混合策略的纳什均衡; D. 有些博弈既存在纯策略纳什均衡,也存在混合策略的纳什均衡。 博弈论》习题 1. 博弈论中,局中人从一个博弈中得到的结果常被称为( ): A. 效用; B. 损益; C. 决策; D. 利润 2. 下列关于策略的叙述哪个是错误的( ): 3. 囚徒困境说明( ): 4. 一个博弈中,直接决定局中人损益的因素是( ): 5、 A. 策略组合; B. 策略; C. 信息; D. 行动。 策略式博弈,正确的说法是( ): 6. 下列有关策略和纳什均衡的叙述正确的有( ): A. 纯策略是博弈方采取“要么做,要么不做” 的策略形式; 7、 古诺模型体现了寡头企业的 ( ) 决策模型。 A 成本 价格 产量 质量

8、伯特兰德模型体现了寡头企业的什么决策模型。 A 成本价格产量质量 9、用囚徒困境来说明两个寡头企业的情况,说明了:( A、每个企业在做决策时,不需考虑竞争对手的反应 B、一个企业制定的价格对其它企业没有影响 C、企业为了避免最差的结果,将不能得到更好的结果 D、一个企业制定的产量对其它企业的产量没有影响 10、子博弈精炼纳什均衡(): A.不是一个一般意义上的纳什均衡; B.和纳什均衡没有什么关系; C.要求某一策略组合在每一个子博弈上都构成一个纳什均衡; D.要求某一策略组合在原博弈上都构成一个纳什均衡。 11. 下列关于重复博弈的叙述哪些是正确的(): A.重复博弈又称为序贯博弈; B.影响重复博弈均衡结果的主要因素是博弈重复的次数和信息的完备性; C.如果博弈重复无限次,则局中人采取的针锋相对策略意味着任何一方参 与人的一次性不合作将触发永远的不合作; D.在有限次重复博弈中,若阶段博弈纳什均衡的唯一性存在,则每个阶段 出现的都是一次性博弈的均衡结果。 12. 在动态博弈战略行动中() : A. 首先作出选择并采取相应行动的局中人往往可以获得更多的收 益; B. 斯塔克博格模型与古诺模型对垄断厂商行为的分析方法及结论相同; C. 一般而言,只有当局中人从实施某一威胁所能获得的总收益大于不实施 该威胁所获得的总收益时,该威胁才是可信 的; D. 承诺是当事人使自己的威胁策略变得可信的行动,但它也是有风险的。 13、市场交易中普遍存在的讨价还价属于哪种博弈。( A 完全信息静态博弈完全信息动态博弈 C 不完全信息静态博弈不完全信息动态博弈 14、下面哪种模型是一种动态的寡头市场博弈模型( A 古诺模型伯川德模型

博弈论复习题及答案(DOC)

囚徒困境说明个人的理性选择不一定是集体的理性选择。(√) 子博弈精炼纳什均衡不是一个纳什均衡。(×) 若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。()博弈中知道越多的一方越有利。(×) 纳什均衡一定是上策均衡。(×) 上策均衡一定是纳什均衡。(√) 在一个博弈中只可能存在一个纳什均衡。(×) 在一个博弈中博弈方可以有很多个。(√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。(√) 在博弈中纳什均衡是博弈双方能获得的最好结果。(×) 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(×)上策均衡是帕累托最优的均衡。(×) 因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。 (×) 在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×) 在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(√)不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√) 多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(√) 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t

博弈论与策略行为

博弈论与策略行为 G a m e T h e o r y a n d S t r a t e g y B e h a v i o r 蔡继明 教授/主任 清华大学政治经济学研究中心 Center for Political Economy at Tsinghua University CPET

目录 第一讲:导论 一、博弈论的研究对象 第二讲:占优战略与社会两难第三 讲:纳什均衡和双人博弈第四讲:三 人博弈与n人博弈第五讲:纯战略和 混合战略第六讲:博弈的合作解第 七讲:序贯博弈与子博弈完美均衡第 八讲:重复博弈第九讲:企业经营决 策的博弈分析第十讲:企业内部组织 分析第十一讲:政府行为分析 第一讲 导论 博弈论是研究理性的决策主体在其行为发生直 接的相互作用时的策略选择及策略均衡的理论。 博弈分析的关键步骤是找出在别人选择既定的情况 下自己的最优反应策略(给自己带来最大 收益的策略)。 二、博弈论的产生和发展 博弈又称博戏,是一门古老的游戏。 1. 博弈在中国《学弈》(《孟子 ?告 子》):弈秋,通国 之善弈也。使弈秋侮 二人 弈,其一人专心致志,惟 弈秋之为听;一人虽 听之,一心以为有鸿 鹄将至,思援弓缴而射 之。虽与之俱学,弗若 之矣。为是其智弗若 与?吾曰:非然也。 《世本》说,“乌曹作博”,乌曹乃是 夏代著名之能工巧匠。千百年来,博 弈更是与人们的生活紧紧相连,从博 棋到牌戏,从斗戏到彩票,中华民族 的历史长河中就这样形成了别具风情 的博弈文化 从孙子兵法到三十六计 从田忌赛马到孙庞斗智 从运筹帷幄到韬光养晦 从曹刿论战到论持久战

1

博弈论知识点总结完整版

博弈论 (一):基本知识 1.1定义:博弈论,又称对策论,是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论,是研究竞争的逻辑和规律的数学分支。即,博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间的均衡。 1.2基本要素:参与人、各参与人的策略集、各参与人的收益函数,是博弈最重要的基本要素。 1.3博弈的分类:博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议(binding agreement)。倘若不能,则称非合作博弈(Non-cooperative game)。 合作博弈强调的是集体主义,团体理性,是效率、公平、公正;而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,强调个人理性、个人最优决策,其结果有时有效率,有时则不然。目前经济学家谈到博弈论主要指的是非合作博弈,也就是各方在给定的约束条件下如何追求各自利益的最大化,最后达到力量均衡。 博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息,是否了解两个角度进行。把两个角度结合就得到了4种博弈: a、完全信息静态博弈,纳什均衡,Nash(1950) b、完全信息动态博弈,子博弈精炼纳什均衡,泽尔腾(1965) c、不完全信息静态博弈,贝叶斯纳什均衡,海萨尼(1967-1968) d、不完全信息动态博弈,精炼贝叶斯纳什均衡,泽尔腾(1975)Kreps, Wilson(1982) Fudenberg, Tirole(1991) 1.4课程主要内容:完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈 1.5博弈模型的两种表示形式:策略式表述(Strategic form), 扩展式表述(Extensive form) 1.6占优均衡: a、占优策略:在博弈中如果不管其他参与人选择什么策略,一个参与人的某个策略给他带来的支付值始终高于其他策略,或至少不劣于其他策略,则称该策略为该参与人的严格占优策略或占优策略。 对于所有的s-i,si*称为参与人 i的严格占优战略,如果满足: ui(si*,s-i)>ui(si',s-i) ?s-i, ?si' ?si* b、占优均衡:一个博弈的某个策略组合中,如果对应的所有策略都是各参与人的占优策略,则称该策略组合为该博弈的一个占优均衡。 1.7重复剔除严劣策略均衡: a、“严劣”和“弱劣”的含义: 设s i’和s i’’是参与人i可选择的两个策略,若对其他参与人的任意策略组合s-i, 均成立 u i(s i’, s-i) < u i(s i’’, s-i), 则说策略s i’严劣于策略s i’’。 上面式子中,若将“<”改为“≤”,则说策略s i’弱劣于策略s i’’。 b、定义:重复剔除严格策略就是 各参与人在其各自策略集中, 不断剔除严劣策略…如果最终 各参与人仅剩下一个策略,则 该策略组合就被称为重复剔除 严劣策略均衡。 (二):纳什均衡(Nash Equilibrium) 2.1纳什均衡定义:对于一个策略式表述的博弈G={N,S i, u i,i∈N},称策略组合s*=(s1, …s i, …, s n)是一个纳什均衡,如果对于每一个i ∈N, s i*是给定其他参与人选择s-i*={s1*, … ,s i-1*, s i+1*, … ,s n*} 情况下参与人i 的最优策略(经济理性策略),即:u i(s i*, s-i*)

“博弈论”习题及参考答案

《博弈论》习题 一、单项选择题 1.博弈论中,局中人从一个博弈中得到的结果常被称为()。 A. 效用 B. 支付 C. 决策 D. 利润 2.博弈中通常包括下面的内容,除了()。 A.局中人 B.占优战略均衡 C.策略 D.支付 3.在具有占优战略均衡的囚徒困境博弈中()。 A.只有一个囚徒会坦白 B.两个囚徒都没有坦白 C.两个囚徒都会坦白 D.任何坦白都被法庭否决了 4.在多次重复的双头博弈中,每一个博弈者努力()。 A.使行业的总利润达到最大 B.使另一个博弈者的利润最小 C.使其市场份额最大 D.使其利润最大 5.一个博弈中,直接决定局中人支付的因素是()。 A. 策略组合 B. 策略 C. 信息 D. 行动 6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时 的博弈具有()。 A.囚徒困境式的均衡 B.一报还一报的均衡 C.占优策略均衡 D.激发战略均衡 7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的策略称为()。 A.一报还一报的策略 B.激发策略 C.双头策略 D.主导企业策略 8.在囚徒困境的博弈中,合作策略会导致()。 A.博弈双方都获胜 B.博弈双方都失败

C.使得先采取行动者获胜 D.使得后采取行动者获胜 9.在什么时候,囚徒困境式博弈均衡最可能实现()。 A. 当一个垄断竞争行业是由一个主导企业控制时 B.当一个寡头行业面对的是重复博弈时 C.当一个垄断行业被迫重复地与一个寡头行业博弈时 D. 当一个寡头行业进行一次博弈时 10.一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种策略是一种()。 A.主导策略 B.激发策略 C.一报还一报策略 D.主导策略 11.关于策略式博弈,正确的说法是()。 A. 策略式博弈无法刻划动态博弈 B. 策略式博弈无法表明行动顺序 C. 策略式博弈更容易求解 D. 策略式博弈就是一个支付矩阵 12.下列关于策略的叙述哪个是错误的(): A. 策略是局中人选择的一套行动计划; B. 参与博弈的每一个局中人都有若干个策略; C. 一个局中人在原博弈中的策略和在子博弈中的策略是相同的; D. 策略与行动是两个不同的概念,策略是行动的规则,而不是行动本身。 13. 囚徒困境说明(): A. 双方都独立依照自己的利益行事,则双方不能得到最好的结果; B. 如果没有某种约束,局中人也可在(抵赖,抵赖)的基础上达到均衡; C. 双方都依照自己的利益行事,结果一方赢,一方输; D、每个局中人在做决策时,不需考虑对手的反应 14. 一个博弈中,直接决定局中人损益的因素是(): A. 策略组合 B. 策略 C. 信息 D. 行动 15. 动态博弈参与者在关于博弈过程的信息方面是() A 不对称的 B 对称的 C 不确定的 D 无序的

博弈论与策略思维课后练习

博弈论与策略思维课后练习 判断题: 1、理性的参与人应该选择劣策略。[题号:Qhx008231] A、对 B、错 您的回答:B 正确答案:B 题目解析:理性的参与人应该选择占优策略,不应该选择劣策略。 2、石头剪刀布是序列博弈。[题号:Qhx008227] A、对 B、错 您的回答:B 正确答案:B 题目解析:石头剪刀布是同步博弈。 3、三个火枪手游戏中甲提高生存策略的办法是放空枪。[题号:Qhx008224] A、对 B、错 您的回答:A 正确答案:A 题目解析:甲通过改变策略,即放空枪有效提高了生存率。 4、海萨尼建立了“子博弈精炼纳什均衡”的概念。[题号:Qhx008226] A、对 B、错 您的回答:B 正确答案:B

题目解析:海萨尼把不完全信息纳入到博弈论方法体系中;泽尔腾的贡献在于将博弈论由静态向动态的扩展,建立了“子博弈精练纳什均衡”的概念。 5、协调博弈只有一个纳什均衡。[题号:Qhx008229] A、对 B、错 您的回答:B 正确答案:B 题目解析:协调博弈中至少有两个纳什均衡,具体是哪个均衡组合,需要博弈方协调。 单选题: 1、“要想在现代社会做一个有文化的人,你必须对博弈论有一个大致了解”这是()的名言。[题号:Qhx008236] A、坎贝尔 B、纳什 C、萨缪尔森 D、海萨尼 您的回答:C 正确答案:C 题目解析:萨缪尔森的这句话意思为,你也许没必要深入学习博弈论高深的数学模型和推导,但它背后所包含的思维方法等是人类智慧的结晶,你应该要有所掌握。 2、情侣博弈是用()来寻找纳什均衡的。[题号:Qhx008244] A、占优策略法 B、最优反应法 C、逆向归纳法 D、劣策略重复剔除法 您的回答:B 正确答案:B 题目解析:占优策略法、最优反应法以及劣策略重复剔除法是寻找纳什均衡的三种方法,逆向归纳法主要用来推导有限重复博弈的结果。

博弈论习题参考答案(2)

《博弈论》习题参考答案(第2次作业) 一、选择题 1.B 2.C 3.A 4.A 5.B 6.ABCD 7.C 8.B 9.C 二、判断正误并说明理由 1.F 上策均衡是比纳什均衡更严格的均衡概论 2.T 上策均衡是比纳什均衡更严格的均衡概论 3.T 博弈类型按局中人数多少分为单人博弈、双人博弈和多人博弈 4.F 博弈双方偏好存在差异的条件下,一个博弈模型中可能存在2个纳什均衡,如性别战 5.T 零和博弈指参与博弈各方在严格竞争下,一方收益等于另一方损失,博弈各方收益与损失之和恒为零,所以双方不存在合作可能性 6.T 上策均衡是通过严格下策消去法(重复剔除下策)所得到的占优策略,只能有一个纳什均衡 7.F 纳什均衡是上策的集合,指在给定的别人策略情况下,博弈方总是选择利益相对较大的策略,并不保证结果是最好的。 8.F 局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标 9.T 纳什均衡是上策的集合,指在给定的别人策略情况下,没有人会改变自己的策略而减低自己的收益 10.F 局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标 11.F 局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标 12.T 虽然斯塔格伯格模型各方利润总和小于古诺模型,但是领导者的利润比古诺模型时高

三、计算与分析题 1、 (1)画出A 、B 两企业的损益矩阵。 (2)求纯策略纳什均衡。 (做广告,做广告) 2、画出两企业的损益矩阵求纳什均衡。 (1)画出A 、 B 两企业的损益矩阵 (2)求纳什均衡。 两个:(原价,原价),(涨价,涨价) 3、假定某博弈的报酬矩阵如下: 甲 乙 左 右 上 下 (1)如果(上,左)是上策均衡,那么,a>?, b>?, g? 答:a>e, b>d, f>h, ge, b>d 4、答:(1 )将这一市场用囚徒困境的博弈加以表示。 (2)解释为什么均衡结果可能是两家公司都选择竞争性策略。 答:若新华选择“竞争”,则北方也会选择“竞争”(60000>0);若新华选择

第五章-博弈论与竞争策略

第五章博弈论与竞争策略 第一节第二节第三节博弈论的基本概念完全信息静态博弈重复博弈和序列博弈 在现实经济社会,完全垄断和完全竞争的市场结构十分少见。厂商在市场中既有一定的垄断势力,又面临很大的竞争压力。厂商之间具有相关性和依存性。因此,可以用博弈论的方法解释和说明厂商的竞争行为和策略。博弈论是70年代中期以来微观经济学发展的一个重要方面。1994年的诺贝尔经济学奖被授予博弈论专家:纳什(Nash)、泽尔腾(Selten)和海萨尼(Harsanyi),他们都对博弈论在经济学中的应用作出了贡献。 70年代以来,博弈论已经发展成为现代经济学的基础重要基础之一,改变了传统经济学的结构,这主要有两 个方面的原因: 1.传统经济学着重研究市场机制和价格制度,分析完全竞争市场中的最优决策,不考虑决策者之间的相互影响。但是,现实经济运行中市场是不完全竞争的,行为主体之间的决策具有相互影响。 2.完全竞争市场是以完全信息为条件的,这在现实经济运行中也难以保证。在信息不对称条件下,考虑行为主体相互影响的非价格制度可以用博弈论分析。 当然,应用博弈论解决竞争策略问题也是有条件的。除了掌握博弈论方法外,关键是正确估计各参与者的策略空间和收益函数。 第一节博弈论的基本概念 一.博弈论及其特点 1.博弈和博弈论 博弈是指具有不同利益和目标的多个行为主体共同参加并相互影响的事态发展过程中的策略决策。 博弈论(Game Theory)也称对策论,它是一种分析博弈过程和结果的数学方法,研究具有理性的多个行为主体的决策和行动直接相互作用和影响时,事态发展过程的决策和均衡问题。广泛应用于政治、军事、经济、外交和日常生活的许多领域。 2.特点: (1)参与者具有各自的目标: (2)参与者都是理性行为者; (3)参与者之间具有相关性; (4)事态发展的结果取决于全部参与者的共同行为; (5)参与者要根据对其他参与者的判断决定自己的行动,因而是对策。 可见,博弈论是与优化论不同的决策理论。优化论是一种单人决策理论;博弈论所揭示的规律是一种多人决策理论。 二.博弈论的基本概念 在博弈论中,博弈的基本要素被概括为以下概念: 1)参与者Players (玩家):即参加博弈过程的行为和决策主体,也是利益主体。在一个博弈中,最少要有两个参与者。 2)策略Strategies (战略或策略行为):即参与者在某个博弈时点,根据其掌握的有关博弈信息而选择的决策变量和行动计划,一个参与者的全部可行策略称为他的策略空间。 接上页 3)收益Payoff(支付、得益)和收益函数:收益是指在既定策略组合条件下参与者的得失情况。每个参与者的收益取决于全部参与者所采取的策略,称为收益函数。 4)结局 outcome(结果):指博弈的结果,指既定策略组合条件下全部参与者所得收益的集合。 5)均衡 Equilibrium (均势):指达到稳定的策略组合或结局。 6)博弈规则:指参与者、策略、结局之间的联系。它是由博弈的环境和参与者之间的相互影响决定的。 例: 可口可乐与百事可乐(参与者)的价格决策: 双方都可以保持价格不变或者提高价格(策略) 博弈的目标和得失情况体现为利润的多少(收益) 利润的大小取决于双方的策略组合(收益函数) 博弈有四种策略组合,其结局是: (1)如果双方都不涨价,各得利润10单位; (2)如果可口可乐不涨价,百事可乐涨价,可口可乐利润100,百事可乐利润-30; (3)如果可口可乐涨价,百事可乐不涨价,可口可乐利润-20,百事可乐利润30;

博弈论06 混合策略4

博弈论石头剪子布游戏 石头剪子布游戏 石头剪子布游戏 石头剪子布游戏 石头剪子布游戏 石头剪子布游戏 求混合策略的收益等值法 求混合策略的收益等值法

田忌赛马 田忌赛马出自《史记》卷六十五:《孙子吴起列传第五》,是中国历史上有名的揭示如何善用自己的长处去对付对手的短处、从而在竞技中获胜的事例。 田忌赛马 齐使者如梁,孙膑以刑徒阴见,说齐使。齐使以为奇,窃载与之齐。齐将田忌善而客待之。忌数与齐诸公子驰逐重射。孙子见其马足不甚相远,马有上、中、下辈。于是孙子谓田忌曰:“君弟重射,臣能令君

胜。”田忌信然之,与王及诸公子逐射千金。及临质,孙子曰:“今以君之下驷与彼上驷,取君上驷与彼中驷,取君中驷与彼下驷。”既驰三辈毕,而田忌一不胜而再胜,卒得王千金。于是忌进孙子于威王。威王问兵法,遂以为师。 田忌赛马 田忌赛马的均衡 田忌赛马的均衡 田忌赛马的均衡 情侣博弈混合策略均衡

情侣博弈有两个纯策略纳什均衡,同时情侣博弈是协调博弈,博弈中的两个局中人具有策略一致性,如果一方知道了另一方的选择,则会选择与对方一致的策略,换句话说,两个局中人都不害怕对方猜到自己的选择。 但由于该博弈有两个纳什均衡,而情侣双方对两个纳什均衡的偏好各不相同,因此当俩人从自身最大利益出发独立同时决策时,仍然无法确定博弈的结果是那个纯策略组合,因此需要考虑局中人采用混合策

略的可能性。 情侣博弈混合策略均衡 如果男方不想让女方利用自己的选择占上风,则自己的概率选择应使 情侣博弈混合策略均衡 男方的(3/4,1/4)和女方的(1/4,3/4)构成一个混合策略纳什均衡。 在该均衡下,双方的期望收益都是0.5,显然不如双方能协调一致、或者一方迁就另一方

博弈论(整理过名词解释和简答)

一、名词解释: 1、博弈:一些个人、团体或其他组织,在一定的规则约束下,依据所掌握的信息,同时或者先后,一次或者多次从允许选择的行为或战略进行选择并加以实施,并从中各自取得相应结果或收益的过程。 2、囚徒困境:从博弈中的两个利益主体出发选择行为,结果是既没有实现两人总体的最大利益,也没有真正实现自身的个体最大利益,比如经济领域的寡头竞争、公共产品的供给。 3、非合作博弈与合作博弈:人们行为相互作用时,当事人能达成一个具有约束力的协议,也就是合作博弈,反之,就是非合作博弈。 4、常和博弈:是指博弈双方的得益总和为非零的常数 变和博弈:是指在不同的策略组合或者结果下,所有博弈方的得益总和一般是不相同的零和博弈:是指在博弈中,一方的得益就是另一方的损失,所有博弈方的得益总和为零5、博弈论:研究决策主体的行为及其相互决策和均衡问题的学科。在经济学中,博弈论是研究经济主体的决策相互影响 6、战略:参与人在给定信息集的情况下的行为规则的完备描述。 7、均衡:所有参与人的最优战略组合。 8、均衡路径:如果一个博弈有几个子博弈,一个特定的纳什均衡决定了原博弈树上唯一的一条路径,或者说是一个纳什均衡结果在博弈树中所形成的路径。 9、占优均衡:无论其他参与人选择什么战略,参与人的某一种战略均是最优的。 10、重复剔除劣战略的占优均衡:首先找到某个参与人的劣战略(假定存在),把这个劣战略删除掉,重新构造一个不包含已删除的劣战略的新的博弈,然后再删除这个新的博弈中的某个参与人的劣战略,一直重复这个过程,直到只剩下唯一的战略组合为止。 11、纳什均衡:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是最好的策略,即双方在给定的战略上不愿意改变自己的策略。 12、混合战略:如果一个战略规定参与人在给定信息情况下以某种概率随机选择不同的行为,我们称该战略为混合战略。 13、子博弈:从单结信息集开始至博弈结束的过程,由一个决策结x和所有的后续决策结T(x)构成,满足条件: (1)决策结x是单结信息集; (2)在一个信息集的决策结必须是同一个决策结的后续结。 14、子博弈精炼纳什均衡:如果一个纳什均衡中的各个子博弈的战略在每一个子博弈中都是最优的,即构成纳什均衡,则称该博弈为子博弈精炼纳什均衡。 15、静态博弈:指博弈中的参与人同时选择行为,或者虽非同时但后行动者并不知道前行动者采取了什么具体行动; 动态博弈:指参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。 16、重复博弈:给定一个标准博弈G(动态/静态)重复进行T次,并且每次重复G之前,以前的博弈的结果各个博弈方都能观察到,这样的博弈过程成为“G的T次重复博弈”,记为G(T),G称为G(T)的博弈阶段。同样结构的博弈重复多次,其中的每次博弈称为阶段博弈。 17、不可置信的威胁:在纳什均衡中,不可置信的均衡战略,在博弈的规则下,使自己的支付变小的不理性的选择。 18、完全信息博弈:每一个参与人对所有其他参与人的特征,战略空间以及支付函数有准确知识的博弈。 19、类型:一个参与人所拥有的私有信息,是其个人特征的完备描述,博弈人知道,其他人不知道。

第十三章博弈论和竞争策略.

第十三章博弈论和竞争策略 教学目的 通过本章的学习,使学生掌握博弈论的基本内容,并能够用博弈论历来分析厂商的竞争策略。 教学内容 博弈与决策、占优策略、纳什均衡、重复博弈、序贯博弈、威胁、承诺和可信性、对进入的威慑 教学重点与难点 占优策略、纳什均衡、重复博弈、序贯博弈 教学方法 教师讲授与讨论相结合 具体内容 第一节博弈和决策 博弈论(game theory),又译为对策论,就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 博弈论的基本概念 参与人,又称局中人,是指博弈中选择行动以实现自身利益最大化的决策主体(可以是个人,也可以是团体,如厂商、政府、国家)。 行为:指参与人的决策变量,如消费者效用最大化决策中的各种商品的购买量;厂商利润最大化决策中的产量、价格等。 策略:又称战略,是指参与人选择其行为的规则,也就是指参与人应该在什么条件下选择什么样的行动,以保证自身利益最大化。 信息:是指参与人在博弈过程中的知识,特别是有关其他参与人(对手)的特征和行动的知识。即该参与人所掌握的其他参与人的、对其决策有影响的所有知识。 收益:又称支付,是指参与人从博弈中获得的利益水平,它是所有参与人策略或行为的函数,是每个参与人真正关心的东西,如消费者最终所获得的效用、厂商最终所获得的利润。 结果:是指博弈分析者感兴趣的要素集合。 均衡:是指所有参与人的最优策略或行动的组合。 博弈的分类: 静态博弈与动态博弈 完全信息博弈与不完全信息博弈 合作博弈与非合作博弈:若参与者能够达成有约束力的协议,即为合作博弈;反之为非合作博弈。 第二节占优策略

占优策略:无论竞争者如何行动,该策略都是最优的。 占优策略均衡:不管竞争对手的策略如何,每一家企业的行为总是最优的,这样一个博弈的结构成为占优策略均衡。 第三节纳什均衡 纳什均衡:给定对方的阿行动,自己的行动是最优策略组合。 最大最小策略:限制最小可能收益中的最大值。 纯策略:博弈方做出某个具体的限制或者采取某个具体的行动的策略。 混合策略:参与者以某种概率分布在两种或更多的行动中随机限制。 第四节重复博弈 重复博弈:博弈方不断采取行动,同时不断受到效应的收益的博弈。 以牙还牙策略:在一个重复博弈中,限制前一轮对手所选择的行动的一种策略,该策略将与合作者保持合作,而报复不合作者。 第五节序贯博弈 序贯博弈:参与者根据对手的行动和反应轮流行动的博弈。 博弈树;先发优势 第三节威胁、承诺和可信性 策略性行动:限制自身的行动空间从而为自己带来战略好处的行动。 空头威胁;承诺和可信性 第四节对进入的威慑 课程的考核要求:理解重复博弈和序列博弈,掌握占优策略均衡和纳什均衡【复习思考题】 1、什么是占优策略?为什么一个上策的均衡是稳定的? 2、上策均衡与纳什均衡的区别和联系。 3、什么是“以牙还牙”策略?为什么它是无限重复囚徒困境的理性策略?

博弈论中的相关概念

新古典经济学前提: 理性选择——减少不确定; ——经济系统效用最大化。 理性——新古典经济学与博弈论的纽带 博弈论决策前提:理性的战略选择。 博弈论决策基础:最优反应,即带来最大收益的战略。 但是,在博弈论中最优反应不是理性的唯一表现,也不总是假定人是理性的。 新古典经济学决策的背景: 理性的个体面临特定的制度环境(产权、货币、高度竞争的市场),在此基础上以获取利益最大化为目的。 隐含的基础:只需考虑自身情况和市场条件,而不考虑他人行为。 弊端: ——限制了理论的使用范围,现实中竞争并不完全; ——无法解决货币经济以外的决策难题。 博弈论的优势: ——不仅考虑自身条件和市场环境,最重要的是还需考虑他人的行为。 游戏规则: 两个选手,轮流取币; 每次至少取一枚硬币; 只能从一行中取任意数量的硬币,不许从两行中选取; 取走最后一枚硬币的为胜者 囚徒困境的启示: 囚徒困境仅仅是二人博弈,多人博弈在现实中更多; 如果囚犯可以交流,结果显著不同; 如果多轮博弈,结果也有不同; 导致困境结论的分析过程令人注目,但最后结论并非理性。 通常假设参与者将采取最优反应战略而理性行事,最大化利润、力争在游戏中获胜、达到主观收益最大化,或者惩罚最小化,皆属于理性行为。 最优反应战略是在其他参与者战略已知或可预测条件下,给某参与者带来最大化收益的战略。 博弈分析的关键步骤是找出在别人选择既定的情况下自己的最优反应战略。 依据新古典经济学,我们把一个参与者的最优反应(best response)定义为,在其他参与者已经选定战略,或者可以预计到他们将选择何种战略时,能够给该参与者带来的最大收益的战略。 标准式——数字矩阵; 扩展式——树形图 不确定事件(contingency): 相机战略(contingent strategy):仅在不确定事件发生时才会采取的战略 信息集(information set):节点2包含了决策者掌握的所有信息,因此也称为信息集。 扩展式的优势: ——展示了每一阶段掌握的信息; ——展示了参与者掌握信息的不完全 所有博弈问题均可用标准式描述,即绘制一个表格,边缘列出参与者的战略,里面列出参与者的收益;

博弈论习题

博弈论习题 一、判断 1、纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。错,只要任一博弈方单独改变策略不会增加得益,策略组合就是纳什均衡了。本题说的是严格纳什均衡。 2、若一博弈有两个纯战略纳什均衡则一定还存在一个混合战略纳什均衡。对的,NE的基本性质之一——奇数性所保证的。 3、博弈中混合策略纳什均衡一定存在,纯战略的不一定存在。对 4、上策均衡一定是帕累托最优的均衡。错,囚徒困境,(坦白,坦白)是上策均衡但不是帕累托最优。 5、在动态博弈中,因为后行为的博弈方可以先观察到对方行为后再做选择,因此总是有利的。错,先动优势 6、动态博弈本身也是自己的子博弈之一。错,根据子博弈的定义,整个博弈本身不是自己的子博弈。 7、如果动态博弈的一个策略组合不仅在均衡路径上是纳什均衡,而且在非均衡路径上也是纳什均衡,就是该动态博弈的一个子博弈完美纳什均衡。对, 8逆推归纳法并不能排除所有不可置信的威胁、 错,逆推归纳法最基本的特征就是能排除动态博弈中所有不可信行为,包括不可信威胁和不可信承诺。 9、颤抖手均衡与第二章的风险上策均衡都是在有风险和不确定情况下的稳定策略组合,因为她们本质上是一样的。错,区别很大。前者是针对很小的犯错误导致的偏离概率的均衡概念,对博弈方的理性假设与完全理性假设基本接近,且本身是纳什均衡。 10、有限次重复博弈的子博弈完美纳什均衡每次重复均采用的都是原博弈的纳什均衡。错,对于有两个以上纯策略纳什均衡博弈的有限次重复博弈,SPNE在前面某些次重复时采用的可以不是原博弈的NE,例如许多出发策

略。 11、有限次重复博弈的子博弈完美纳什均衡的最后一次重复必定是原博弈的一个纳什均衡。对,因为最后一次重复就是动态博弈对的最后一个阶段,根据SPNE的要求,博弈方在该阶段的选择必须构成纳什均衡。最后一次博弈就是原博弈本身 12、无限次重复博弈的均衡解一定优于原博弈均衡解的得益。错,对于严格竞争的零和博弈或者不满足合作条件的其他博弈来说,无限次重复博弈并不意味着效率的提高,得益不一定高。 13、无限次重复古诺产量博弈不一定会出现和谋生产垄断产量的现象。对,出现这个现象是有条件的,主要是厂商的长远利益要有足够的重要性,由远期利益的贴现率反映。 14、如果博弈重复无限次或每次结束的概率足够小,而得益的时间贴现率A充分接近于1,那么任何个体理性的可实现得益都可以作为子博弈完美纳什均衡的结果出现。对,是无限次重复博弈民间定理的结论。 15、触发策略所构成均衡都是子博弈完美纳什均衡。错误,触发策略本身并不能排除重复博弈中不可信的威胁或承诺,因此由触发策略构成的均衡不一定是SPNE. 16、所有博弈方都有关于得益的信息,至少部分博弈方缺乏博弈进程信息的动态博弈,称为完全但不完美信息动态博弈。对,定义 17、不完美信息动态博弈中的信息不完美性都是客观因素造成的。错,有些事故意隐瞒自己的行为。 18、在完全但不完美信息博弈中,若不存在混合策略,并且各博弈方都是主动选择并且行为是理性的,则不完美信息从本质上说是“假的”。对, 19、子博弈可以从一个多节点信息集开始。错,在一个子博弈中出现的必须是完整的信息集,由于多节点信息集开始的博弈必然分割一个信息集,一次不可能是个子博弈。 20、不完美信息是指至少某个博弈方在一个阶段完全没有博弈进程的信

博弈论与策略思维 课后练习

博弈论与策略思维课后练习 (点此刷新练习不同题目) 判断题: 1、萨缪尔森说,要把一只鹦鹉培养成一个经济学家,要告诉它三个词:供给,需求,纳什均衡[题号:Qhx008225] A、对 B、错 您的回答:B 正确答案:B 题目解析:萨缪尔森说,要把一只鹦鹉培养成一个经济学家,要告诉它两个词,即供给与需求;坎贝尔引申说,要把一只鹦鹉培养成一个现代经济学家,还要告诉它什么是纳什均衡。 2、在重复博弈中,合谋是纳什均衡。[题号:Qhx008230] A、对 B、错 您的回答:B 正确答案:B 题目解析:重复博弈分为无限重复博弈与有限重复博弈,在无限重复博弈中,合谋是纳什均衡。 3、无限重复博弈会导致期末问题。[题号:Qhx008235] A、对 B、错 您的回答:B 正确答案:B 题目解析:知道已知次数的有限重复博弈会导致期末问题。 4、协调博弈只有一个纳什均衡。[题号:Qhx008229] A、对

B、错 您的回答:B 正确答案:B 题目解析:协调博弈中至少有两个纳什均衡,具体是哪个均衡组合,需要博弈方协调。 5、石头剪刀布是序列博弈。[题号:Qhx008227] A、对 B、错 您的回答:B 正确答案:B 题目解析:石头剪刀布是同步博弈。 单选题: 1、在智猪博弈模型中,()是纳什均衡。[题号:Qhx008242] A、大猪小猪都按 B、大猪按小猪等 C、小猪按大猪等 D、小猪大猪都等 您的回答:B 正确答案:B 题目解析:智猪博弈主要用来分析处于弱势地位的参与者与强势地位的参与者博弈时的相处之道,在该博弈中,小猪搭大猪便车显示出了博弈智慧,大猪按小猪等为纳什均衡。 2、在无限重复博弈的情况下,可达成最终合作的策略是()。[题号:Qhx008247] A、一报还一报 B、冷酷策略 C、触发策略 D、劣策略

相关主题