搜档网
当前位置:搜档网 › 博弈论知识点总结

博弈论知识点总结

博弈论知识点总结
博弈论知识点总结

博弈论知识总结

博弈论概述:

1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 博弈论研究的假设:

1、 决策主体是理性的,最大化自己的收益。

2、 完全理性是共同知识

3、 每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念

与预期

2、和博弈有关的变量:

博弈参与人:博弈中选择行动以最大化自己受益的决策主体。 行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。 信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息)

等的信息。

完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息。

不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。

支付:决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。 从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别: 3、博弈论与传统决策的区别:

1、 传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己

效用,研究工具是无差异曲线。可表示为:maxU(P ,I),其中P 为市场价格,I 为消费者可支配收入。

2、 其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定

下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式:战略式博弈和扩展式博弈

战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。

战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。

1、参与人集合 :

2、每位参与人非空的战略集 S i

3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn).

扩展式博弈:是博弈问题的一种规范性描述。

与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。

包含要素:

1、 参与人集合

{1,2,...,}n Γ={1,2,...,}n Γ=11(,...,,...,)n

i i n i s s s s ==∏

2、参与人的行动顺序,即每个参与人在何时行动;

3、序列结构:每个参与人行动时面临的决策问题,包括参与人行动时可供选择的

行动方案、所了解的信息;

4、参与人的支付函数。

比较:

1、战略式博弈从本质上来讲是一种静态模型。

2、扩展式博弈从本质上来讲是一种动态模型。

5、博弈论分类:

按决策主体的行为相互作用时,当事人能否达成一个具有约束力的协议可分为:

1、合作博弈(强调团体理性、团体最优决策、效率)

2、非合作博弈(强调个人理性,个人最优决策)

按参与人行动先后顺序可分为:

1、静态博弈:博弈中参与人同时行动,或者虽然不是同时行动,但是在行动前不知

道其他参与人所选择的行动。

2、动态博弈:参与人的行动有先后顺序,后行动者获得先行动者的行动信息。

按参与人对信息的掌握程度可分为:

1、完全信息:每个参与人对其他所有参与人的特征、战略空间及支付函数有精确的

了解,博弈开始时不存在不确定性因素。

2、不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信

息,即存在着有关其他参与人的不确定性因素。

按决策主体对信息的掌握程度和行动的先后顺序,博弈可以分为:完全信息静态博弈、

6、根据所学这四种博弈的特点对这四种博弈做一个对比分析:

二、四种博弈类型具体分述

1、完全信息静态博弈

1.1完全信息静态博弈特点:每个参与人对其他所有参与人的特征、战略空间及支付

函数有精确的了解,博弈开始时不存在不确定性因素,参与人同时行动或者不是同时行动但是后行动者不知道行动者的行动信息。战略和行动相同。

1.2 完全信静态博弈相关概念:

以新产品开发博弈举例说明:

参与人:参与人1和2。 参与人的集合卡表示为:Γ={1,2,…n}.表示所有参与人的集合,在新产品开发博弈中为:Γ={1,2}

行动:开发、不开发。

Ai 表示参与人行动的集合。新产品开发博弈中参与人的行动集合为A1=A2={a,b},其中a 为开发,b 为不开发。

a={a1,a2…an}表示参与人的行动组合。新产品开发博弈中为:A={(a,a ),(a,b),(b,a),(b,b)} 战略:参与人的行动规则。

在博弈中的战略可以定义为从观测集到行动集的映射关系,即: Si:Xi —Ai 。用Si={si}表示参与人所有战略的集合。

在n 人博弈中,用S=(s 1,s 2,s 3…,s n )表示 n 个参与人的战略组合,它表示博弈中每个参与人采取战略si 的一种博弈情形。

在完全信息静态博弈中,由于不存在决策时序上的差异,所有参与人在同一决策时点即博弈开始的那一时刻决策,因此,所有参与人面临的决策情形都只有一种,所以,参与人的战略集与行动集相同。

支付:是指参与人在博弈中的所得。一般情况下也是用效用函数来表示参与人在博弈中的所得。因此,参与人的支付就可表示为一种特定博弈情形下参与人得到的确定效用水平或期望效用水平。支付一般用ui(1,2,…,n)表示参与人i 的支付(效用水平),支付组合u=(u1,u2,…un)表示参与人在特定博弈情形下所得到的支付,其中为参与人i 的支付。因此,参与人 i=(i=1,2,…,n)的支付就可表示为:ui=ui(s i ,s -i ).

信息:是参与人所具有的有关博弈的所有知识,如有关其它参与人行动或战略的知识、有关参与人支付的知识等等。在“新产品开发博弈”中,如果两个企业都知道市场需求,那么这样的博弈情形就是我们前面所提到的完全信息假设;如果两个企业中至少有一个不知道市场需求,那么这样的博弈情形就是我们前面所提到的不完全信息假设。

1.3 纯战略纳什均衡

纯战略:参与人在给定信息下只选择一种特定(或确定性)的战略 混合战略:混合战略解释了一个参与人对其他参与人所采取的行动的不确定性,它描述了参与人在给定信息下以某种概率分布随机地选择不同的行动或战略。

纯战略纳什均衡中包括:占有均衡、重复剔除劣战略均衡、一般纯战略纳什均衡等。

1、占优均衡 占优战略:参与人的最优战略si *与其他参与人的选择 s -i 无关。无论其他参与人选择什么战略,参与人的最优战略总是唯一的,这样的最优战略称之为“占优战略”。

在n 人博弈中,如果对于所有的其他参与人的选择s -i ,si *都是参与人 i 的最优选择 则称si *为参与人的占优战略。 在n 人博弈中,如果对所有参与人都存在占优战略si *,则占优战略组合si*=(s1 * si2*,…, sn *)称为占优战略均衡。如果所有参与人都有占优战略存在,那么占优战略均衡就是唯一的所有理性参与人可以预测到的博弈结果。

2、重复剔除劣战略

如果在一个博弈中,参与人不存在占优战略,但是参与人i 存在两个战略,其中一 个战略叫另一个战略的所得效用要大,则理性的参与人绝对不会选择战略。

严格劣战略:

*(,)(,)i

i

i

i

i

i

u s s u s s -->(,)(,)

i i i i i i u s s u s s --'''>(,)(,)i i i i i i u s s u s s --'''>(,)(,)

i i i i i u s s u s s --'''≥

弱劣战略:

若重复剔除过程一直可持续到只剩下唯一的战略组合,则该战略组合即为重复剔除的占优均衡,此时该博弈是重复剔除战略可解。

要点:再重复剔除过程中,如果每次剔除的是严格劣战略,均衡结果与剔除顺序无关;如果剔除的是弱劣战略,均衡结果可能与剔除顺序有关。 3、一般Nash 均衡

Nash 均衡是完全信息静态博弈的解的概念,在完全信息静态博弈中,构成Nash 均衡的战略是不可剔除的,即不存在任何一个战略严格优于Nash 均衡战略。

求解纳什均衡的方法

划线法、箭头法。 划线法:

1、考察参与人1的最优战略

2、用上述方法找出参与人2的最优战略

3、找出最优战略组合 箭头法:

1、 对于每个战略组合,检查是否有参与人会偏离这个战略组合

2、 直至找出没有参与人会偏离的战略组合

纯战略均衡反映函数:各博弈方选择的纯策略对其他博弈方纯策略的反应。

1.4 混合战略纳什均衡

混合战略:

在博弈 中,对任一参与人i ,设Si={S i 1,…,S i k

},则参与人i 的一个混合战略为定义在战略集Si 上的一个概率分布δi={δi 1,…, δi k },其中δi j

(j=1,…,k )表示参与人i 选择战略 表示参与人i 选择战略S i j 的概率的概率,即δi j

满足0≦δi j

≦1,其中概率之和为1。

支付:混合战略的支付为各种概率下收益的加权平均。 混合战略纳什均衡:

在博弈 中,混合战略组合δi={δ1*,…, δn *}为一个Nash

均衡。 当且仅当 。

混合战略Nash 均衡的求解: 1. 支付最大化法; 2. 支付等值法;

混合战略均衡反映函数:在混合策略的范畴内,博弈方的决策是选择概率分布,因此,反应函数就是一方对另一方选择的概率分布的反应。 聚点均衡:在现实生活中,参与人可能使用某些被博弈模型抽象掉的信息来达到一个“聚点”均衡。这些信息可能与社会文化习惯、参与人过去博弈的历史有关。 不同均衡概念之间的关系:

占优均衡<重复剔除劣战略均衡<纯战略纳什均衡<混合战略纳什均衡 1.5 纳什均衡的多重性与存在性

存在性:每个有限战略式博弈(参与人与相应的战略集均为有限)必存在纳什均衡,这个均衡可能是纯战略纳什均衡,也可能是混合战略纳什均衡。

多重性:一个博弈可能有多个均衡,博弈论并没有一个一般的理论证明,哪一个纳什均衡结果一定能出现。

11{;,...,;,...,}n n G S S u u =Γ11{;,...,;,...,}n n G S S u u =Γ***

,,(,)(,)i i i i i i i i i v v σσσσσ--?∈Γ?∈∑≥有

2、完全信息动态博弈

2.1 完全信息动态博弈特点:在博弈开始之前参与人之间的信息不存在不确定性,但是参与人行动存在先后顺序。

在完全信息动态博弈中,为了表示参与人之间的信息掌握关系,引入了信息及的概念。 2.2 完全信息动态博弈有关概念:

信息集:信息集I i 是参与人i 决策结的一个集合,它满足以下两个条件: 1、 I i 中的每个决策结都是参与人i 的决策结;

2、当博弈到达I i 时,参与人i 知道自己处在该信息集中的某个决策结,但不知道是哪一个。

在博弈树中,属于同一信息集的决策结一般用虚线连接起来。

结:包括决策结和终点结两类。决策结是参与人采取行动的点时点,终点结是博弈行动路径的终点。

一个信息集可能只包含一个决策结,也可能包含多个决策结。如果只包含一个决策结的信息集就是但单结信息集。如果博弈中所有信息集都是单结的则成为完美信息博弈。 子博弈:是原博弈的一部分,它始于原博弈中一个单结信息集中的决策结x ,并由决策结x 及其后续结共同组成。

1、 子博弈可以作为一个独立的博弈进行分析,并且与原博弈具有相同的信息结构;

2、 原博弈可以作为自身的一个子博弈;

2.3 不完全信息静态博弈均衡——子博弈精炼Nash 均衡:

解决Nash 均衡多重性问题的一种主要方法就是精炼的方法,即在Nash 均衡的基础上,通过定义更加合理的博弈解并剔除不合理的均衡。

子博弈精炼纳什均衡的引入就是将那些包含不可置信威胁战略的纳什均衡从均衡中剔除,从而给出动态博弈结果的一个合理预测。即子博弈精炼纳什均衡要求均衡战略的行为规则在每个信息集上都是最优的。

扩展式博弈的战略组合 ,是一个子博弈精炼Nash 均衡,当且仅当满足以下条件:

1、是原博弈的Nash 均衡

2、在每一个子博弈上构成Nash 均衡

一个战略组合是子博弈精炼Nash 均衡当且仅当它对所有的子博弈(包括原博弈)构成Nash 均衡,同时也意味着原博弈的Nash 均衡并不一定是子博弈精炼Nash 均衡,除非它还对所有子博弈构成Nash 均衡。

2.4 不完全信息静态博弈均衡求解——逆推归纳法

逆推归纳法是最常用的求解子博弈精炼Nash 均衡的方法,其步骤为:

其中Γ(x i )代表博弈中由最底层到博弈起点的顺序,以Γ(x 3)为最底层,则有: 1、 找出博弈的所有子博弈;

2、 按照博弈进程的“反方向”逐一求解各个子博弈,即最先求解最底层的子博弈,再求解上一层的子博弈,......,直至原博弈。

由于逆推归纳法对各个子博弈逐一进行求解,因此,逆推归纳法所得到的解在各子博弈上构成Nash 均衡,即意味着逆推归纳法所得的解为子博弈精炼纳什均衡 2.5 完全信息动态博弈中承诺行动的均衡结果分析: 承诺行动:就是在博弈开始之前参与人采取某种改变自己支付或战略空间的行动,该行动使原本不可信的威胁变得可信。但是参与人的承诺行动是有成本的,否则这种承诺就不可信。

***

1(,...,) n s s s

例子:

要挟诉讼

要挟诉讼就是指那种原告几乎不可能胜诉而其惟一的目的是希望通过私了而得到一笔赔偿的诉讼。该博弈的结果为原告选择不指控,博弈结束。博弈的结果似乎与人们观测到的现实并不相符,因为现实中人们常常看到各种“要挟”发生。在上述模型中,“要挟”之所以没有成功,关键在于原告将会起诉的威胁并不可信。

要是威胁变得可信,就必须采取承诺行动(沉没成本)。这样参与人的威胁就会变得可信,从而使其他博弈参与人改变策略。 2.6 重复博弈议题:

1、将来可信的威胁或承诺如何影响到当前的行动

2、在一次博弈中无法实现的均衡,在重复博弈中能否实现 有限次重复博弈:对于给定的阶段博弈G ,令G (T )表示G 重复进行T 次的有限重复博弈,并且在下一次博弈开始前,所有以前博弈的进程都可被观测到。 有限次重复博弈均衡结论:

如果阶段博弈G 有唯一的Nash 均衡,则对任意有限的T ,重复博弈G (T )有唯一的子博弈精炼解,即G 的Nash 均衡结果在每一个阶段重复进行。

而且在有限次重复博弈中,如果在单阶段博弈中均衡解不只有一个,则对将来行动所作的可信威胁或承诺可以影响到当前的行动。

无限次重复博弈:给定一阶段博弈G ,令 G(∞, δ)表示相应的无限重复博弈,其中G 将无限次的重复进行,且参与人的贴现率为 。对每个t ,之前t -1次阶段博弈的结果在t 阶段开始进行前都可以被观测到,每个参与人在 G(∞, δ)中的收益都是该参与人在无限次的阶段博弈中所得收益的现值。 无限次重复博弈的解——无名氏定理:

令G 为一个n 人阶段博弈,令(e1,e2,…,en )为G 的一个Nash 均衡下的收益,且用 (x1,x2,…,xn)表示G 的其它任何可行收益, 表示可行收益的集合。 若存在

则存在贴现率δ,使无限重复博弈G(∞, δ)存在一个子博弈精炼Nash 均衡,其平均收益可达到(x1,x2,…,xn)。

无名氏定理的解释:在无限次重复博弈中,如果参与人具有足够的耐心(只要δ满足一定的条件),那么任何满足个人理性的可行收益向量都可以通过一个特定的子博弈精炼Nash 均衡得到。

影响重复博弈结果的因素:影响重复博弈结果的是重复的次数和信息的完备性。 2.7 子博弈精炼Nash 均衡与Nash 均衡的区别:

由于子博弈精炼Nash 均衡在任一决策结上都能给出最优决策,这也使得子博弈精炼纳什均衡不仅在均衡路径(即均衡战略组合所对应的路径)上给出参与人的最优选择,而且在非均衡路径(即除均衡路径以外的其它路径)上也能给出参与人的最优选择。即子博弈精炼Nash 均衡不会含有参与人在博弈进程中不合理的、不可置信的行动。

3、 不完全信息静态博弈

3.1 不完全信息静态博弈特点:在博弈开始之前参与人之间的信息存在不确定性,但是参与人同时行动或者不是同时行动但是后行动者不知道行动者的行动信息。

在不完全信息静态博弈中,在博弈开始前存在关于博弈人信息的不确定性,这个不确定像通常是博弈参与人的类型。

, ,i i i x e i x X >?∈对

博弈论知识点总结完整版

博弈论 (一):基本知识 1.1定义:博弈论,又称对策论,是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论,是研究竞争的逻辑和规律的数学分支。即,博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间的均衡。 1.2基本要素:参与人、各参与人的策略集、各参与人的收益函数,是博弈最重要的基本要素。 1.3博弈的分类:博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议(binding agreement)。倘若不能,则称非合作博弈(Non-cooperative game)。 合作博弈强调的是集体主义,团体理性,是效率、公平、公正;而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,强调个人理性、个人最优决策,其结果有时有效率,有时则不然。目前经济学家谈到博弈论主要指的是非合作博弈,也就是各方在给定的约束条件下如何追求各自利益的最大化,最后达到力量均衡。 博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息,是否了解两个角度进行。把两个角度结合就得到了4种博弈: a、完全信息静态博弈,纳什均衡,Nash(1950) b、完全信息动态博弈,子博弈精炼纳什均衡,泽尔腾(1965) c、不完全信息静态博弈,贝叶斯纳什均衡,海萨尼(1967-1968)

d、不完全信息动态博弈,精炼贝叶斯纳什均衡,泽尔腾(1975)Kreps, Wilson(1982) Fudenberg, Tirole(1991) 1.4课程主要内容:完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈 1.5博弈模型的两种表示形式:策略式表述(Strategic form), 扩展式表述(Extensive form) 1.6占优均衡: a、占优策略:在博弈中如果不管其他参与人选择什么策略,一个参与人的某个策略给他带来的支付值始终高于其他策略,或至少不劣于其他策略,则称该策略为该参与人的严格占优策略或占优策略。 对于所有的s-i, si*称 为参与人i的严格占优战 略,如果满足: ui(si*,s-i)>ui(si',s- i) ? s-i, ? si' ?si* b、占优均衡:一个博弈的某个策略组合中,如果对应的所有策略都是各参与人的占优策略,则称该策略组合为该博弈的一个占优均衡。 1.7重复剔除严劣策略均衡: a、“严劣”和“弱劣”的含义: 设 s i’和s i’’是参与人i可选择的两个策略,若对其他参与人的任意策略组合s-i, 均成立 u i(s i’, s-i) < u i(s i’’, s-i), 则说策略s i’严劣于策略s i’’。 上面式子中,若将“<”改为“≤”,则说策略s i’弱劣于策略s i’’。 b、定义:重复剔除严格策略就 是各参与人在其各自策略集 中,不断剔除严劣策略…如 果最终各参与人仅剩下一个 策略,则该策略组合就被称 为重复剔除严劣策略均衡。

博弈论课程心得体会

《博弈论与信息经济学》课程心得体会 作为一名会计专业硕士,我选修这门课程是为了了解和学习一种思想方法,这种方法我很早就感兴趣,电影《美丽的心灵》中纳什的故事让博弈论在我心中显得非常神秘和高大上。第一堂课吕老师谈到博弈论已经成为一种主流方法时,学习的欲望变得更为强烈。经过九周的学习,尽管由于有些地方因为数学能力有限,不得尽懂,但我觉得自己起码已经揭开了这种方法的入门和核心的面纱。 我认为,会计专业硕士是为了培养立足于会计的高级管理人才而设置的,除了扎实的专业知识和理论功底,我觉得掌握思想方法是尤为重要的能力。面对会计行业的变革,作为一名研究生,财务管理能力和管理会计能力是我的核心竞争力。这两种能力需要缜密的思维,科学的方法。如果说缜密的思维更需要在学习和实践中不断历练,科学的方法就需要不断地去接触和了解,不断地去主动学习。博弈论就是一种科学的方法。我觉得博弈论是一种寻求均衡的科学,也是一种创造规则的科学。它让我了解面对不同利益相关者时怎么去寻求均衡、博弈,甚至创造有益的规则。同时,它让我有了一种更加科学、简洁的视角看待事物,非常实用有效而且简单漂亮。 博弈论的核心应该是纳什均衡,这是一个理性的策略组合,每个参与者在对方的选择一定情况下会做出纳什均衡策略组合中的策略。这种选择将是每个理性参与人最终的选择。这个道理很明了,也正是明了让这个理论非常有力。吕老师带着我们解决一个又一个案例中的问题时,我感觉到这种方法的神奇和独特。我印象里最深的是吕老师对法律的看法:法律让不可置信的承诺变成可置信的承诺,好的法律是看似严苛,但很少有人触犯它。以前在学习经济法时,我对“法律是一种合同”这种观点不是很在意,吕老师的说法让我有了新的认识。让不可置信承诺变成可置信的承诺,使得最有益的策略组合成为纳什均衡,在这一点上合同和法律的目的和性质是一样的。我还记得吕老师说《反国家分裂法》是一部非常好的法律,在以前我因为它几乎很少被使用而感觉不到这部法律的重量,但从博弈论的角度来看,这部法律使得针对台湾,宣布独立就会被制裁成为一种可置信的承诺,吕老师的解释让我非常赞同。我真的觉得自己看某些问题的视角发生了变化,更加地深刻和科学。 我觉得正是这种视角是我学习这门课程最大的收获。我知道,短短九周的学习远远不足以掌握博弈论,我甚至或许不能完整地计算出一道例题,但是我对它有了一个基本的认识,理解它的理论基础,最重要的在看一些问题时我可以尝试着用博弈论的角度去试试看。最可怕的不是不会用博弈论的技术和方法,可怕的是在能够使用它时我不知道以它的角度去看待问题,知道可以使用这门科学的技术和方法。经过这两个多月的课程,相信将来如果用的着这种方法时,我知道从哪里着手去学习。

博弈论的书心得体会

博弈论的书心得体会 篇一:阅读博弈论类书籍的心得体会 阅读博弈论类书籍的心得体会 图书情报宋静思 最近阅读的书目主要围绕在博弈论领域,由浅入深的从博弈论平话类书籍到博弈论的理论应用类书籍都有一些涉猎。近一个月来我所阅读的书目主要有王则柯的《新编博弈论平话》、高志明的《生存博弈》、黄涛的《博弈论教程—理论、应用》以及张维迎的《博弈论与信息经济学》。由于个人能力与知识储备的限制,对以上书目的认识理解和心得也是有限的,下面我仅对上述书目中能够引起我思考的一些理论和案例展开分析并阐述我的一点见解,以及提出我所认为的这些博弈理论可以分析的社会现象。 一、对博弈论平话类书籍的心得 首先从王则柯教授的《新编博弈论平话》和高志明教授的《生存博弈》这两本书使我我深刻的认识到博弈论作为一种科学的思维方法对我们在日常生活中科学的做出决策有重大的意义。它们都是以比较浅显的例子和故事普及博弈论的一些知识和方法,阐发博弈论的一些思想和观念。从囚徒困境、情侣博弈、诺曼底登陆模拟和慕尼黑谈判模拟等能够引起读者兴趣的故事入手,介绍静态博弈、动态博弈、纳

什均衡、零和博弈、双赢对局、帕累托优势、子博弈精炼纳什均衡等博弈论的基本概念,以及劣势策略消去法、相对优势策略下划线法、确定混合策略纳什均衡的反应函数法、动态博弈的倒推法等博弈论基本方法,在以上两本书的论述中很少使用到高等数学的知识,这两本书是使我对博弈论产生兴趣的启蒙老师,帮助我了解博弈论的若干初步知识。 从最初对这两本书的阅读我真正理解了什么是博弈决策,就拿我们生活中报考什么学校、从事什么职业、选择何种方式度过周末闲暇时光等这些例子来说,之所以称之为博弈决策,是因为在这些例子当中,我的身边往往存在和我情形相似的决策者,我们的思维和行动相互之间产生着很微妙的互动影响。博弈论研究的目的,就是要清晰地揭示蕴涵于这种互动影响中的基本概念和原理,从而帮助我们建立策略思维的意识。 看过囚徒困境后,我明白了为什么寡头企业不选择在市场上结盟而是竞相采取低价策略企图抢占更多的市场份额;又为什么多数情形是非合作博弈。虽然通过囚徒困境的博弈分析我可以理解上述现象产生的原因,然而究其根本原因,是什么导致了囚徒困境呢?这不禁引发了我的思考。设想如果两个罪犯充分相信同伙遵守最初的约定死咬着抵赖会有最后的困境出现么?如果联盟内部成员相信彼此遵守约定

(完整版)博弈论知识点总结

博弈论知识总结 博弈论概述: 1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 博弈论研究的假设: 1、 决策主体是理性的,最大化自己的收益。 2、 完全理性是共同知识 3、 每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念 与预期 2、和博弈有关的变量: 博弈参与人:博弈中选择行动以最大化自己受益的决策主体。 行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。 信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息) 等的信息。 完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息。 不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。 支付:决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。 从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别: 3、博弈论与传统决策的区别: 1、 传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己 效用,研究工具是无差异曲线。可表示为:maxU(P ,I),其中P 为市场价格,I 为消费者可支配收入。 2、 其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定 下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式:战略式博弈和扩展式博弈 战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。 战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合 : 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn). 扩展式博弈:是博弈问题的一种规范性描述。 与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。 包含要素: 1、 参与人集合 {1,2,...,}n Γ={1,2,...,}n Γ=11(,...,,...,)n i i n i s s s s ==∏

(完整word版)博弈论给我的心得

博弈论给我的心里体会 潘慧明 201202034049 12金融数学 我是大学第二学期开始选修学习《博弈论》的,并且以前对它停留在表面意思。而在我的进一步对《博弈论》的学习下,我懂得了这门课程在我们的生活中无处不在,在未学习这门课程之前我对身边发生的一些事情无法用一个专业的学说来概述,经过这个学期的学习后,我才知道我身边发生的很多事情都可以用这门课程概述。那么什么是“博弈论”?所谓的“博弈论”——就是研究决策主体的行为发生直接相互作用时的决策及这种决策的均衡问题。并且学习后我还有个感受就是:博弈论有两个比较enlightening的观点,一是more information can hurt you(掌握更多的信息可能是一件坏事),二是more options can hurt you(拥有更多的选择可能是一件坏事).虽然博弈论主要用于研究经济问题,但是我觉得这些原理在我们现实生活中同样是适用的。 而且经过这段时间的学习,我现在对《博弈论》有了些比较肤浅的认识。诚然,一门学问想在短时间内有所深入理解是不现实的。生活之中到处充满着博弈,有人说没有,那是因为缺少发现博弈现象的眼睛。因此在生活中我们要懂得学以致用,要会灵活的去使用这门学科。 人生就是在弈棋,学会博弈。虽说博弈不是万能的,但没有博弈现象存在的生活是万万不能的。 社会生活中,共赢是一种优良的博弈方式。双赢策略其实是一种很高的智慧,帮助别人的同时接受别人的帮助,双方最终将获得独自奋战所不能拥有的东西。放弃内心的宁予外贼不予家奴的思想。中国人对竞争的理解大多不是“你死”就是“我活”,胜利的含义似乎就是阻止别人成功,可是这“胜利”是那么虚假,经不起风吹雨打,经不起时间考验。拥抱双赢,拥抱明天。双赢强调的是博弈双方的利益都要兼顾,就是所谓的“赢者不全赢,输者不全输”。但是双方都得到了满意的结果。这些双赢的事例,在商务上经常可以看到的。如:商务上的谈判,完完全全的运用到了《博弈论》的知识与原理来分析问题,并且从而找到最佳的均衡点,也就是最好的解决方法。 在所有的对抗和较量中,其胜负成败常常取决于三个基本的因素:机会或者说运气、体能和智能。头脑技能是一种策略技巧,或者说是在谋略方面的造诣。既然世间大多数对抗都与头脑技能有关,因此人们试图获得成功,就有必要研究在对抗局势中如何策略性地选择自己的行动。而今,博弈论就是一门专门研究互动局势下人们的策略行为的学问。事实上,每

博弈论 教案

《两种常见的博弈论模型》一课教案 审签: 2010 年 4 月 13日 班 级 课程名称 经济学基础 教 师 授课 时间 课 型 授课地点 课 题 项 目 认识完全信息静态博弈、完全信息动态博弈 课 时 任 务 通过学习完全信息静态、动态博弈,认识价格战及搭便车现象。 任务分解 1、知识准备:明确博弈论常见的5种分类及类型。 2、案例举例:囚徒困境、智猪博弈 3、模拟测试:分小组,应用所学独立解决智猪博弈问题。 教学 目标 专业能力 通过学习,能够运用博弈论知识分析解决“双寡头价格战问题”及生活中的搭便车现象。 知识目标 1.掌握博弈论的分类; 2.掌握完全信息静态及完全信息动态博弈论模型; 3.学会运用博弈论知识分析、解决分析价格战、搭便车的问题。 方法能力 1、培养学生的独立思考的能力; 2、培养学生学习博弈论的兴趣及爱好; 2、培养学生的团队合作及逻辑思维能力。 重 点 掌握完全信息静态博弈及其扩展运用。 难 点 运用博弈论知识解决分析价格战等恶性竞争问题及搭便车现象。 课堂练习 小组合作完成完全信息动态博案例—“卖鞭炮的选择” 课后作业 完成课后思考题 教学策略与方法 启发 讲解 任务驱动 多媒体演示 自主 描述 案例 分析 小组 讨论 归纳总结 实践 操作 √ √ √ √ √ √ √ √ 课后回顾 本次课程的优点: 存在的问题: 改进设想:

项目名称:博弈论与决策策略 任务:能够自主分析博弈论的模型并分析解决问题 一教学组织活动总过程设计:1、师生问好2、班长报告人数 老师活动:1、问好2、环顾学生 学生活动:1起立问好2、坐姿端正3、班长清 点人数,向老师报告。 活动达到的目标时间分配 创设情境,使学生注 意力集中,进入学习 状态 1分钟 二课程导入情境导入: 复习旧课,导入新课 以《囚徒困境》博弈论案例视频引入 老师活动: (1)老师引导学生回忆上节 课所学的内容,复习博弈论的五种 基本分类方式及类型。(2)播放关 于囚徒困境的视频,点出其中的重 点,并向学生提问。 学生活动: 跟着老师的思路回 忆上节课所学的内容。 认真观看视频并思考老 师所提问题。 活动达到的 目标: 复习旧课内 容为新课做 铺垫,视频 引入抓住学 生焦点。 时间分 配: 5分钟 三教学过程认识完全信息静态博弈 活动项目一:囚徒困境(11分钟) 1、首先,老师给出囚徒困境的博弈论模型。“囚徒困境模型”:该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果两个犯罪嫌疑人都坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪,各被判刑6年;如果只有一个犯罪嫌疑人坦白,另一个人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑3年,而坦白者有功被减刑6年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。 提问:对于囚犯A而言,他会选择什么样的策略,囚犯B如何呢?(给2分钟时间让学生思考并分析此问题,并让他们尝试通过表格表达出囚犯A及B可能选择的策略及面临的后果) 我们来看看这个博弈可预测的均衡是什么。对A来说,尽管他不知道B作何选择,但他知道无论B选择什么,他选择“坦白”总是最优的。显然,根据对称性,B也会选择“坦白”,结果是两人都被判刑6年。(老师讲解,板书,学生对照自己所写跟老师是否一致) 提问:那么囚徒困境在我们生活中的哪些地方同样存在呢? 补充介绍“囚犯困境”的扩展:双寡头企业价格战、军备竞赛等。 归纳总结完全信息静态博弈的3点特性:(1)同时做出选择;(2)明确对方的选择与游戏规则(共同知识);(3)不管是否沟通过,无法做出有约束力的承诺(非合作)(最好由学生归纳出)

博弈论初学心得总结(可编辑修改word版)

博弈论学习心得 (全校性选修课期末论文) 序:初识博弈论 通过“囚徒困境”,我走进了博弈论这一精彩世界。为了让大家对博弈思想有一认识与掌握,老师课堂上让我们思考了不少或生动或实际的问题,比如“帽子”问题、强盗分金币问题、猜 全班数字的平均数问题、拍卖问题、市场进入问题等等。我曾自嘲地对舍友说:博弈论简直就 是对智商的考验,总觉得自己脑子不够使啊。不过,我相信,学习博弈论是会使人变聪明的,脑子越用越灵嘛。 学习博弈论的过程中,脑子里经常出现的几句话是:原来这个问题可以这么去想,原 来这种问题还可以用博弈的思想来解决,原来博弈的应用范围这么广,原来看似与数学无 关的问题都可以通过数学来解决。 博弈论,为我呈现了一方新天地。我好奇它的广度,敬畏它的深度,视之如导师如利器,小心摸索着。 一、博弈思想 学习博弈论,我最大的收获不是记住了什么模型、公式、转换,而是博弈思想。“授之 以鱼,不如授之以渔”,博弈思想尤如“渔”一般重要,是分析问题的基础。 博弈,需要换位思考,需要知已知彼。一定要充分考虑自己和其他参与者的各种战略 以及对彼此的影响,从而采取最佳行动。 比如课堂上一个问题:让每个人选一个介于1~100的数,谁的数字最接近全班平均 数的2/3,谁就是赢家。如果每个人随机选择的话,大家平均值应该在50 左右,50 的2/3 应该是33. 3,不过其他人可能也想到了这一点,这样就应该写22.2。如果继续想下去, 大家的平均值应该越来越小,最后1应该是理性分析的最佳答案。实际结果,普通如我的 只想了一步,33,有的人多想了一步,有的人多想了两步……答案总不会是1。 其实答案是什么不重要了,重要的是一个思考的过程。是一个“你知道我知道你知道 我知道你知道……”的N次换位思考的过程,你要知道他人有有多聪明,还要站在对方的 角度考虑对方认为你有多聪明…… 面对一些事情时,可能不需要过分多虑,太过天才,在一群平凡人中,反而不会是赢家。比如那些选了1的人。但是换位思考的方式却是受用终生的,可指导我们少吃亏、少 走弯路、尽可能快乐且适如地生活在复杂的社会中。 博弈的另一个重要思想,我认为是缜密的逻辑推理、全局意识以及化繁为简的转换。 比如在不完全信息博弈中,你所了解的信息是有限的,这就需要你想出各种可能性以及各 种战略组合下的收益。要分析别人的心理、分析影响别人行动的因素,分析各种战略组合 的概率,从而执果索因,比如完全信息动态博弈中的“逆向归纳法”,比如通过“海萨尼转换”将不完全信息博弈表述为完全但不完美信息的博弈(市场进入问题),从而充分利用已 有信息找到最优战略或均衡。可谓是“眼观六路,耳听八方”,“运筹帷幄”。 二、博弈案例分析两则

博弈论知识点总结

博弈论知识总结 博弈论概述: 1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 博弈论研究的假设: 1、 决策主体是理性的,最大化自己的收益。 2、 完全理性是共同知识 3、 每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念 与预期 2、和博弈有关的变量: 博弈参与人:博弈中选择行动以最大化自己受益的决策主体。 行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。 信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息) 等的信息。 完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息。 不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。 支付:决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。 从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别: 3、博弈论与传统决策的区别: 1、 传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己 效用,研究工具是无差异曲线。可表示为:maxU(P ,I),其中P 为市场价格,I 为消费者可支配收入。 2、 其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定 下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式:战略式博弈和扩展式博弈 战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。 战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合 : 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn). 扩展式博弈:是博弈问题的一种规范性描述。 与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。 包含要素: 1、 参与人集合 {1,2,...,}n Γ={1,2,...,}n Γ=11(,...,,...,)n i i n i s s s s ==∏

博弈论心得体会

博弈论心得体会 最初选择博弈论,是因为看了《美丽心灵》电影后,因而对John Forbes Nash Jr和博弈论产生了浓厚的兴趣。当看到选修课新开了博弈论,简直激动的不能自已,迫不及待就报名参加了。而在我的进一步对《博弈论》的学习下,我懂得了这门课程在我们的生活中无处不在。 博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。博弈论思想古已有之,中国古代的《孙子兵法》等著作就不仅是一部军事著作,而且算是最早的一部博弈论著作。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。 博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。 在社会中,人与人之间的对抗和较量是一个不容回避的话题,只有直面这些问题,个人才更有可能获得成功的机会。在所有的对抗和较量中,其胜负成败常常取决于3个基本的因素:机会或者说运气、体能和智能。通过抛硬币来赌输赢是纯粹依赖于个人运气的游戏;百米赛跑的胜负基本上取决于个人的全身技能;而篮球赛、战争等对抗,虽然也会受到运气的影响,体能也很重要,但决定胜负的更重要的因素是头脑技能的较量。 头脑技能是一种策略技巧,或者说是在谋略方面的造诣。既然世间大多数对抗都与头脑技能有关,因此人们试图获得成功,就有必要研究在对抗局势中如何策略性地选择自己的行动。而今,博弈论就是一门专门研究互动局势下人们的策略行为的学问。事实上,每个人每天都在与他人打交道,或竞争或合作。身处这样高度互动的环境之中,无论一个人是否知道博弈论,实际上他都不断地在与他人进行博弈,无论是他的父母、亲人、兄弟、老师还是商场对手、政治敌人……一个人可能不知道博弈论为何物,但是他的确常常在与他人进行着对抗和较量,在进行着一场又一场博弈;而生存本能,也让人们在不知不觉中学会了不少技巧。难怪经济学家萨缪尔森这样说着:“要在现代社会做一个有文化的人,你必须对博弈有一个大致的了解。”不过,对于大多数的人来说,学习博弈论并不是一件轻松的事情。 因为正式的博弈理论往往是用数学语言表达出来的,而社会中的大多数人都有数学恐惧症,虽然对于少数人来说数学的形式是那么优美,但大多数人把博弈论的学习看做是一件艰难的而痛苦的事情。 如果我们能熟练地掌握这一部分博弈论知识,对我们的学习和工作都大有裨益。深感短短一个学期的时间,对于博弈论这一门独具魅力的课程,只是从皮毛上略有了解。尽管如此,我还是学会了一种以博弈的观点来思考、分析、判断、解决问题的方法。就好比囚徒博弈的现象,我以前可能能够猜到结果,但这只是知其然而不知其所以然罢了。然而现在可就不同了,相似的问题我都能够用所学的博弈论知识去解释,能够了解其本质了。 我学过一段时间博弈论,一些思维过程中也可能自觉不自觉地使用一些博弈论思想,当制订政策或游戏规则,要保证所有人有参与积极性。这来源于“纳什均衡”概念,说起来当然简单。但我自己觉得,以前所知道的这条道理——制订游戏规则要保证所有人有参与积极性——是简单接受,没有逻辑,或者,在直觉层次觉得这是对的,但没有认识到它为什么对。千万不能把别人当傻瓜,如果把别人当傻瓜,吃亏的是自己,就像那个卖猫的故事。

博弈论知识点总结

博弈论知识点总结

博弈论知识总结 博弈论概述: 1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 博弈论研究的假设: 1、决策主体是理性的,最大化自己 的收益。 2、完全理性是共同知识 3、每个参与人被假定为可以对所处 环境以及其他参与者的行为形成正确的 信念与预期 2、和博弈有关的变量: 博弈参与人:博弈中选择行动以最大化自己受益的决策主体。 行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。 信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完 全信息)等的信息。

1、

2、 既定下,消费者效用只依赖于自己 的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式:战略式博弈和扩展式博弈 战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。 战略式博弈是一种假设每个参与人仅 选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合 : 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn). 扩展式博弈:是博弈问题的一种规范性描述。 与战略式博弈侧重博弈结果的描述相 比,扩展式博弈更注重对参与人在博弈过程 {1,2,...,} n Γ=11 (,...,,...,) n i i n i s s s s ==∏

博弈论基础复习

《博弈论基础》主要知识点 一、名词解释(5×2=10分) 策略型博弈它是由三个部分组成,即局中人、策略和各种策略组合中所得到的利益。 纳什均衡指参与博弈的每一局中人在给定其他局中人策略的条件下选择上策所构成的一种策略组合。 混合策略局中人的混合策略是其纯策略空间上的一种概率分布,表示局中人实际博弈时根据这种概率分布在纯策略中随机选择加以实施。 扩展型博弈博弈存在着局中人行动的先后次序,是对具有动态结构的决策形式进行研究的规范分析工具。 博弈树对于任何一种双人完备博弈,都可以用一个博弈树来描述,并通过博弈树搜索策略寻找最佳解。博弈树类似于状态图和问题求解搜索中使用的搜索树。 完美信息博弈是指一次只有一个局中人在行动,而且他在行动时知道博弈的所有以往行动历史的一类特殊博弈。 子博弈指由原扩展型博弈中的一个决策节点与它的所有后续节点组成的博弈。行为策略是指每一个参与人在每一个信息集上随机的选择行动。 逆向归纳法逆向归纳法是求解子博弈精炼纳什均衡的最简便方法。在求解子博弈精炼纳什均衡时,从最后一个子博弈开始逆推上。 冷酷策略又称触发策略。指参与人在开始时选择合作,在接下来的博弈中,如果对方合作则继续合作,而如果对方一旦背叛,则永远选择背叛,永不合作。 类型 :一般地,将一个参与人所拥有的所有私人信息称为他的类型。 信号博弈是研究具有信息传递作用的信号机制的一般博弈模型,其基本特征是两个博弈方,分别称为信号发出方和信号接收方。 分离均衡信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者以概率1选择不同的信号,接收者完全可以通过信号来准确判断出发送者的类型。 混同均衡信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者选择了相同的信号,接收者无法从信号中得到新的信息,无法对先验信念进行修正。 特征函数特征函数型博弈对每一种可能联盟给出相应的联盟总和收益,也就是给出了一种集合函数,称为特征函数。 联盟

北大学习心得体会

北大学习心得体会 篇一:北京大学培训学习心得体会 北京大学培训学习心得体会 适逢大地苏醒、春暖花开之时,在区委的亲切关怀下,作为一名基层领导干部,我有幸参加了北京大学******领导干部前沿热点与公共管理高级研修班,在北京大学进行了为期一周的培训学习。有幸触摸了北大的百年文明,品读了伟大首都经济社会协调发展的精髓。通过学习,启发很大,受益匪浅,感慨颇多,同时也有很多个人心得体会,由于听课覆盖面较大,内容也较多,有些还来不及消化,不能一一陈述。在此就我的体会和感悟,结合自身工作,简要加以剖析。 培训期间,我们聆听了教授专家们深入浅出的讲座、激情飞扬的介绍、通俗易懂的解析,如哲学系杨立华教授的《儒家精神与现代生活》、政府管理学院白彦副教授的《中国式领导科学》、国家发改委经济研究所副司长藏跃茹的《“十二五”规划与转变经济增长方式》、清华大学社会学习系孙立平教授的《转型时期的社会和社会问题》、经济学院雎国余教授的《“十二五”规划与中国经济》、经济学院张延教授的《公共管理中的博弈论》、医学部唐登华教授的《领导者压力管理与心理调适》、新闻与传播学院姚惠忠副教授的《政府公共关系与危机处理》等。同时还结合教学内容进行了学习考察。一路学习,一路思考;感受北大人的新思想、新观

念,感慨首都经济社会协调发 展的高速度、高质量,倍受震憾,倍受启发。此次参观学习时间短,但学习内容丰富,拓宽了我们的视野,增长了见识,增强了我们加快发展经济的信心。 洗礼:全新感受 我们受训的北京大学历史悠久、人文厚重,是中国第一所国立综合性大学,作为新文化运动的中心和“五四”运动的策源地,作为中国最早传播马克思主义和民主科学思想的发祥地,作为中国共产党最早的活动基地,北京大学为民族的振兴和解放、国家的建设和发展、社会的文明和进步做出了不可替代的贡献,在中国走向现代化的进程中起到了重要的先锋作用,是国家培养高素质、创造性人才的摇篮、科学研究的前沿和知识创新的重要基地和国际交流的重要桥梁和窗口。据不完全统计,北京大学的校友和教师有400多位两院院士,中国人文社科界有影响的人士相当多也出自北京大学,是国家“211工程”和“985工程”重点院校。北京大学培训中心良好的培训条件和培训效果得到中组部的充分肯定,XX年被中组部、教育部确定为全国首批干部教育培训高校基地。 这次领导干部前沿热点与公共管理培训采取课堂讲授与参观考察相结合的形式,精心设置课程。主讲的教授都经过培训中心反复筛选,具有丰富的理论素养,具有很高的知

博弈论论文

博弈论论文 Prepared on 22 November 2020

博 弈 论 姓名:XXX 学号:XXXXXXXXXXX 专业班级:XXXXXXXXXXXXX 博弈论课堂回顾与总结 还记得当时在纠结抢什么选修的时候,朋友说博弈论好呀!老师经常让我们玩游戏,而且可以学到很多东西。于是乎我就在朋友的强力推荐下抢到了大学的最后一门选修课——博弈论。时光匆匆,转眼12周过去,博弈论课程也接近尾声,在这我以这篇文章回顾总结一下这十三周的课堂与收获。 课堂总结: 博弈论的第一课老师给我们讲了博弈论的定义,让我们首次认识和了解博弈论: 1、博弈论又被称为对策论既是现代数学的一个新分支,也是运筹学的一个重要学科。 2、博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们

的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。3、博弈论已经成为经济学的标准分析工具之一。在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。4、基本概念中包括局中人、行动、信息、策略、收益、均衡和结果等。其中局中人、策略和收益是最基本要素。局中人、行动和结果被统称为博弈规则。 在随后的课堂里,老师分别给我们讲了:纳什均衡、囚徒困境、重复博弈、一次博弈、一报还一报(以牙还牙、以眼还眼、悔过的一报还一报、以怨抱怨、以德报怨、以直报怨)、人质困境(多个人的囚徒困境)、酒吧博弈(非线性预测)、枪手博弈(先发优势与后发制人)、智猪博弈、斗鸡博弈、协和谬误等。老师详细讲解了它们的定义、条件、破解、策略以及运用。 例如: 一.酒吧博弈(非线性预测) 前提条件限制:要做出正确的预测必须知道他人的抉择,过去的历史是“任意 的”,未来就不可能得到一个确定的值。 现实启示:1.从一非线性系统整体来说,其变化经济不可预测 2.对于一个混沌系统中个体来说,在无法预测过程中也可采取恰当策 略,并可趋吉避凶,即少数者策略 二. 囚徒困境: 基本精神是背叛,处于囚徒困境时,没有什么十全十美的办法能让自己在困境 中逃脱,只能尽量做到自己不受侵害,两利相对取其重,两害相对取其轻 如何设计:1.博弈双方信息沟通流畅 2.博弈双方互不信任

博弈论信息经济学知识点

博弈论与信息经济学 完全信息静态博弈 考察占优战略均衡概念及求解 解题思路:理性参与人做出是最优选择,该博弈存在占优战略均衡,据此可知答案为(3)。 考察重复剔除劣战略占优战略均衡概念及求解 说明:考察重复剔除劣战略,求解占优均衡的方法。答案:(U,L) 下面考察PNE及其解法

妻子 丈夫 (a )请检验,纳什均衡(最优战略组合)是同生共死;均衡结果是同生,或者共死; (b )请检验,占优均衡(占优战略组合)是坚强活着;均衡结果是同生(互相煎熬); (c )请检验,纳什均衡(最优战略组合)是你死我活;均衡结果是死活,或者活死; 显然,(c )情形之下,二人之间的仇恨比(b )中更深。 一些类型的博弈中,PNE 未必存在。以下考察MNE 及其解法 说明:猜谜游戏,是一种典型的零和博弈。这类博弈没有纯战略NE ,但是却存在混合战略 (c ) 活着 死了 (b ) 活着 死了 活着 死了 (a ) 活着 死了 活着 死了

NE。希望大家通过这个例子,加深对NE的概念及NE存在性定理的理解。同时,混合战略NE求解也是本题考察点。以下两个例子,与此相同,供大家练习使用。 模型化如下博弈:两个小朋友一起做猜拳游戏,每人有三个纯战略:石头、剪刀、布。胜负规则为:石头胜剪刀,剪刀胜布,布胜石头,如二人出手相同则未分胜负。二人同时出手。胜者的支付为1,负者的支付为-1,未分胜负时支付均为0。(1)请写出该博弈的支付矩阵,并判断其是否存在占优战略均衡。(2)该博弈是否存在纯战略纳什均衡,是否存在混合战略纳什均衡?如果存在,请写出。 下例来自张维迎,P131。 美国普林斯顿大学“博弈论”课程中有这样一道练习题:如果给你两个师的兵力,你来当司令,任务是攻克“敌人”占据的一座城市。而敌人的守备是三个师,规定双方的兵力只可整师调动,通往城市的道路有甲、乙两条,当你发起攻击时,若你的兵力超过敌人你就获胜;若你的兵力比敌人守备部队兵力少或者相等,你就失败。你如何制定攻城方案? 与零和博弈不同,有些博弈既有PNE,又有MNE。如以下性别战博弈和斗鸡博弈。 性别战博弈:

浙大学习心得体会

执行力提升培训学习体会 ------杨平湘 首先感谢市局党委给我这次赴浙江大学参加执行力提升培训的机会。走进心仪已久的名校,感受到浙大“高端、专业、规范、求实”的办学原则和浓厚的学习氛围,恭耳聆听了浙大倪荣教授、徐旭初教授、项贻强教授、张钢教授、李俊伟教授、蒋文华教授及浙江省委党校郑仓元教授、上海政法学院严励教授等名师的精彩讲授。教授学者们渊博的学识,丰富的教学管理经验、妙语连珠的讲授使我心悦诚服。在这短暂、形式多样、内容丰富的7天培训中,我学到了很多的新知识、新理论,让我受益匪浅,感触良多。本次培训,使我感受最深的有以下几个方面: 一、拓宽了思路,增长了见识 这次培训的内容是为我们公路人量身定做的,有较强的针对性和时效性。既有深入浅出的专业理论知识,又有可操作性的实践经验。授课专家、教授知识渊博、态度严谨、视角独特,为我们打开了解放思想、提升工作理念的窗口。通过学习,使我对当前宏观经济形势与政策解析、心理压力与情绪管理、博弈论与政府管理等尖端知识有了初步的了解,在政务礼仪,社会转型与社会治理创新、提升领导力和执行力等方面有了全新的认识。特别是听了郑仓元老师讲授的

《创新工作方法,提升执行力与领导力》,使我对提升领导力和执行力有了系统的、全新的认识,明白了领导力、执行力的基本内涵。所谓的执行力,顾名思义就是按质按量、不折不扣的完成工作任务,达到预期的目标。而领导力则是指领导者带领组织人员实现目标过程中,能力与权力结合产生的总效力。对于领导力和执行力的概念,虽然早就看到过、听说过,但是理解上很片面和肤浅,对其内涵、重要性和必要性理解不深,掌握不透。在过去的工作中,我过多地关注具体的事务性工作,认为管理就是将科室的工作尽职尽责地完成好,忽略了科室的整体规划和系统的人员教育工作,而路政工作实际操作多,宏观管理少,我对工作谋划不足,创新的意识不强,不利于工作的开展。领导力是执行力的本质,是执行力的保证和保障。而执行力就是执行领导的指令、贯彻领导的意图,所以,离开了领导力就谈不上执行力。执行力它渗透到每项工作的各个方面,执行到位,执行有力,事半功倍。执行不力,执行不到位,事倍功半。可以说,执行力是每项工作成败的关健,执行力就是一个单位、一个团体的生命力。因此,要提升领导干部的执行力,必须要解决好执行的问题,把执行变为自动、自发、自觉的行动,才能园满完成各项工作任务。 二、总结经验,提升能力

博弈论心得体会

博弈论心得体会 今年是我刚刚进入中央广播电视大学的第一年,刚进入大学的第一学期我就学到了一门新的课程,这门课程在我们的生活中无处不在,在未学习这门课程之前我对身边发生的一些事情无法用一个专业的学说来概述,经过一个学期的学习后,我才知道我身边发生的很多事情都可以用这门课程概述,他就是《博弈论》。那么什么是“博弈论”?所谓的“博弈论”——就是研究决策主体的行为发生直接相互作用时的决策及这种决策的均衡问题。 经过一段时间的学习,我对博弈论有了一些肤浅的理解,诚然,一门学问想在短时间内有所深入理解是不现实的。生活之中到处充满着博弈,有人说没有,那是因为缺少发现博弈现象的眼睛。 人生就是在弈棋,学会博弈。虽说博弈不是万能的,但没有博弈现象存在的生活是万万不能的。 社会生活中,共赢是一种优良的博弈方式。双赢策略其实是一种很高的智慧,帮助别人的同时接受别人的帮助,双方最终将获得独自奋战所不能拥有的东西。放弃内心的宁予外贼不予家奴的思想。中国人对竞争的理解大多不是“你死”就是“我活”,胜利的含义似乎就是阻止别人成功,可是这“胜利”是那么虚假,经不起风吹雨打,经不起时间考验。拥抱双赢,拥抱明天。双赢强调的是博弈双方的利益都要兼顾,就是所谓的“赢者不全赢,输者不全输”。但是双方都得到了满意的结果。 在社会中,人与人之间的对抗和较量是一个不容回避的话题,只有直面这些问题,个人才更有可能获得成功的机会。在所有的对抗和

较量中,其胜负成败常常取决于3个基本的因素:机会或者说运气、体能和智能。通过抛硬币来赌输赢是纯粹依赖于个人运气的游戏;百米赛跑的胜负基本上取决于个人的全身技能;而篮球赛、战争等对抗,虽然也会受到运气的影响,体能也很重要,但决定胜负的更重要的因素是头脑技能的较量。 头脑技能是一种策略技巧,或者说是在谋略方面的造诣。既然世间大多数对抗都与头脑技能有关,因此人们试图获得成功,就有必要研究在对抗局势中如何策略性地选择自己的行动。而今,博弈论就是一门专门研究互动局势下人们的策略行为的学问。事实上,每个人每天都在与他人打交道,或竞争或合作。身处这样高度互动的环境之中,无论一个人是否知道博弈论,实际上他都不断地在与他人进行博弈,无论是他的父母、亲人、兄弟、老师还是商场对手、政治敌人……一个可能不知道博弈论为何物,但是他的确常常在与他人进行着对抗和较量,在进行着一场又一场博弈;而生存本能,也让人们在不知不觉中学会了不少博弈技巧。 然而,通过本能所学习的博弈技巧,是既不系统也相当费劲的。因此,人们有必要以一种最为节省的方式来学习策略技巧。而最节省的方式,莫过于直接学习博弈论的知识了。难怪经济学家萨缪尔森这样说着:“要在现代社会做一个有文化的人,你必须对博弈论有一个大致的了解。”事实上,不单一般人应该了解博弈论,各个领域的专家更应该了解博弈论——20世纪后半叶的历史表明,博弈论在军事、政治、商业、法律、经济学、生物学、心理学、社会学、历史学等诸多领域都已有非常成功的运用。

博弈论的总结|博弈论总结

博弈论学习的个人总结刘艳丽 第一部分基本情况 视频来源耶鲁公开课《博弈论》1----5讲,人人影视 参考资料耶鲁校园网 《博弈论--战略分析入门》,美,罗杰A麦凯恩,原毅军译,机械工业出版社,2006,42元《策略博弈》,阿维纳什迪克西特,蒲勇健译,中国人民大学出版社,第二版,2009,65元班级工商,人力08级学生 课时8节 我的时间投入视频26个小时;书籍,25小时;上网时间,无法统计。 第二部分知识层面 一、The five lessons五个基本的结论 1、Don"t play a strictly dominated strategy

2、Rational choices can lead to bad outcomes 3、You can"t get what you want 4、Put yourself in other people"s shoes 5、Yale students are evil 二、Game 2: "pick a number."数字游戏 Without showing your neighbor what you"re doing, put in the box below a whole number between 1 and a 100 [whole number between 1 and 100--integer.] We will calculate the average number chosen in the class. The winner in this game is the person whose number is closest to two-thirds times the average in the class. 三、The Prisoners" Dilemmasome examples囚徒困境 A joint project Price competition

相关主题