搜档网
当前位置:搜档网 › 博弈论小论文

博弈论小论文

博弈论小论文
博弈论小论文

经济学中的“智猪博弈”(Pigs’payoffs)

———“智猪博弈”模型构建造

关键词: 最佳策略指标改变打破智猪博弈困境搭便车协调博弈企业

战略资源配置

古语有云,世事如棋。生活中每个人如同棋手,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们“出棋” 着数中理性化、逻辑化的部分,并将其系统化为一门科学。换句话说,就是研究个体如何在错综复杂的相互影响中得出最合理的策略。事实上,博弈论正是衍生于古老的游戏或曰博弈如象棋、扑克等。数学家们将具体的问题抽象化,通过建立自完备的逻辑框架、体系研究其规律及变化。这可不是件容易的事情,以最简单的二人对弈为例,稍想一下便知此中大有玄妙:若假设双方都精确地记得自己和对手的每一步棋且都是最“理性” 的棋手,甲出子的时候,为了赢棋,得仔细考虑乙的想法,而乙出子时也得考虑甲的想法,所以甲还得想到乙在想他的想法,乙当然也知道甲想到了他在想甲的想法…

现在以经济学中的一个有趣的例子展开本篇论文. 智猪博弈.它是双方实力不相等情况下的博弈,通过分析可以得出结论,是实力强的一方采取主动策略,实力弱的一方要采取等待的策略.

这个例子讲的是:猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹.那么,两只猪各会采取什么策略?答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。

原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。

“小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是:每次落下的事物数量和踏板与投食口之间的距离。如果改变一下核心指标,猪圈里还会出现同样的“小猪躺着大猪跑”的景象吗?试试看。

改变方案一:减量方案。投食仅原来的一半分量。结果是小猪大猪都不去踩踏板了。小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将也会把食物吃完。谁去踩踏板,就意味着为对方贡献食物,所以谁也不会有踩踏板的动力了。如果目的是想让猪们去多踩踏板,这个游戏规则的设计显然是失败的。

改变方案二:增量方案。投食为原来的一倍分量。结果是小猪、大猪都会去踩踏板。谁想吃,谁就会去踩踏板。反正对方不会一次把食物吃完。小猪和大猪相当于生活在物质相对丰富的“共产主义”社会,所以竞争意识却不会很强。

对于游戏规则的设计者来说,这个规则的成本相当高(每次提供双份的食物);而且因为竞争不强烈,想让猪们去多踩踏板的效果并不好。

改变方案三:减量加移位方案。投食仅原来的一半分量,但同时将投食口移到踏板附近。结果呢,小猪和大猪都在拼命地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费完。对于游戏设计者,这是一个最好的方案。成本不高,但收获最大。

智猪博弈的的内容说明了小猪不需要付出劳作,就可以得到份额较大的收益,而大猪的收益却因小猪减少,这实际上是“搭便车”问题,就是不用付出,尽享其成,社会生活中的例子很多,比如一户人家清扫门前积雪,那么对于行人来说,没有付出清雪劳动,就享受了没有积雪的路面。

原版的“智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。但是对于社会而言,因为小猪未能参与竞争,小猪搭便车时的社会资源配置的并不是最佳状态。为使资源最有效配置,规则的设计者是不愿看见有人搭便车的,政府如此,公司的老板也是如此。而能否完全杜绝“搭便车”现象,就要看游戏规则的核心指标设置是否合适了。

比如,公司的激励制度设计,奖励力度太大,又是持股,又是期权,公司职员个个都成了百万富翁,成本高不说,员工的积极性并不一定很高。这相当于“智猪博弈”增量方案所描述的情形。但是如果奖励力度不大,而且见者有份(不劳动的“小猪”也有),一度十分努力的大猪也不会有动力了----就象“智猪博弈”减量

方案一所描述的情形。最好的激励机制设计就象改变方案三----减量加移位的办法,奖励并非人人有份,而是直接针对个人(如业务按比例提成),既节约了成本(对公司而言),又消除了“搭便车”现象,能实现有效的激励。

许多人并未读过“智猪博弈”的故事,但是却在自觉地使用小猪的策略。股市上等待庄家抬轿的散户;等待产业市场中出现具有赢利能力新产品、继而大举仿制牟取暴利的游资;公司里不创造效益但分享成果的人,等等。因此,对于制订各种经济管理的游戏规则的人,必须深谙“智猪博弈”指标改变的个中道理。

智猪博弈从本质上是一种博弈理论的案例研究,因此它的作用是有限的,毕竟理论不同于现实,并不是所有的理论都能很好的解释现实,并不是所有的理论都有非常大的影响,因此,我们应该看具体情况。打破困境.

在新经济时代,传统的“智猪博弈”方式又是不合适的,因为有两个前提条件发生了变化:其一,是不确定性的增强,无论是大猪小猪,其实大家都不知道启动收益的按钮在哪里?或者按钮按下去之后到底有多大收益,那么“智猪博弈”中所假设的分配比例就要打折扣,想让大猪先去按按钮它就要掂量掂量。其二,是网络外部性的存在,很容易形成“赢家通吃”的局面,一旦大猪启动按钮并占据优势地位,根本没有小猪分食的空间,所以小猪企图跟在后面拣便宜往往什么也得不到。所以在这种状况下,大猪小猪的策略又给颠倒过来了,大猪往往采取等待策略,密切关注各方面的发展,或者说只是象征性的做一些风险性的投资,让一群小猪在前面乱拱,看哪个小猪真正拱对地方了,它再利用自己的实力后发先至,武力抢夺,微软、IBM就是采取的就是这样的策略,新浪对待博客也是如此。关键是在这种状况下,小猪应该怎么办?要么就是拱半天什么也没有,要么就是拱出来东西了,又让大猪给抢去了,似乎结果都不好。其实,为她人做嫁衣自己却成为先烈的小企业固然很多,成功突破大企业的防线而崛起的也不再少数,经典的案例如沃尔玛、西南航空、戴尔电脑,最近的案例如GOOGLE。就是在中国互联网市场第一波门户格局稳定之后,后起的盛大、腾讯、百度、空中网也都成功突围,打出了自己的一片天地,而盛大更是差点把新浪反纳入囊中。为什么偏偏博客网这么背运,被门户轻而易举的给压制了呢?

战争中“以弱胜强”有很多研究,在企业战略中如何“以弱胜强”也有很多研究。长江商学院的曾鸣教授从在位者的角度提出成功挑战者的五个阶段,分别

为“看不到”、“看不起”,“看不懂”、“学不会”、“挡不住”,那么换到挑战者的角度就要想了,在我还很弱小的时候如何让对方看不到?在我有点起色的时候如何让对方看不起?在我开始发展的时候如何让对方看不懂?在对方试图采取行动的时候如何让它学不会?而要开始反攻的时候如何让它挡不住?哈佛商学院教授大卫·尤费针对小企业对大企业的竞争模式,在《柔道战略》中,提出了三个原则:移动、平衡、杠杆借力,移动是使对手失去平衡并压制他们的最初优势,平衡帮你与对手交战并躲开攻击,杠杆借力能帮你把对手打倒。RealNetworks

公司在互联网领域战胜微软用的是柔道战略之“平衡”一招。“抓住对手”,与对手合作制定行业标准,巩固自己的竞争地位;“避免针锋相对”,不轻易仿效对手的做法,创造对手缺乏的资产;“推拉制衡”,接纳MP3,兼收并蓄。

智猪博弈的困境,是对所有企业的考验。做大猪,还是小猪,也将是每个人面临的艰难选择。

(完整word版)经典的博弈论分析案例——“海盗分金”问题

经典的博弈论分析案例一一“海盗分金”问题 5个海盗抢得100枚金币,他们按抽签的顺序依次提方案:首先由1号提出分配方案,然后5人表决,超过半数同意方案才被通过,否则他将被扔入大海喂鲨鱼,依此类推。 “海盗分金”其实是一个高度简化和抽象的模型,体现了博弈的思想。在“海盗分金”模型中,任何“分配者”想让自己的方案获得通过的关键是事先考虑清楚“挑战者”的分配方案是什么,并用最小的代价获取最大收益,拉拢 “挑战者”分配方案中最不得意的人们。 假设前提 假定“每个海盗都是绝顶聪明且很理智”,那么“第一个海盗提出怎样的分配方案才能够使自己的收益最大化?” 推理过程 从后向前推,如果1至3号强盗都喂了鲨鱼,只剩4号和5号的话,5号一定投反对票让4号喂鲨鱼,以独吞全部金币。所以,4号惟有支持3号才能保命。 3号知道这一点,就会提出(100,0,0)的分配方案,对4号、5号一毛不拔而将全部金币归为已有,因为他知道4号一无所获但还是会投赞成票,再加上自己一票,他的方案即可通过。 不过,2号推知3号的方案,就会提出(98,0,1,1)的方案,即放弃3 号,而给予4号和5号各一枚金币。由于该方案对于4号和5号来说比在3号分配时更为有利,他们将支持他而不希望他出局而由3号来分配。这样,2号将拿走98枚金币。 同样,2号的方案也会被1号所洞悉,1号并将提出(97, 0,1, 2, 0)或(97, 0,1, 0,2)的方案,即放弃2号,而给3号一枚金币,同时给4号(或5号)2枚金币。由于1号的这一方案对于3号和4号(或5号)来说,相比2号分配时更优,他们将投1号的赞成票,再加上1号自己的票,1号的方案可获通过,97枚金币可轻松落入囊中。这无疑是1号能够获取最大收益的方案了!答案是:1号强盗分给3号1枚金币,分给4号或5号强盗2枚,自己独得97枚。分配方案可写成(97, 0, 1, 2, 0)或(97, 0, 1, 0, 2)。分析 1号看起来最有可能喂鲨鱼,但他牢牢地把握住先发优势,结果不但消除了死亡威胁,还收益最大。这不正是全球化过程中先进国家的先发优势吗?而5号,看起来最安全,没有死亡的威胁,甚至还能坐收渔人之利,却因不得不看别人脸色行事而只能分得一小杯羹。 不过,模型任意改变一个假设条件,最终结果都不一样。而现实世界远比模型复杂。 首先,现实中肯定不会是人人都“绝对理性”。回到“海盗分金”的模型中,只要3号、4号或5号中有一个人偏离了绝对聪明的假设,海盗1号无论怎么分都可能会被扔到海里去了。所以,1号首先要考虑的就是他的海盗兄弟们的聪明和理性究竟靠得住靠不住,否则先分者倒霉。 如果某人偏好看同伙被扔进海里喂鲨鱼。果真如此,1号自以为得意的方 案岂不成了自掘坟墓! 再就是俗话所说的“人心隔肚皮”。由于信息不对称,谎言和虚假承诺就_ 大有用武之地,而阴谋也会像杂草般疯长,并借机获益。如果2号对3、4、5 号大放烟幕弹,宣称对于1号所提出任何分配方案,他一定会再多加上一个金币给他们。这样,结果又当如何? 通常,现实中人人都有自认的公平标准,因而时常会嘟嚷:“谁动了我的奶

生活中的博弈论论文

生活中的博弈论论文 摘要: 生活、博弈、无处不在、利益、老鹰、报价价位、得与失 正文: 博弈无时不在,无处不在,日常生活中的一切,均可从博弈得到解释,大到美日贸易战,小到今天早上你突然生病。可能读者会认为,贸易争端用博弈论来分析是可以的,但对自己生病也可以用博弈论来理解就有点不可思议,因为自己就一个人,和谁进行游戏? 实际上,并非只有一个人,还有一个叫做“自然”(Nature)的参与者。“自然”可以理解为无所不能的上帝,上帝现在有两种策略,让人生病或不生病。人一旦生病,就不得不根据生病的信息判断上帝的策略,然后采取对应的策略。上帝采取让人生病的策略,人就采取吃药的策略来对付;上帝采取不让人生病的策略,人就采取不予理睬的策略。这正是一场人和上帝进行博弈的游戏。 “自然”是研究单人博弈的重要假定。再比如一个农夫种庄稼也是同自然进行博弈的一个过程。自然的策略可以是:天旱、多雨、风调雨顺。农夫对应的策略分别是:防旱、防涝、放心地休息。当然,“自然”究竟采用哪种策略并不确定,于是农夫只有根据经验判断或气象预报来确定自己的行动。如果估计今年的旱情较重,就可早做防旱准备;如果估计水情严重,就早做防涝准备;如果估计是风调雨顺,农夫就可以悠哉游哉了。 生活中更多的游戏不是单人博弈,而是双人或多人的博弈。比如,某一天你觉得应该是你太太的生日,但又不能肯定:如果是太太的生日的话,你可以送一束花,太太会特别高兴;你不送花,太太会埋怨你忘了她的生日;如果不是太太的生日的话,你可以送太太一束花,太太感到意外的惊喜;你不送花,结果生活同往常一样。 在这个博弈里,我们看到,“自然”可以有两种策略:确定今天是太太的生日或确定今天不是太太的生日,但不论“自然”采取何种策略,你的最好行动都是买花。 夫妻吵架也是一场博弈。夫妻双方都有两种策略,强硬或软弱。博弈的可能结果有四种组合:夫强硬妻强硬、夫强硬妻软弱、夫软弱妻强硬、夫软弱妻软弱。 根据生活的实际观察,夫软弱妻软弱是婚姻最稳定的一种,因为互相都不愿让对方受到伤害或感到难过,常常情愿自己让步。动物学的研究有相同的结论,性格温顺的雄鸟和雌鸟更能和睦相处,寿命也更长。 夫强硬妻强硬是婚姻最不稳定的一种,大多数结局是负气离婚。夫强硬妻软弱和妻强硬夫软弱是最常见的一种,许多夫妻吵架都是这样,最后终归是一方让步,不是丈夫撤退到院子里点根烟,就是妻子避让到卧室里号啕大哭。 在竞争激烈的商业界,博弈更为常见。比如两个空调厂家之间的价格战,双方都要判断对方是否降价来决定自己是否降价,显而易见,厂家之间的博弈目标就是尽可能获得最大的市场份额,赚取最多的收益。 事实上,这种有利益(或效用)的争夺正是博弈的目的,也是形成博弈的基础。经济学的最基本的假设就是经济人或理性人的目的就是为了效用最大化,参与博弈的博弈者正是为了自身效用的最大化而互相争斗。参与博弈的各方形成相互竞争相互对抗的关系,以争得效用的多少决定胜负,一定的外部条件又决定了竞争和对抗的具体形式,这就形成了博弈。 如象棋对局的参与者是以将对方的军为目标,战争的目的是为了胜利,古罗马竞技场中角斗士在争夺两人中仅有的一个生存权,企业经营的目的是为了生存发展,而股市中人们所争的很实在,就是金钱。从经济学角度来看,有一种资源为人们所需要,而资源的总量具是

博弈论视角去思考生活中的问题与现象

姓名:学院:专业: 年级:2010级 学号: 题目:博弈论视角去思考生活中的问题与现象 关键词:经济学,大学生,考试作弊。 内容摘要: 考试是人才培养过程中的一个重要的教学环节,是检查教师教学效果, 是检验学生对知识和技术掌握程度的一种手段。近年来考试作弊现象越来越普遍、越来越严重,并呈现不断蔓延之势,严重影响了考试应有的严肃性、公正性和科学性,引起了社会公众的广泛关注。考试作弊行为的存在严重影响着考试功能的正常发挥,同时也严重损害着学生的心理健康和品德培养。如何有效地杜绝和减少学生考试作弊行为已成为近年来高等教育势在必行的一项工作。本文从从成本-收益分析维度对考试作弊行为进行简要分析,通过分析考生作弊的成本,提出控制作弊的对策。 一、大学生考试作弊的成本-收益之博弈 作弊行为包括夹带小抄、桌面留言、互对答案、偷看他人答卷、互换试卷、替考等,呈现出方式多样化、主体多样化、规模集团化、过程组织化、人员职业化、手段现代化、水平专业化等特点.经济学原理告诉我们,经济活动主体总是在一定约束条件下追求自身利益的最大化,这也正是大学生考试作弊的内在动因。因为考试成绩是衡量学生表现的关键指标,它直接影响着大学生的奖学金、评优、入党、提干、推研、就业和心理满足。在这一动因的作用下,大学生在考试中可能会违背学校规定,具有作弊、不作弊和按照一定的概率分布进行作弊等三种不同的行为选择。寻求最佳的作弊与不作弊的概率分布是大学生的行为选择。在个体理性作用下,大学生选择行为时常从两方面考虑,一是将作弊带来的超常收益与作弊被发现而受惩罚的损失进行对比,若作弊的超常收益低于受惩罚的损失,将不会试图作弊,否则,作弊有利可图,就会发生作弊现象;二是估计作弊被监考教师发现的可能性,如果这一可能性很大,作弊概率就小,否则作弊概率就大。 1.学习机会成本大,课堂学习收益小

博弈论小论文

经济学中的“智猪博弈”(Pigs’payoffs) ———“智猪博弈”模型构建造 关键词: 最佳策略指标改变打破智猪博弈困境搭便车协调博弈企业 战略资源配置 古语有云,世事如棋。生活中每个人如同棋手,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们“出棋” 着数中理性化、逻辑化的部分,并将其系统化为一门科学。换句话说,就是研究个体如何在错综复杂的相互影响中得出最合理的策略。事实上,博弈论正是衍生于古老的游戏或曰博弈如象棋、扑克等。数学家们将具体的问题抽象化,通过建立自完备的逻辑框架、体系研究其规律及变化。这可不是件容易的事情,以最简单的二人对弈为例,稍想一下便知此中大有玄妙:若假设双方都精确地记得自己和对手的每一步棋且都是最“理性” 的棋手,甲出子的时候,为了赢棋,得仔细考虑乙的想法,而乙出子时也得考虑甲的想法,所以甲还得想到乙在想他的想法,乙当然也知道甲想到了他在想甲的想法… 现在以经济学中的一个有趣的例子展开本篇论文. 智猪博弈.它是双方实力不相等情况下的博弈,通过分析可以得出结论,是实力强的一方采取主动策略,实力弱的一方要采取等待的策略. 这个例子讲的是:猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹.那么,两只猪各会采取什么策略?答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。 原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。

博弈论论文

博弈论课程论文生活中的博弈论 学院: 姓名: 学号:

生活中的博弈论 摘要:本文从实际生活入手,主要是把生活中所会出现的一些问题、一些选择用博弈论的思想进行分析。有时候看起来很简单的问题,其实深究起来并不是那么简单,不能只看表面,要仔细分析每一个问题参与者的心理,做出多种情况的假设,才能做出最有利的选择。 关键词:博弈,心理,生活,假设 一、博弈论简介 博弈论又被称为对策论既是现代数学的一个新分支,也是运筹学的一个重要学科。

博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。 博弈论已经成为经济学的标准分析工具之一。在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。 基本概念中包括局中人、行动、信息、策略、收益、均衡和结果等。其中局中人、策略和收益是最基本要素。局中人、行动和结果被统称为博弈规则。 类型: (1)合作博弈——研究人们达成合作时如何分配合作得到的收益,即收益分配问题。 (2)非合作博弈——研究人们在利益相互影响的局势中如何选决策使自己的收益最大,即策略选择问题[1]。 (3)完全信息/不完全信息博弈:参与者对所有参与者的策略空间及策略组合下的支付有充分了解称为完全信息;反之,则称为不完全信息。 (4)静态博弈和动态博弈 静态博弈:指参与者同时采取行动,或者尽管有先后顺序,但后行动者不知道先行动者的策略。 动态博弈:指双方的行动有先后顺序并且后行动者可以知道先行动者的策略。 二、博弈例证

博弈论论文囚徒困境的启示和思考

囚徒困境的启示和思考 二、囚徒困境的解释 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 若对方沉默、背叛会让我获释,所以会选择背叛。 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑8年。 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑1年,总体利益更高,结果也比两人背叛对方、判刑8年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。 实际上囚徒困境在我们的实际生活中也有很多,下面举两个进行说明

三、经济学例子:关税战 两个国家,在关税上可以有以两个选择: 提高关税,以保护自己的商品。(背叛) 与对方达成关税协定,降低关税以利各自商品流通。(合作) 当一国因某些因素不遵守关税协定,独自提高关税(背叛),另一国也会作出同样反应(亦背叛),这就引发了关税战,两国的商品失去了对方的市场,对本身经济也造成损害(共同背叛的结果)。然后二国又重新达成关税协定。(重复博弈的结果是将发现共同合作利益最大。) 四、商业例子:广告战 商业活动中亦会出现各种囚徒困境例子。以广告竞争为例。 两个公司互相竞争,二公司的广告互相影响,即一公司的广告较被顾客接受则会夺取对方的部分收入。但若二者同时期发出质量类似的广告,收入增加很少但成本增加。但若不提高广告质量,生意又会被对方夺走。 此二公司可以有二选择: 互相达成协议,减少广告的开支。(合作) 增加广告开支,设法提升广告的质量,压倒对方。(背叛) 若二公司不信任对方,无法合作,背叛成为支配性策略时,二公司将陷入广告战,而广告成本的增加损害了二公司的收益,这就是陷入囚徒困境。在现实中,要二互相竞争的公司达成合作协议是较为困难的,多数都会陷入囚徒困境中。 除了这些还有的很多类似的例子,比如说公共产品的提供,商家的价格战等等,在这里就不多赘述了。 五、“囚徒困境”现象的意义和启示 通过以上几个关于囚徒困境的例子,特别是作为经济管理学院的学生,我们可以将博弈论的一些知识运用好,更好的指导我们的经济生活。理论的重要意义在于类似的情况之下给人们社会经济生活带来指导。在经济发展中,我们应该认识到“看不见的手”还有更多内涵,有待我们去发掘。 本文主要通过对该理论的分析,从中发现对企业经营管理活动的有义启示。 第一,在市场竞争过程中,一名优秀的经营者,无论做任何决策还是考虑问题应该有战略眼观,特别是在做出对企业乃至行业今后发展的竞争策略时,从长远出发,做正确的决断。 第二,保存对手就是保存自己。在市场竞争中,让竞争对手发展就是自己发展,本着求同存异的思想,共谋发展,避免恶性竞争,避免两败俱伤的情况。 第三,市场竞争不是纯粹的竞争,在义和利之间应该如何取舍,是一位有战略眼观的企业家该做的第一个选择。 2杜兰:走出“囚徒困境”《通信企业管理》[J] 2003年第4期,第31页

自己写的博弈论结课论文

自己写的博弈论结课论文 博弈论论文 博弈论结课论文 宿舍是我们在上课之余,活动最频繁的场所之一,和舍友们有缘能住在一起,朝夕相处,一起打水,一起吃饭,一起学习,对培养我们合作能力和集体生活能力起了重要的作用。但宿舍的同学来自天南地北,由于生活习惯、成长背景以及价值取向等不同,对不同的事情意见难免会产生分歧,这就出现了各种大大小小的博弈。 为了打造一个温馨和谐的宿舍氛围,身为宿舍长,就要对这个宿舍好好管理。这里每个人之间每天都在进行着一场场博弈,所以博弈就在身边,有人存在的地方就会有博弈的存在。而这一场场的博弈催促着我们长大,学习并且合理的使用能让我们更好的适应这个社会,并且通过合作实现共赢。 每个宿舍都会有本“难念的经”,而我们宿舍最大的问题是因大家的作息时间不统一引出的。宿舍楼除了周五,周六晚上每晚都是十一点准时熄灯,而A同学和B同学习惯了晚睡,所以在熄灯后总会“挑灯夜战”,而这影响了喜欢早睡早起的C同学,使得C同学总是抱怨A,B同学都熄灯了才去洗漱或者发出响声影响睡眠;而A,B同学又抱怨C同学早晨起床太早而弄得休息不好。双方都不肯让步,这一度使得宿舍气氛很不和谐,并且所有同学都开始抱怨宿舍不够好,不够温馨。于是我和C同学单独聊了聊,又和A,B同学私下里沟通,其实大家都愿意宿舍是个温暖的“窝”,只是不知用什么方式达到同时又不愿失了面子,于是我们达成共识:每晚熄灯前所有人必须洗漱完毕,熄灯后尽量不再发出响声,彼此互相体谅,尽量不要打扰别的同学休息;早起的同学也一样,尽量做到不打扰他人。如果可以,尽量宿舍成员作息时间能达成一致。一段时间后,宿舍又恢复了从前的欢声笑语。 页 1

博弈论论文

本科毕业论文(设计) 论文(设计)题目:用博弈论思想分析经济学现象,分析生活中一个经济现象 学院:计算机技术与科学学院 专业:软件工程 年级:软件123 学号: 1208060324 学生姓名:廖杰 指导教师:刘涛 2014年 5月 23日

目录 摘要 (2) ABSTRACT (3) 正文 (4) 一、完全信息讨价还价 (4) 二、不完全信息下的讨价还价 (6) 三、总结 (7) 参考文献 (7) 附录一 (8)

从讨价还价看经济、市场 摘要 本文阐述了博弈论在讨价还价方面的应用理论。主要在完全信息与不完全信息下,进一步针对不同的情况,综合地介绍讨价还价理论模型以及应用。 讨价还价作为市场经济中最常见、普通的事情,也是博弈论中最经典的动态博弈问题。现实经济中充满了“讨价还价”的情形,大到国与国之间的贸易协定,小到个体消费者与零售商的价格商定,还有厂商与工会之间的工资协议、房产商与买者之间关于房价的确定、各种类型的谈判等等。这实际上是两个行为主体之间的博弈问题,也可以把讨价还价看作为一个策略选择问题,即如何分配两个对弈者之间的相互关联的收益问题。 关键词:博弈论,讨价还价,博弈树

Viewing from the bargaining, market economy Abstract This paper expounds the bargaining game theory in the application of theory. Main under complete information and incomplete information, further according to different situation, comprehensive introduction to bargaining model in theory and application. Bargaining as the most common, ordinary things in market economy, as well as the most classical game theory of dynamic game problems. Is full of "bargain" in real economic situations, big to trade agreements between countries and agreed on the price of small to individual consumers and retailers, and manufacturers and the unions wage agreement between, between property developers and buyers about the determination of prices, various types of negotiation, and so on. This is actually a game between two agents, can also read the bargain as a strategy choice problem, namely how to divide the two players of the correlation between income problem. Key words:Game theory Argy-bargy, Game tree

工作中的博弈论与思考

工作中的博弈论与思考 这是一篇看最后面才有意思和意义的文章 今天在职场中遇到一件事,上面发下一个任务,需要几个人同时完成,一位同事做事效率很高,先于其它几位同事倍许的速度先完成其负责的部分工作,而其它人的工作还只进行了一半,新加入的同事则刚刚开始工作,尚在熟悉中。为了加快工作进度,我决定给效率高的同事再一分配其他人的一部分任务,以便以最快的时间完成工作。但是,这位同事先前已完成了其它人任务量的140%左右,再加量从感情上是难以接受的,并出现了抵触情绪,我个人也很难忍心再给其加工作量,不作休息,由此,我想到了很多。 在现实中,我们经常会发现在工作中许多同事都有自己善长和效率较高的工作能力,在从事同样工作时,会比他人有更高的效率(我们要感谢这些伟大的人带领我们,提供给我们贵的经验和学习的榜样),但一个人又不能单独完成全部工作(因为一个人单位效率再高,也不如人多一起干,而且会加长完成工作总时间),而在工作中我们又不能对每项工作中的效率高个体作出奖励(虽然绩效工资很常见,我个也比较倾向这种工作方式,但工作中不是每一件都绩效的),这就出现一个问题,当效率高的人先完成工作,而其它人未完成时,如果为了尽快完成总工作量,他会被分配更多的工作量,其个工作量会加大,在报酬相同情况

下,显然对其是不公平的,是一种对个体单位劳动力报酬的损失,降低自己的报酬。对于个人最好的选择就是停下来等他人完成工作,再一起进入下一项工作,其它人同样如此,在完成工作后会等待其它人的工作完成,以使自己不会比其他人做的更多,使自己的利益得到最大化。但我们也可看出,这样的等待加长了总工作时间,使任务完成总是以团队中效率最低的成员的效率为标准,这对所有团队成员也都是不利的,因为这会减少成员总的完成任务休息时间。 听到这里,我想大家已经想到了这是一个博弈论问题,当然,也有人不知道这个问题的,下面,我就摘录一些百度上的囚徒困境问题回顾和讨论一下。 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将 即时获释,沉默者将判监10年。 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监1年。 若二人都互相检举(相关术语称互相“背叛”),则二人同样判监8年。 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都 寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何 情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝 监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人 的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚 徒会如何作出选择: 若对方沉默、背叛会让我获释,所以会选择背叛。 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛 是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参 与者都背叛对方,结果二人同样服刑8年。 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利 益而言,如果两个参与者都合作保持沉默,两人都只会被判刑1年,总体利益更高,结果 也比两人背叛对方、判刑8年的情况较佳。但根据以上假设,二人均为理性的个人,且只

博弈论结课论文

博弈论基础 结课论文 课程名称:博弈论基础授课教师: 专业班级: 学生姓名:学号 成绩:

博弈随笔 以前,只是听说博羿——认为是那些?谍战片?似的斗心机,拼命得到所谓的胜利,让我想到?左右互搏术?。今天,挺欢喜的,值得一听,更加值得一想。 老师与学生第一节课,以(身边)故事开场,吸引了在玩、在谈、在写、在愣神的学友的耳朵和眼球,学友们——也学到了些东西,或者与博羿之思想能碰撞闪现出火花,有利益关系吗?一个,望学术或教育水平得到提高或责任的心。另一个,得点学分或找点乐子或陪伴人或还真有少许的是学的。俗话说的好?愿打,也得愿挨?呀!要么,人数成?抛物线?一样变化,要么是?倒梯形?,这也许就是学生,大学生的规律!而师,或呆板地照本宣科或妙趣横生或平平淡淡。显然,我们比较幸运点! 注:学点东西——还是比较好的。如何提高教学质量与学习效果?一个人,当TA面对TA喜欢或感兴趣的,才会花时间去听(无意评价教育体系),这可能占到大部分吧(希望),少部分随意的点的(暂评),因此,怎么才能延长其喜欢的持续时间:才是关键(除一些真学的)。 总之,?少壮不努力,老大徒伤悲?! 效率——单位个体在单位时间内获得的成果。现在,自己,的确是在玩时间战术,耗得起吗?也许只有在有效时间内完成自己的任务,努力加信心 (说偏了)。没话了,挂住了。 记于二零一二年三月一号晚二十三点五十六分(写了将近四十分

钟) 今天晚上,上课,感觉到了无聊与无奈,选修与专业,浅与深。主要讲了一些博弈的基础知识(概念类),自己也记了一些笔记(各人有各自的学习方法)。而我是靠时间磨靠笔磨的!偏了,,回归正传。她(老师)讲了一些故事——这的确挺吸引人眼球与耳朵的。但下面因为玩,其他的继续。同志们,半推半就的去 STUDY! 3月中旬的一次课,忘了忘了! 今天——2012年3月22日,博弈论的第三次课了(好像学生上课,都是这样似的)。 她,老师讲了纳什均衡的运用实例——一些经典例子:双垄断的博弈——也推倒出了于今下有实际意义的结论!但,我好像没有像第一次上课那样——认认真真的听:边看着鲁迅的小说边听着老师的?絮叨?,其实——自己挺喜欢数学的:可由初中的喜爱得出,只是随着时间的推移与知识的无奈——?膨胀?,自己也被自己慢慢的舍弃了! 难道自己没有想过吗?答案,不言而喻! 一个人,可悲的不是知道,而是无知与明明知道而又偏偏无知! 莫伤,也伤不起!三月的最后一节,老师讲了一些?概率性?的纳什均衡。第一小节,师已讲了个例子,同时也演算了一个例子,当下课布臵了一个小问题,在课间做,却无人问津。上课时?自然?鸦雀无声。

博弈论中的几个经典问题

几个博弈论中的经典问题 博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。 几个重要的概念 1、策略(strategies):一局博弈中,每个局中人都有选择实际可行的完整的行动方案, 即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。 2、得失(payoffs):一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时 的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付(payoff)函数。 3、次序(orders):各博弈方的决策有先后之分,且一个博弈方要作不止一次的决策 选择,就出现了次序问题;其他要素相同次序不同,博弈就不同。 4、博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。 在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。 5、纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况, 当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人B仍采取b*,而局中人A却采取另一种策略a,那么局中人A 的支付不会超过他采取原来的策略a*的支付。这一结果对局中人B亦是如此。 经典的博弈问题 1、“囚徒困境” “囚徒困境”是博弈论里最经典的例子之一。讲的是两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是"坦白从宽,抗拒从严",如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。 在这个例子里,博弈的参加者就是两个嫌疑犯A和B,他们每个人都有两个策略即坦白和不坦白,判刑的年数就是他们的支付。可能出现的四种情况:A和B均坦白或均不坦白、A坦白B不坦白或者B坦白A不坦白,是博弈的结果。A和B均坦白是这个博弈的纳什均衡。这是因为,假定A选择坦白的话,B最好是选择坦白,因为B坦白判8年而抵赖却要判十年;假定A选择抵赖的话,B最好还是选择坦白,因为B坦白判不被判刑而抵赖确要被判刑1年。即是说,不管A坦白或抵赖,B的最佳选择都是坦白。反过来,同样地,不管B是坦白还是抵赖,A的最佳选择也是坦白。结果,两个人都选择了坦白,各判刑8年。在(坦白、坦白)这个组合中,A和B都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡。

博弈论论文

博弈论论文 Prepared on 22 November 2020

博 弈 论 姓名:XXX 学号:XXXXXXXXXXX 专业班级:XXXXXXXXXXXXX 博弈论课堂回顾与总结 还记得当时在纠结抢什么选修的时候,朋友说博弈论好呀!老师经常让我们玩游戏,而且可以学到很多东西。于是乎我就在朋友的强力推荐下抢到了大学的最后一门选修课——博弈论。时光匆匆,转眼12周过去,博弈论课程也接近尾声,在这我以这篇文章回顾总结一下这十三周的课堂与收获。 课堂总结: 博弈论的第一课老师给我们讲了博弈论的定义,让我们首次认识和了解博弈论: 1、博弈论又被称为对策论既是现代数学的一个新分支,也是运筹学的一个重要学科。 2、博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们

的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。3、博弈论已经成为经济学的标准分析工具之一。在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。4、基本概念中包括局中人、行动、信息、策略、收益、均衡和结果等。其中局中人、策略和收益是最基本要素。局中人、行动和结果被统称为博弈规则。 在随后的课堂里,老师分别给我们讲了:纳什均衡、囚徒困境、重复博弈、一次博弈、一报还一报(以牙还牙、以眼还眼、悔过的一报还一报、以怨抱怨、以德报怨、以直报怨)、人质困境(多个人的囚徒困境)、酒吧博弈(非线性预测)、枪手博弈(先发优势与后发制人)、智猪博弈、斗鸡博弈、协和谬误等。老师详细讲解了它们的定义、条件、破解、策略以及运用。 例如: 一.酒吧博弈(非线性预测) 前提条件限制:要做出正确的预测必须知道他人的抉择,过去的历史是“任意 的”,未来就不可能得到一个确定的值。 现实启示:1.从一非线性系统整体来说,其变化经济不可预测 2.对于一个混沌系统中个体来说,在无法预测过程中也可采取恰当策 略,并可趋吉避凶,即少数者策略 二. 囚徒困境: 基本精神是背叛,处于囚徒困境时,没有什么十全十美的办法能让自己在困境 中逃脱,只能尽量做到自己不受侵害,两利相对取其重,两害相对取其轻 如何设计:1.博弈双方信息沟通流畅 2.博弈双方互不信任

博弈论与决策思维

《博弈论与决策思维》感想 这次很荣幸的去听了郑教授的《博弈论与决策思维》讲座,非常感谢浙江大学东方财智能给我提供的这次机会,听完这个课程之后,内心深处感受颇深,第一次觉得博弈思维是如此的精湛,更令人感叹的是郑教授教了我们在生活当中如何运用博弈思维来处理一些棘手的事。与我以前听过的所有精彩的课程相比,我只想说一句:教授不愧是教授,教授与老师的讲课方式与方法是截然不同的! 在整个博弈论课程演讲的过程中,郑教授都是用一些有趣的例子来引导大家在课堂上的互动,从而通过在例子上总结出来的一些启示来告诉大家,在生活当中遇到一些进退两的困境时,我们应当如何巧妙地运用博弈思维来思考问题,并让那些问题能得到妥善的处理。 如果就像宣读课本一样把那些道理说给大家听,把那些PPT画面一页页放给大家看的话,那效果肯定就犹如过眼云烟,但是郑教授说的每一点重点我们都会牢牢紧记!比如:田忌赛马,这是大家都知道的故事。大家都只知道田忌之所以赢了齐王是因为他改变了策略,然而改变策略视需要前提条件的:第一就是对方愚蠢,第二就是对方的信息的公知的。所以在现实生活中我们应该用全局、动静思维来考虑问题! 博弈分为很多种:换位思考、信任危机、收益问题、隐性激励、推理方式、、、、、其中有一点我记得最清楚的就是隐性激励。说的大概就是一个公司的上层不能什么事都必须是亲力亲为,应该对有些事松松手或者对于有些事假装不清楚,让下属自己拿主意,让他们以后做事能越来越有自信,在这个过程中能逐渐成长起来,正好验证了那句话“水至清则无鱼,人至察则无徒”! 不仅人与人之间存在博弈,物品之间也同样存在博弈,只不过换了一种说法。物品间的竞争是替代,合作就是互补。而市场决定着物品之间的关系,所以说博弈是无处不在的。郑教授所讲的博弈内容远不止这么点,用一句话来概括:只可意会不可言传。只有亲自去听了之后才会有那种突然觉自己的智慧一下子就升华了的感觉。 学会博弈论会让你活的更有智慧!

博弈论经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A来说,囚徒B有坦白和不坦白两种可能的选择,假设囚徒B的选择是不坦白,则对囚徒A来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B选择的是坦白,则囚徒A不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B采取何种策略囚徒A的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 嫌疑犯乙

案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 价格战 案例:假设市场中仅有A 、B 两家企业,每家企业可采取的定价策略都是10元或15元,我们可以得出得益矩阵如下: 分析:无论对企业A 还是企业B 来说,低价都是他们的占优战略。从表可见,企业A 的占优战略是10元,因为无论B 采取什么战略,企业A 都能获取比定价15元更多的利润。 如果企业B 定价10元,企业A 定价10元能够获利80万元,而定价15元只能获得30万元;如果企业B 定价15元,企业A 定价10元可获利170万元,而定价15元却只能获利120万元。同样地,企业B 的占优战略也是定价10元的策略。 企业B 男

什么是博弈论博弈论的思考

什么是博弈论博弈论的思考 博弈论原是数学运筹中的一个支系,其研究运用了种种数学工具,大量的数学模型成了博弈论和我们普通人的生活之间的一条难以逾 越的鸿沟。面对这条鸿沟,很多人的反应是耸耸肩膀走开,少数人会企图通过学习数学来渡过。但是这两种反应都忽略了一个很浅显的道理:如同一个不会编程的人照样可以成为电脑应用高手,没有高深的数学知识,我们同样通过博弈论的学习成为生活中的策略高手。孙膑没有学过高等数学,但是这并不影响他通过运用博弈策略来帮助田忌赢得赛马。 有时候,科学并不一定意味着繁琐的计算与测量,而是一种有浓 厚艺术气息的思维方式。比如书中所讲述的一报还一报策略。 美国密西根大学一位叫做罗伯特?爱克斯罗德组织了一场计算机 模拟竞赛:任何想参加这个计算机竞赛的人都扮演“囚徒困境”案例中一个囚犯的角色。他们把自己的策略编入计算机程序,进行捉对博弈。他们每个人都要在合作与背叛之间做出选择。但与囚徒困境案例中有个不同之处:他们不只玩一遍这个游戏,而是以单循环赛的方式玩上200次。第一轮游戏有14个程序参加,其中包含了各种复杂的 策略。竞赛的桂冠属于一种被称为“一报还一报”的策略。这种神奇的一报还一报策略说起来很简单,简单到有些 __:第一步合作,此 后每一步都重复对方上一步的行为。如此简单的程序之所以反复获胜,

是因为它实行了以其人之道还治其人之身的原则,并且用如下特质使它能够最有效地鼓励其他程序同它长期合作:善良、可激怒、宽容、简单、不妒忌别人的成功。 在静态的群体中竞赛是这样一种状况,那么,在一个动态的进化 的群体中,这种合作策略能否产生、发展、生存下去呢?群体是会向合作的方向进化,还是向不合作的方向进化?如果大家开始都不合作,能否在进化过程中产生合作? 为了回答这些疑问,爱克斯罗德重新设计了一个实验,假设63个对策者中,谁在第一轮中的得分高,他在第二轮的群体中所占比例就越高,而且是他的得分的正函数。这样,群体的结构就会在进化过程中改变,由此可以看出群体是向什么方向进化的。 实验结果很有趣。一报还一报策略原来在群体中占1/63,经过1000代的进化,结构稳定下来时,它占了24%。因此,以合作系数来测量,群体是越来越合作的。这个结论还可以引申为:共同演化会使一报还一报的合作风格在充满背信弃义劣行的世界上蔚然成风。我 们可以用以上实验结果来对照一下商界的一句经典老话:商场如战场。商场如战场,就是说商业竞争的对手就是敌人,而对待敌人的办法在人类几千年来的历史上似乎只有一个,那就是把它干掉――或者通过消灭,或者通过吞并。胜利的定义是唯一的,那就是敌人必须一败涂

博弈论期末论文终稿

关于考试作弊中的博弈分析 蔡於期 又到了期末,对于我们学生来说,又要开始应对各门的考试了。学校的图书馆、教室等地方的复习的身影越来越多,但是,也有一些人没有复习,他们现在想的是找各种学霸,以便在期末考试的时候能抱上“大腿”(即考试作弊)。如果能抱上“大腿”,考试就没有压力了。其实,抱“大腿”这种行为蕴含着许多的博弈论的知识,我们可以通过对其的探讨,来了解博弈论的知识在我们生活中的应用,了解博弈论并非是高不可攀的东西,它就在我们的身边。 关键词:考试作弊;智猪博弈(“搭便车”);进化博弈;不可置信威胁 一、智猪博弈(“搭便车”) 其实,不管是考试作弊还是什么作弊,我们都知道这是不好的行为,因为它造成了不公平,而它的不公平性从博弈论的角度看,主要是因为它是一种会造成坏影响的“搭便车”的行为。我们可以假设有两个平时关系比较好的同学,分别是A和B。A是平时认真学习的乖学生,而B则相反,平时只知道玩,成绩很差。现在到了期末,B就要求A在考试时“帮助”B,即考试作弊。这时A有两个选择,帮助或者不帮助。当A选择不帮助时,就会被别人说是“小气”,同时影响自己和B的要好关系,这对A来说是一笔损失。当A选择帮助B作弊时,A心理面难免会有不满,因为B可以“坐享其成”,而且A帮助B作弊也要冒着被学校处罚的风险。对于B来说,也有两个选择,作弊或者不作弊,这里B除非有重大变故,否则的话会选择作弊。当然,也不排除B良心发现,不想作弊了。所以我们可以得出如下的得益矩阵: B A 作弊不作弊帮助5, 55, 0 不帮助3, 04, 0 表1. 考试作弊得益矩阵 从上面的得益矩阵我们看出,经过博弈的分析,不管A同学内心愿意还是不愿意,最终都会选择帮助B来考试作弊,因为这样是最优的策略。所以A同学就得在考试前的期末复习期间像个勤奋的“大猪”,早出晚归,来往奔波于自习室和宿舍之间,而B同学就只需像“智猪博弈”里面的“小猪”在槽边安心等待享受成果就行了。所以,帮助别人考试作弊往往会使自己成为一只辛苦的“大猪”,而让别人安享成果,这样不仅对自己不公平,对于其

博弈论经典模型全解析

博弈论经典模型全解析(入门级) 1. 囚徒困境这是博弈论中最最经典的案例了——囚徒困境,非常耐人寻味。“囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不

会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到,他的同伙也不是傻子,也会这样来设想他。所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。企业在信息化过程中需要与咨询企业、软件供应商打交道的。在与这些企业打交道的过程中,我们不可避免地也会遇到类似的两难境地,这个时候需要相互之间有足够的了解与信任,没有起码的信任做基础,切不可贸然合作。在对对方有了足够的信任之后,诚意也是必不可少的,如果没有诚意或者太过贪婪,就可能闹到双方都没有好处的糟糕情况,造成企业之间的双输。 2. 智猪博弈在博弈论(Game Theory)经济学中,“智猪博弈”是一个着名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是

相关主题