搜档网
当前位置:搜档网 › 社会福利之中的博弈论视角

社会福利之中的博弈论视角

社会福利之中的博弈论视角
社会福利之中的博弈论视角

社会福利之中的博弈论视角

20091020234

社会工作

赵志东根据福利政策制定者和社会福利之享有者双方来划分,可以将两者广义的看做是局中人,往往政府在其中扮演着决策者,而福利的享有者未必可以真正在其中扮演好对抗者。后者往往动作是滞后的、默认的、被动的,但最终占优。而在这一过程之中,双方的博弈开始逐渐衍化,又起初的对抗变为合作博弈,而也会从追求均衡到非零和,共同寻求发展。

我单纯的认为将政府和最广大的福利享有者以博弈论的视角下来看,两者博弈的狭义应该是从博弈双方变化为博弈内容,也就是说由开始的对抗者追求享有福利的权益,变化为已享有福利者对于福利内容的追求,这里所指的追求可以是保障或是对于福利内容再界定。

对抗者往往处于被动,因此对抗者只能寄希望于决策者劣势的策略选择,但是在博弈中不能忽视的是博弈双方往往存在着信息不对等的问题,因此对抗者很难通过单纯的对抗来获得优势。因为双方不同的社会作用和地位,在这个博弈之中,几乎不会出现一方打倒一方的情况,只能出现优势的倾斜。参与博弈的对抗者想通过这一过程来扩大自身的福利,或是争取自身的福利。而决策者则要考虑更多,如何

寻找到双方博弈的平衡点应该是决策者首先考虑的因素。而决策者要害更多顾虑,由于决策者的政策往往具备了对社会产生影响的能力,因此决策者并不能在单纯刨除了自身利益关联及其他因素之后,就能完全的偏向对抗者的意愿,决策者必须使得规则在顾及了全体局中人和参与者的意愿之后,又不存在种种可能产生不良后果的诱因。决策者与对抗者的种种矛盾决定了两者在社会福利的制定、实施、修改、完善等各方面都充斥着博弈行为,而且这一系列的博弈是不可消除的,同时也是不能逆的,因为在博弈双方不断试探和找寻平衡点的过程中,社会福利也随着进步,无论是哪一方面。福利享有者在享有了福利之后,便不会再忍受福利的倒退,而决策者也必须充分听取最广大社会成员的意见,毕竟那是权利构成的基础。

如果将在社会福利相关之中的双方的博弈行为看着是不断发展的,那么中国的社会福利无疑还处在第一阶段的博弈,即社会成员还在追求自身的福利,而同时表现出了不同的博弈者所追求的福利界定还不尽相同。在具体的操作上由政府代表国家提供福利。表面看来,福利的提供主体是政府,实际上,政府只是一个中介机构,真正提供福利的是国民,其基本途径来自于税收。然后相较于knowledge is power 这句名言,power is power 似乎更能说明在中国产生差异的原因。过于注重权力导致了上重下轻的社会结构,大量的资源集中在了掌握权力的人群手中,相较而言,权力缺乏的人群往往得不到福利的保障,或者只能得到可以涵盖绝大多数人的部分福利。

而在社会成员充分享有福利的国家之中,福利中体现的博弈视角是来至于福利内容的。经济自由主义者对于社会福利最有力的批判来自于提供社会福利的后果。他们会说,享受社会福利政策的人们会偷懒:一方面,本来能够工作的人也不愿意工作了;另一方面,对富人来说,税收过高会降低投资和工作的积极性,因为多挣的钱给了享有福利却不愿工作的穷人。这样的结果是,失业率居高不下、社会财富减少、社会弥漫着懒汉思想。这确实是有些福利国家存在的现象。对此我们可以通过著名的社会福利博弈模型加以了解。

这里把政府面对失业者时的博弈称为社会福利博弈。在福利国家,政府对那些失业者进行救济,例如,发放最低生活保障金,免费培训以便再就业,培训对于再就业找到更好工作有帮助。如此会出现三种情况:(1)政府救济,失业者找工作,对于社会来说是最好的选择;(2)政府救济,但失业者不工作,政府的投资没有回报,失业者享受其他纳税人提供的福利;(3)政府不救济,没有经过培训的失业者找不到工作、即便找到工作给社会带来的利益也比较少,这可以理解为政府没有履行其职责。

我们来分析该博弈:(1)如果政府救济,失业者最好的选择是呆在家里不工作;(2)如果政府不救济,失业者最好的选择是再找工作,否则就会饿肚子;(3)如果失业者愿意再找工作,政府的最优策略是救济;(4)如果失业者喜欢呆在家里,政府的最优策略是不救济。如果把此博弈当成静态博弈,则该博弈没有纯策略纳什均衡解。

该博弈实际上是一个动态博弈,由政府先决定是否救济,政府会考虑是否救济的总福利。这样选择时,政府的最优选择是救济,可既然政府救济,失业者的最优选择是呆在家里。若出现这种结果,就比政府提供救济且失业者经培训找到工作的社会总福利差得比较远,这不符合社会最优。这就是仁慈政府的悖论,也就是“事与愿违”。

仁慈政府的悖论并不能成为否定社会福利制度的理由,关键在于社会福利制度怎样设计,如果我们所设计的福利制度能够使得(救济,再找工作)成为博弈的均衡就可以实现社会最优。我们对此可以采取两种措施:(1)救济时将最低生活保障金和再就业培训分开,最低生活保障金或者定得比较低或者随领取时间延长递减,而再就业培训采取发放培训劵的方式,你不参加培训这部分福利就没有。(2)政府还可以将救济分两次分发,一部分等到失业者找到工作后再发。这两种措施都使得失业者在政府救济而自己不找工作时的处境比较糟糕。

该博弈与前一种博弈的唯一区别在于政府救济而失业者呆在家里时失业者的利益比较小。通过博弈求解,该博弈的均衡变为救济,再找工作,是社会最优的结果,正是社会福利所追求的目标。

教育培训是最有效的社会福利

改变社会福利博弈悖论的最有效制度是将福利分为最基本生活保障和教育培训。教育培训不仅能够提高生产者原有工作的效率,而且

能够前瞻性地培养社会所需要的技能,提高职工的综合素质,从而大大提高社会财富。丹麦的经验能够给予我们很好的启示。

说起丹麦,人们首先联想到的就是安徒生童话。但是丹麦的社会福利制度同样让人们觉得像是“过着童话般的生活”。丹麦的基尼系数仅为0.247,是世界上贫富分化最小的国家,也是世界上最为典型的福利国家,丹麦人福利待遇丰厚得令人难以相信。我认为这得益于独特的福利制度设计:丹麦人失业,可以领取相当于失业前工资 80%的失业补助,但条件是必须参加再培训和求职计划。也就是说,丹麦将享受社会福利与培训再就业绑定,与上述第二个博弈相似,其博弈均衡正好实现社会最优。

我国教育资源一直严重不足,特别是在农村,智力资源没有得到有效开发,也就无法普遍地提高自主创新能力。而自主创新能力又是转变经济发展方式的中心环节,“是国家发展战略的核心,是提高综合国力的关键。”要提高自主创新能力,教育培训是关键,否则结构性失业比较普遍,常常与职位空缺并存,因为失业者缺乏新创造的职位所需要的技能,例如高级技工短缺,而一般工人失业。经济发展方式转变能否成功很大程度上依赖于作为社会福利的教育培训。我们可以毫不夸张地说,教育培训是最有效率的社会福利,而且是最有实际效果的社会福利。

制度设计与制度实效

像仁慈政府“好心无好报”的案例还有很多。例如,对街边乞丐的施舍可能会导致更多的乞丐。出现“好心无好报”这种“激励的悖论”常常成为经济自由主义者反对政府干预社会的理由。“好心无好报”的博弈均衡告诉我们,并非好心不对,而是制度设计的问题。我们应该实事求是,研究自然规律和社会规律,进行科学的制度设计,追求好心好报的实际效果,也就是实事求效,因为实效是判断人生和社会的一个很好的标准。

要不要进行社会保障、怎么进行社会保障和社会保障的效果是联系在一起的。因为如果社会保障的实际效果比不进行社会保障要差,那么社会保障就没有必要;相反,如果社会保障能够大大改善失业者的生活,而且能够使得包含所有国民在内的国家利益最大化,社会保障无疑是必要而且必须的。

因此,如何通过政府与福利享有者或是追求福利的社会成员这一博弈,来满足社会福利的发展需求,完善福利制度和政策,同时避免出现福利保障下的不良因素。下一轮关于社会福利的博弈,势必体现出的是博弈双方追逐平衡,完善福利的情况,而社会福利福利的发展也势必在这一系列的博弈过程中不断进行。

博弈论视角去思考生活中的问题与现象

姓名:学院:专业: 年级:2010级 学号: 题目:博弈论视角去思考生活中的问题与现象 关键词:经济学,大学生,考试作弊。 内容摘要: 考试是人才培养过程中的一个重要的教学环节,是检查教师教学效果, 是检验学生对知识和技术掌握程度的一种手段。近年来考试作弊现象越来越普遍、越来越严重,并呈现不断蔓延之势,严重影响了考试应有的严肃性、公正性和科学性,引起了社会公众的广泛关注。考试作弊行为的存在严重影响着考试功能的正常发挥,同时也严重损害着学生的心理健康和品德培养。如何有效地杜绝和减少学生考试作弊行为已成为近年来高等教育势在必行的一项工作。本文从从成本-收益分析维度对考试作弊行为进行简要分析,通过分析考生作弊的成本,提出控制作弊的对策。 一、大学生考试作弊的成本-收益之博弈 作弊行为包括夹带小抄、桌面留言、互对答案、偷看他人答卷、互换试卷、替考等,呈现出方式多样化、主体多样化、规模集团化、过程组织化、人员职业化、手段现代化、水平专业化等特点.经济学原理告诉我们,经济活动主体总是在一定约束条件下追求自身利益的最大化,这也正是大学生考试作弊的内在动因。因为考试成绩是衡量学生表现的关键指标,它直接影响着大学生的奖学金、评优、入党、提干、推研、就业和心理满足。在这一动因的作用下,大学生在考试中可能会违背学校规定,具有作弊、不作弊和按照一定的概率分布进行作弊等三种不同的行为选择。寻求最佳的作弊与不作弊的概率分布是大学生的行为选择。在个体理性作用下,大学生选择行为时常从两方面考虑,一是将作弊带来的超常收益与作弊被发现而受惩罚的损失进行对比,若作弊的超常收益低于受惩罚的损失,将不会试图作弊,否则,作弊有利可图,就会发生作弊现象;二是估计作弊被监考教师发现的可能性,如果这一可能性很大,作弊概率就小,否则作弊概率就大。 1.学习机会成本大,课堂学习收益小

从博弈论角度看国家关系

从博弈论角度看国家关系 当今世界,强者更强,弱者仿佛只能被欺。不要认为这个世界一定在向着善;恰相反,至少现在还有狼。生活在有狼的世界,又不能指望有猎人打狼,那么最好的办法是“学会狼叫”。 一、东海石油---你的?我的? 世界上有400多条边界要划,现在才划完150多条,进行不到一半。而每一条边界后的博弈,几乎都是历时数年甚至数十年的谈判与斗争。中国与日本的海域之争,只是诸多划界争端之一,由于中日关系相对敏感,使得东海争议尤显突出。划界最主要的目的就是为了资源。就东海而言,这个面积仅为南海五分之一的半封闭的海域,却由于地理构造原因,几乎是太平洋上最丰美的“宝地”之一。经济学家预测,中国的能源消耗将在近年内很快超过日本。显而易见,两个相邻亚洲大国,能源竞争迟早将不同程度地发生。双方已在俄罗斯输油管道线路问题上过了一招,目前如火如荼的东海争议,不过是又一次较量。下面给出中日两国在开发东海问题上的收益表: 东海里的资源对日本这样一个岛国意义重大,因为它的能源、资源全靠海外进口,争取海洋划线范围大一些,是他们从国家经济发展战略高度来看待的。如果日本独自开发,那么它将得到它的最大利润,从而缓解它的能源问题。对于中国也是同样。能源问题本来可能成为中日两国扩大合作的重要领域,如今却成为两国展开激烈竞争与角逐的对象;能源问题本来可能成为连接中日两国乃至东亚地区的纽带,如今却有可能成为割裂两国关系的利刃。在石油领域的恶性竞争是持续多年的中日政治关系“冷淡”、缺乏互信所造成的恶果之一。最近有消息称,俄罗斯已经将日本“安纳线”的要价从100亿美元提高到130亿美元, 而最初日本人的报价是50~60亿美元。由于中日两国的相互争夺,最终得利的是俄罗斯。 在中日激烈竞争的同时,欧盟有望迅速增加从俄罗斯的石油输入,有消息说德国

从博弈论视角分析企业诚信问题

前言 众所周知,大至一个民族,小到一个人,诚实守信都是立身之本。在经济发展迅速的今天,诚信不仅仅作为道德衡量的标准,更被赋予了更加深广的经济学意义。美国经济学家福山认为,诚信是社会活动成本的一个重要组成部分,诚信度的高低决定了经济组织的规模。改革开放以来,我国已经成为世界上经济发展速度最快的国家,社会主义市场经济体制也在不断的完善和发展,在这个经济转轨的关键时期,对企业发展中诚信问题的讨论就显得十分必要。 企业要诚信经营,不仅是社会主义市场经济和消费者利益的客观要求,也是企业的必须承担的社会责任。但是,对于企业来说,经营的目的在于利润最大化,为了达到这个目的,很可能以牺牲消费者利益和社会福利作为代价。不诚信往往可以降低成本,增加企业的销售利润,因此,部分企业为了达到短期自身发展的目的,往往不严格遵守诚信规则,偷工减料、以次充好、制假造假,欺骗消费者。据《中国青年报》报道,中国每年由于企业的不诚信,合同欺诈、产品质量差和制假售假所造成的直接经济损失已高达2000亿。诚信危机,已经成为阻碍我国经济发展的主要因素之一。因此从企业出发关注经济生活中的诚信问题,揭示其背后隐含的经济学含义,并对当前的问题提出行之有效的解决措施便成为当务之急。 本文从博弈论原理出发,对企业与消费者、企业与企业、企业与政府之间的诚信问题展开博弈,并按照经济学研究的一般方法,以假设条件作为分析前提,进行模型的构建,通过数学推导得出结论:只有诚信经营才是企业发展的长久之计,政府监管时必须加大对不诚信企业的处罚力度。在文章的最后给出了可行的政策建议。 一、企业与消费者之间的博弈 (一)完全信息静态模型下的讨论 1.相关假设

博弈论经典例子

博弈论经典例子 篇一:《博弈论三大经典案例》 经典的囚徒困境 1950年,由就职于兰德公司的梅里尔弗拉德(MerrillFlood)和梅尔文德雷希尔(MelvinDresher)拟定出相关困境的理论,后来由顾问阿尔伯特塔克(AlbertTucker)以囚徒方式阐述,并命名为"囚徒困境"。经典的囚徒困境如下: 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 若一人认罪并作证检举对方(相关术语称"背叛"对方),而对方保持沉默,此人将即时获释,沉默者将判监xx年。若二人都保持沉默(相关术语称互相"合作"),则二人同样判监半年。若二人都互相检举(互相"背叛"),则二人同样判监2年。 用表格概述如下: 甲沉默(合作) 乙沉默(合作)二人同服刑半年甲认罪(背叛)甲即时获释;乙服刑xx 年乙认罪(背叛)甲服刑xx年;乙即时获释二人同服刑2年 如同博弈论的其他例证,囚徒困境假定每个参与者(即"囚徒")都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为"严格劣势",理性的参与者绝不会选择。另外,没有任何

其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 若对方沉默、背叛会让我获释,所以会选择背叛。若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 二人面对的情况一样,所以二人的理性思考都会得出相同的结论选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是"困境"所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。由囚徒困境可以写出类似的员工困境: 一名经理,数名员工;前提,经理比较苛刻; 如果所有员工都听从经理吩咐,则奖金等待遇一样,不过所有人

社会福利之中的博弈论视角

社会福利之中的博弈论视角 20091020234 社会工作 赵志东根据福利政策制定者和社会福利之享有者双方来划分,可以将两者广义的看做是局中人,往往政府在其中扮演着决策者,而福利的享有者未必可以真正在其中扮演好对抗者。后者往往动作是滞后的、默认的、被动的,但最终占优。而在这一过程之中,双方的博弈开始逐渐衍化,又起初的对抗变为合作博弈,而也会从追求均衡到非零和,共同寻求发展。 我单纯的认为将政府和最广大的福利享有者以博弈论的视角下来看,两者博弈的狭义应该是从博弈双方变化为博弈内容,也就是说由开始的对抗者追求享有福利的权益,变化为已享有福利者对于福利内容的追求,这里所指的追求可以是保障或是对于福利内容再界定。 对抗者往往处于被动,因此对抗者只能寄希望于决策者劣势的策略选择,但是在博弈中不能忽视的是博弈双方往往存在着信息不对等的问题,因此对抗者很难通过单纯的对抗来获得优势。因为双方不同的社会作用和地位,在这个博弈之中,几乎不会出现一方打倒一方的情况,只能出现优势的倾斜。参与博弈的对抗者想通过这一过程来扩大自身的福利,或是争取自身的福利。而决策者则要考虑更多,如何

寻找到双方博弈的平衡点应该是决策者首先考虑的因素。而决策者要害更多顾虑,由于决策者的政策往往具备了对社会产生影响的能力,因此决策者并不能在单纯刨除了自身利益关联及其他因素之后,就能完全的偏向对抗者的意愿,决策者必须使得规则在顾及了全体局中人和参与者的意愿之后,又不存在种种可能产生不良后果的诱因。决策者与对抗者的种种矛盾决定了两者在社会福利的制定、实施、修改、完善等各方面都充斥着博弈行为,而且这一系列的博弈是不可消除的,同时也是不能逆的,因为在博弈双方不断试探和找寻平衡点的过程中,社会福利也随着进步,无论是哪一方面。福利享有者在享有了福利之后,便不会再忍受福利的倒退,而决策者也必须充分听取最广大社会成员的意见,毕竟那是权利构成的基础。 如果将在社会福利相关之中的双方的博弈行为看着是不断发展的,那么中国的社会福利无疑还处在第一阶段的博弈,即社会成员还在追求自身的福利,而同时表现出了不同的博弈者所追求的福利界定还不尽相同。在具体的操作上由政府代表国家提供福利。表面看来,福利的提供主体是政府,实际上,政府只是一个中介机构,真正提供福利的是国民,其基本途径来自于税收。然后相较于knowledge is power 这句名言,power is power 似乎更能说明在中国产生差异的原因。过于注重权力导致了上重下轻的社会结构,大量的资源集中在了掌握权力的人群手中,相较而言,权力缺乏的人群往往得不到福利的保障,或者只能得到可以涵盖绝大多数人的部分福利。

博弈论经典案例分析

博弈论经典案例分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

博弈论复习题及答案

博弈论复习题及答案 Pleasure Group Office【T985AB-B866SYT-B182C-BS682T-STT18】

一、名词解释(每题7分,共28分) 1、逆向选择:逆向选择源于事前的信息不对称,经典例子就是“柠檬市场”——二手车市场,它使得市场资源逐渐流向低质量的产品或要素,最后形成劣货驱逐良货的局面,这种现象称之为“逆向选择”。 2、策略互动:所谓策略互动,就是参与人之间的策略相互影响、相互作用和相互制约。用策略性思维来分析问题,从中找出合理策略,实现目标最优。 3、纳什均衡:对于博弈方而言,互为最优的策略选择就是纳什均衡。 4、信号发送:是指信息优势方不断发出信息的行为,就叫信号发送。 5、博弈论:研究人们如何进行决策,以及这种决策如何达到均衡(合理策略)的问题。每个博弈者在决定采取何种行动时,不但要根据自身的利益和目的行事,还必须考虑到他的决策行为对其他人的可能影响,以及其他人的反应行为的可能后果,通过选择最佳行动计划,来寻求收益或效用的最大化。 二、简要回答问题(每题10分,共40分) 1、博弈的基本要素有哪些基本特点是什么 答:博弈的基本要素有:参与人、策略、行动顺序、信息、收益等五个要素。博弈的基本特点则是需尽可能考虑到博弈对方的决策选择以及对自身的影响,并从中选择出对自身最有利的方案决策,从而达到收益和效用最大化。 2、什么是性别战博弈请求出其中的纳什均衡

答:性别战博弈是不可调和的博弈,双方只有一方选择满足另外一方的要求才能达成均衡,也就是混合策略纳什均衡;故性别战博弈的纳什均衡会有两种情况,分别是:男生陪女生看电影以及女生陪男生看足球的两种选择。 3、猎鹿博弈反映的基本思想是什么 答:反应的基本思想是需要沟通和互相协调,因为只有合作才能猎到所需猎物。 4、什么是道德风险有什么办法可以解决道德风险问题 答:道德风险是指委托-代理框架中,由于委托人无法直接观察代理人行动,造成信息不对称,从而出现代理人选择不利于委托人的行为的一种现象;解决道德风险的方法可以用签订合同、派人监督,以及采用激励等方式来进行解决,约束和激励机制。 三、计算题(16分) 1、求解下列博弈中的纳什均衡(包括混合策略纳什均衡)。 F 2 B 2 F 1 B 1 答:根据上方的矩阵图,我们可得出其博弈中存在两种策略的纳什均衡:分别是H 选择F1和N 选择F2,以及H 选择B1和N 选择B2 2、A 、B 两者博弈:A 首先行动,可以选择“左”或者“右”的行动;B 后行动,有“L ”和“R ”的行动,其收益如下:当A 选左,B 选L 时,A 的收益为2 ,B 的收益为3;当A 选左,B 选R 时,A 的收益为1 ,B 的收益为4;当A 选右,B 选L 时,A 的收益为3 ,B 的收益为1;当A 选右,B 选R 时,A 的收益为N H

从博弈论角度看古诺模型

从博弈论角度看古诺模 型 WTD standardization office【WTD 5AB- WTDK 08- WTD 2C】

博弈论的观点看古诺模型 罗思蕴 (华中师范大学数学与应用数学系,武汉430079) 摘要:运用博弈论的研究方法,对古诺模型的几种变式进行分析,给出模型解法的代数表达式,并对结果进行适当的对比分析,最后总结出不同模型对结论的改变情况。 关键词:古诺模型纳什均衡完全信息不完全信息静态博弈动态博弈 古诺模型(Cournot model)是博弈论中最具有代表性的模型之一,也是是纳什均衡最早的版本。它是法国经济学家古诺(Augustin Cournot)在1938年出版的《财富理论的数学原理研究》一书中最先提出的。而古诺的定义比纳什的定义早了一百多年,足以体现博弈论这样一个学科是深深扎根于经济学的土壤中的。从经济学的角度,它的研究价值在于古诺模型是介于两种极端状况完全竞争和垄断之间。 在古诺生活的时代,大多数市场都只有少数的厂商经营,所以这个模型在当时是极具现实意义的。随着时间的推移,古诺模型也演变出了各种不同的版本。如果从博弈论的角度分析,有四种情况极具代表性:完全信息静态博弈的古诺模型、不完全信息静态博弈的古诺模型、完全且完美信息动态博弈的古诺模型、无限次重复博弈的古诺模型。 1 经典古诺模型 古诺模型最初的形态是来自于经济学的。在经济学中,寡头的概念是指那种在某一产业只有少数几个卖者的市场组织形式。古诺模型对寡头具有如下的基本假设。一,

假定一个产业只有两个寡头,每个寡头生产同质产品,并追求利润最大化。二,两个寡头之间进行的是产量的竞争而不是价格竞争,且产品的价格依赖于两者生产的产品总量。三,寡头之间无勾结行为。四,每个生产者都把对方的产出水平视为定值。五,边际成本为常数。 在经典的古诺模型中,每个企业具有相同的不变单位成本: 需求函数为: 第i个企业的利润为: 最优化的一阶条件为: 反应函数为: 解得纳什均衡为: 每个公司的利润为: 古诺模型是在假定寡头具有完全信息的基础上导出的。在这一均衡中,每个寡头都可以准确猜测对手的产量,从而选择自己的最大产出。 最重要的是,古诺均衡解在寡头无勾结的假定下求出的。如果考虑寡头之间相互勾结而达到均衡的情况,那么经过计算可以得到实际产出水平与实际价格上等于完全垄断条件下达到的产量与价格。更广泛的,考虑无勾结寡头市场、垄断市场、自由市场,可以得到:无论是产量还是价格,无勾结寡头市场都是处于中间的位置。也就是说,如果寡头市场不存在勾结的行为,其效率高于完全垄断,低于完全竞争。 2 博弈分类下的两种古诺模型 不完全信息静态博弈的古诺模型 完全信息静态博弈的古诺模型即经济学中最经典的形式,它假设了厂商相互完全

博弈论答疑

问题: 吴老师你好,关于problems,在看过你下午传到邮箱里的纠正答案后,我仍有几个问题,希望老师能够帮助解答。 1. 关于子博弈精炼均衡和纳什均衡的区别,除了前者能剔除不可信威胁外,怎么从序贯理性的角度或者他们的定义解释二者差别呢? Nash均衡主要主要是从静态角度来看问题的,所以它没有序贯理性的要求。即使对于动态博弈,Nash均衡实际上也是从静态的角度去分析的,因此,它会丢掉动态博弈中的一些重要信息,比如博弈的时序、博弈过程中的信息显示以及相应的信念更新,等等。而SPE强调的是博弈的动态性,所以有序贯理性的要求。 2. 第7题中问道:If (discount factor)is too small for the firms to use trigger strategies to sustain the monopoly output, what is the most-profitable symmetric subgame-perfect Nash equilibrium that can be sustained using trigger strategies?具体怎么理解呢? 要维持的合谋程度越高,要求的贴现因子越大。因为合谋程度越高,player背离的激励就越大,在惩罚手段一定的情况下(每一期博弈中,每个player i的minmax payoff是一定的,这个payoff就是能够队player i施加的最严厉的惩罚),要求的最小贴现因子就越大。 在贴现因子比较小,不足以维持完全合谋的情况下,只能维持部分合谋(比如在1至n1期合谋,n2至n3期实行Cournot竞争;然后再合谋n1期,------ )。这时候,参与人的payoff 就介于完全合谋和Cournot竞争之间。题目就是要求我们求出这个可以维持的最高的payoff。 3. 对于11题b博弈树,NE和SPNE是否是(R,M');两个博弈的PBE又如何求出呢? 对于这个博弈的NE,直接将其策略式表述写出来,用划线法就可以很容易得到。由于这个博弈只有原博弈这样一个子博弈,所以他的所有NE都是SPE。 其策略式表述为:

博弈论视角下的公共决策分析梁伟

第9卷第1期 2012年1月Journal of Hubei University of Economics(Humanities and Social Sciences) 湖北经济学院学报(人文社会科学版) Jan.2012Vol.9No.1 传统的公共决策视角是一种权力视角,这种视角从权力主体的单一立场出发,其决策的结果往往背离公共决策公共性价值,造成决策失误,给社会和人们带来严重的危害和经济损失。基于这个事实,本章将引进博弈论的视角对公共决策的主体、内涵以及决策过程进行重新考量,以促进公共决策正义性价值的实现。 一、公共决策中博弈论视角引入的背景 随着市场经济的不断完善以及政治体制改革的逐步推进,利益结构的多元化已成为一个不可回避的现实。利益主体对自我利益的强烈关注以及整个社会对利益主体权利义务的理性认识提升了各利益群体对决策介入的迫切需要。那些在利益格局中本已存在的或新近出现的诸多主体都有着表达其要求,希望政府作出利于自己决策,以维护自我既得权益的强烈愿望。可以说,中国30年改革开放的过程就是国家和人民从封闭走向开放、公民权利意识从沉睡走向觉醒,利益的主体从一元走向多元的过程。在这种背景下,以“权力视角”为中心,以政府为单一决策主体的公共决策已无法适应时代发展的需要,公共决策领域急需引入另一种视角———“关系视角”。博弈论视角正是这种关系视角,它是“研究决策主体的行为发生直接作用时候的决策以及这种决策的均衡问题”。 [1] 在博弈 论里,个人效用函数不仅依赖于他自己的选择,而且依赖于他人的选择;个人的最优选择是其他人选择的函数。简而言之,决策主体在做出决策时,在考虑其他理性人最大效用的基础上实现自己效用的最大化。同时,它充分尊重所有决策主体参与决策的自由和权利,强调决策中各博弈主体力量的规制与均衡。这种通过利益相关方自由博弈的“关系视角”正迎合了时代对公共决策正义的吁求。 笔者把博弈论引入公共决策分析,首先从公共选择理论中得到启示。公共选择理论认为:人类社会可以分为两种市场:一个是经济市场,另一个是政治市场。经济市场在尊重每个理性人基础上分配利益,政治市场不仅分配具体的利益,更重的是它还分配人的权利。如果人的平等、自由、受尊重等权利在分配利益的经济市场里能得到完整和维护,它更理应在分配权利的政治市场里受到同样的对待。原因显而易见,在经济市场和政治市场上活动的是同一个人,没有理由认为同一个人在两个不同的市场上会根据两种完全不同的行为动机进 行活动。博弈论是应用于经济市场的重要理论,它从个体选择出发,尊重个体选择过程中的理性行为,在公共决策中引入博弈论视域,尊重个体理性,体现了个体理性在“两种市场”选择逻辑的一致性。 其次,作决策是个人、集体、国家运行中常见的事项。决策可分为个人决策、集体决策、公共决策等。个人决策决定的是具有私人独享性的个人利益,集体决策决定的是具有组织分享性的集体利益,公共决策决定的是具有社会分享性的公共利益。博弈论作为20世纪40年代开始兴起的现代决策理论,被个体决策和集体决策广泛应用于决策的过程中。公共决策分配的是公共利益,内含公共性价值,与每个人的利益密切相关。如果个体决策和集体决策都不是单方面单角度的决定过程,而是博弈的过程,那么公共决策更应该如此,即充分尊重利益相关主体选择的自由和权利,让他们参与到具体决策的博弈中,这是公共决策正义价值的一个重要体现。 再次,当今中国发生的一些公共决策案例很好地证明了这种假设:在公共决策中,如果公民和社会团体能够出场和公权力进行博弈,则会促进公共决策的公平正义。比如:2004年深圳西部通道工程原计划要经过居民小区,小区居民因为工程的污染而意见纷纷,此后,政府和小区居民进行了一场声势浩大的博弈,博弈的结果皆大欢喜,小区居民作出了让步———同意工程继续进行,政府机构也作出了妥协———改变工程设计方案,以尽可能减少对沿边居民的影响。基于以为理论上和实践上的三点理由,我有理由认为“博弈论视角下的公共决策分析”并非是不合时宜的,问题在于,对此探讨的努力能在多大程度上促进这种时宜。 二、博弈论视角下公共决策内涵的重新考量 传统“权力视角”的公共决策主体单一化,公共决策目标更为强调效率,公共利益模糊化和虚拟化,博弈论视角下的公共决策内涵必然要从以下几方面重新审视和考量。 第一,公共决策主体。博弈论视域下的公共决策主体不同于政府单向度的传统公共决策,它是多向化的。现代社会“人们已经不能再接受这样的观念,即政府的公共政策是由那些掌握权力,声称代表公共利益,但拒绝公民参与政策过程的少数领导人制定的。”[2]西方一些学者把政治现代化概括成专制政治向民主政治转化的过程,从历史考察,这种过程的逻辑模 博弈论视角下的公共决策分析 梁 伟 (广东培正学院,广东广州510830) 摘 要:博弈论是应用于经济市场的重要理论,本论题把博弈论视角引入公共决策中,试图对公共决策的主体、 目标、公共利益作重新的考量和分析,以寻找公共决策正义的进路。 关键词:博弈论;关系视角;公共决策 45··

博弈论经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A来说,囚徒B有坦白和不坦白两种可能的选择,假设囚徒B的选择是不坦白,则对囚徒A来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B选择的是坦白,则囚徒A不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B采取何种策略囚徒A的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 嫌疑犯乙

案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 价格战 案例:假设市场中仅有A 、B 两家企业,每家企业可采取的定价策略都是10元或15元,我们可以得出得益矩阵如下: 分析:无论对企业A 还是企业B 来说,低价都是他们的占优战略。从表可见,企业A 的占优战略是10元,因为无论B 采取什么战略,企业A 都能获取比定价15元更多的利润。 如果企业B 定价10元,企业A 定价10元能够获利80万元,而定价15元只能获得30万元;如果企业B 定价15元,企业A 定价10元可获利170万元,而定价15元却只能获利120万元。同样地,企业B 的占优战略也是定价10元的策略。 企业B 男

博弈论复习题及答案

一、名词解释(每题7分,共28分) 1、逆向选择:逆向选择源于事前的信息不对称,经典例子就是“柠檬市场”——二手车市场,它使得市场资源逐渐流向低质量的产品或要素,最后形成劣货驱逐良货的局面,这种现象称之为“逆向选择”。 2、策略互动:所谓策略互动,就是参与人之间的策略相互影响、相互作用和相互制约。用策略性思维来分析问题,从中找出合理策略,实现目标最优。 3、纳什均衡:对于博弈方而言,互为最优的策略选择就是纳什均衡。 4、信号发送:是指信息优势方不断发出信息的行为,就叫信号发送。 5、博弈论:研究人们如何进行决策,以及这种决策如何达到均衡(合理策略)的问题。每个博弈者在决定采取何种行动时,不但要根据自身的利益和目的行事,还必须考虑到他的决策行为对其他人的可能影响,以及其他人的反应行为的可能后果,通过选择最佳行动计划,来寻求收益或效用的最大化。 二、简要回答问题(每题10分,共40分) 1、博弈的基本要素有哪些?基本特点是什么? 答:博弈的基本要素有:参与人、策略、行动顺序、信息、收益等五个要素。博弈的基本特点则是需尽可能考虑到博弈对方的决策选择以及对自身的影响,并从中选择出对自身最有利的方案决策,从而达到收益和效用最大化。 2、什么是性别战博弈?请求出其中的纳什均衡? 答:性别战博弈是不可调和的博弈,双方只有一方选择满足另外一方的要求才能达成均衡,也就是混合策略纳什均衡;故性别战博弈的纳什均衡会有两种情况,分别是:男生陪女生看电影以及女生陪男生看足球的两种选择。 3、猎鹿博弈反映的基本思想是什么? 答:反应的基本思想是需要沟通和互相协调,因为只有合作才能猎到所需猎物。

博弈论案例分析

(1)失火了,你往哪个门跑 失火了,你往哪个门跑——这就是博弈论 一天晚上,你参加一个派对,屋里有很多人,你玩得很开心。这时候,屋里突然失火,火势很大,无法扑灭。此时你想逃生。你的面前有两个门,左门和右门,你必须在它们之间选择。但问题是,其他人也要争抢这两个门出逃。如果你选择的门是很多人选择的,那么你将因人多拥挤、冲不出去而烧死;相反,如果你选择的是较少人选择的,那么你将逃生。这里我们不考虑道德因素,你将如何选择?这就是博弈论! 你的选择必须考虑其他人的选择,而其他人的选择也考虑你的选择。你的结果——博弈论称之为支付,不仅取决于你的行动选择——博弈论称之为策略选择,同时取决于他人的策略选择。你和这群人构成一个博弈(game)。 上述博弈是一个叫张翼成的中国人在1997年提出的一个博弈论模型,被称之为少数者博弈或少数派博弈(Minority Game)。当然,原来的博弈形式不是这么简单,这里我把它简化了,我们在第三部分论述归纳推理时还要谈这个博弈模型。现在很多学者在研究这个问题。 生活中博弈的案例很多,你会见到很多例子。只要涉及到人群的互动,就有博弈。 什么叫博弈?博弈的英文为game,我们一般将它翻译成“游戏”。而在西方,game的意义不同于汉语中的游戏。在英语中,game即是

人们遵循一定规则下的活动,进行活动的人的目的是使自己“赢”。奥林匹克运动会叫Olympic Games。在英文中,game有竞赛的意思,进行game的人是很认真的,不同于汉语中游戏的概念。在汉语中,游戏有儿戏的味道。因此将关于game的理论,即game theory翻译成博弈论或者对策论,是恰当的。本书下面统称game theory为博弈论。 博弈论的出现只有50多年的历史。博弈论的开创者为诺意曼与摩根斯坦,他们1944年出版了《博弈论与经济行为》。诺意曼是着名的数学家,他同时对计算机的发明作出了巨大贡献,他去世时博弈论还未对经济学产生广泛影响,否则经济学的诺贝尔奖肯定有他的名字,因为诺贝尔奖有规定,只颁发给在世的学者。谈到博弈论,不能忽略博弈论天才纳什(John Nash)。纳什的开创性论文《n人博弈的均衡点》(1950)、《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。今天博弈论已发展成一个较完善的学科。 博弈论对于社会科学有着重要的意义,它正成为社会科学研究范式中的一种核心工具,以至于我们可称博弈论是“社会科学的数学”,或者说是关于社会的数学。从理论上讲,博弈论是研究理性的行动者(agents)相互作用的形式理论,而实际上它正深入到经济学、政治学、社会学等等,被各门社会科学所应用。甚至有学者声称要用博弈论重新改写经济学。1994年经济学诺贝尔奖颁发给三位博弈论专家:纳什、塞尔屯、哈桑尼(),而像1985年获得诺贝尔奖的公共选择学派的领导者布坎南,1995年获得诺贝尔奖的理性主义学派的领袖卢

博弈论经典模型全解析

博弈论经典模型全解析(入门级) 1. 囚徒困境这是博弈论中最最经典的案例了——囚徒困境,非常耐人寻味。“囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不

会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到,他的同伙也不是傻子,也会这样来设想他。所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。企业在信息化过程中需要与咨询企业、软件供应商打交道的。在与这些企业打交道的过程中,我们不可避免地也会遇到类似的两难境地,这个时候需要相互之间有足够的了解与信任,没有起码的信任做基础,切不可贸然合作。在对对方有了足够的信任之后,诚意也是必不可少的,如果没有诚意或者太过贪婪,就可能闹到双方都没有好处的糟糕情况,造成企业之间的双输。 2. 智猪博弈在博弈论(Game Theory)经济学中,“智猪博弈”是一个着名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是

博弈论的经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

博弈论视角下我国政府与企业的关系

【关键词】博弈论政府企业关系 随着中国经济的飞速发展,中国企业在世界经济舞台中的地位越来越突出。但在看到成绩的同时,也应该注意到政府和企业关系的不明确成了我国企业发展的重大问题。在十六届五中全会上,政府对其关系有了一个明确的指示。党的十六届五中全会通过的《中共中央关于制定国民经济和社会发展第十一个五年规划的建议》提出了我国今后体制改革的重要任务之一是“继续推进政企分开、政资分开、政事分开、政府与市场中介组织分开,减少和规范行政审批”。 政府与市场的关系、政府与企业之间的关系是我国经济体制改革过程中必须正确处理的一个关键问题。它直接关系到我国企业能否真正成为市场主体,社会主义市场经济体制能否完善,经济能否实现健康持续发展等。因此,建立符合社会主义市场经济要求的、透明高效的政企关系,是我国必须重视和尽快解决的重大课题。政府与企业关系改革的基本目标是根据所有权与经营权相分离的原则,实行政企分开。 一、政府和企业的博弈关系 政府与企业之间的关系如何,在某种程度上决定了一个国家经济发展的自由度和活力。本文从博弈论的理论视角来分析我国政府和企业的关系发展。 博弈论(game theory)是研究各方策略相互影响的条件下理性决策人的决策行为的一种理论。政府和企业都有自己所追求的利益,他们各自的策略对对方都有重要的影响。所以说政府和企业就构成了博弈双方。博弈的最优化就是博弈双方的利益最大化,也就是说在政府和企业的博弈中,最好的结果就是政府达到自己的管理目的,而企业也取得了自己的发展目标,从而最终实现社会的和谐发展。从博弈的经典案例――“囚徒困境”的分析中我们可以得到政企关系改革的启示。 “囚徒困境”讲的是两个涉嫌共谋犯罪的嫌疑犯在被捕后面对“坦白”与“不坦白”的策略选择问题,两嫌疑犯都从各自利益最大化的理性出发,不管对方选择什么策略,都以“坦白”作为最佳应对策略来获得自身最大利益,结果却得到对谁都不利的结局――锒铛入狱。显然,在此案例中两嫌疑犯的举动是非合作博弈,在理性的不合作中追求自身利益最大化往往会获得最差的结果。 将此案例中的博弈者替换为利益冲突者,例如高收入者和低收入者、企业家和工人、政府和百姓、城市和农村、东部和中西部等。如果当局双方只考虑自己,以非合作的方式行事,那么他们的理性行为也只能导致理性不愿意看到的结果――贫富悬殊、劳资对抗、腐败滋生、政治失语以及隐藏在这些现象背后的各种矛盾和冲突。因此,为真正保证利益最大化,必须摒弃自私自利的非合作态度,从对方的角度出发换位思考,在合作中达到利益均衡。而且,博弈理论研究结果显示,在一次性博弈中,当局者往往存在着侥幸心理,肆无忌惮地只为自己谋利。但在重复博弈行为中,参与者可以从上次博弈结果中权衡利弊、揣度对方心理、预测对方可能采取的策略,当局者也须在反复行动中建立自己的社会形象。这时,博弈当局往往走向合作,实现双方利益最大化。政府和企业在社会形象上都有很高的要求,所以从这个方面说只有合作才能实现双方利益的最大化。 从上面囚徒的困境的分析中我们可以发现最优化的政府和企业关系就是实现合作博弈。就是政府和企业在制定策略和实施行动的时候多从对方的角度出发,换位思考,在合作中达到利益均衡。最终实现政府和企业双方的“帕累托最优”。

博弈论浅谈

博弈论浅谈 2015年6月15日 ***学院

摘要 通过半个学期对博弈论这门课的学习,我对博弈论有了自己初步的看法,并且能运用其简单的去分析一些事情。我觉得这是我学习博弈论所获得的最大收获。当今社会是一个激烈竞争的社会,是一个各方利益明争暗斗和各方势力此消彼长的社会。面对错综复杂的社会关系和日益功利的社会环境,如何在不对等情况和不公平背景下以弱制强,以少胜多是我们必须深思的问题。那么,如何在面对各种对自己不利的博弈中胜出呢?我想多少了解一点博弈论对自己是有好处的。 博弈是智慧的较量,互为攻守却又相互制约。有人的地方就有竞争,有竞争的地方就有博弈。人生充满博弈,若想在现代社会做一个有成就,就必须懂得博弈的运用。在博弈论中,有以下几种博弈:囚徒困境(引申出来的有“旅行者困境”)、纳什均衡、智猪博弈、猎鹿博弈、酒吧博弈、枪手博弈、警察与小偷博弈、斗鸡博弈、协和博弈、海盗分金博弈、讨价还价博弈和路径依赖博弈等。如果我们可以将博弈论的原理和规则运用到自己的人生实践中,那么面对问题并可做出理性选择,一定程度上避免盲目行动。 关键词:博弈论囚徒困境智猪博弈公路飙车博弈

目录 摘要 .................................................................................................................................... II 目录 ................................................................................................................................... I II 一.对博弈论的理解 (1) 二.几个模型 (3) 1.囚徒困境 (3) 2. 智猪博弈 (4) 3.公路飙车博弈 (4) 三.总结 (6) 参考文献 (7)

博弈论经典案例《智猪博弈》

在经济学中,在经济学中,智猪博弈”(PigS ' PayoffS(BoXed PigS) 是一个著名博弈论例子。 这个例子讲的是:猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。 那么,两只猪各会采取什么策略?答案是:小猪将选择搭 便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。 原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。 小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是:每次落下的事物数量和踏板与投食口之 间的距离。 如果改变一下核心指标,猪圈里还会出现同样的小猪躺着 大猪跑”的景象吗?试试看。 改变方案一:减量方案。投食仅原来的一半分量。结果是小 猪大猪都不去踩踏板了。小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将也会把食物吃完。谁去踩踏板,就意味着为对方贡

献食物,所以谁也不会有踩踏板的动力了。 如果目的是想让猪们去多踩踏板,这个游戏规则的设计显然 是失败的。 改变方案二:增量方案。投食为原来的一倍分量。结果是小 猪、大猪都会去踩踏板。谁想吃,谁就会去踩踏板。反正对方不会一次把食物吃完。小猪和大猪相当于生活在物质相对丰富的 共产主义”社会,所以竞争意识却不会很强。 对于游戏规则的设计者来说,这个规则的成本相当高(每次提供双份的食物);而且因为竞争不强烈,想让猪们去多踩踏板的效 果并不好。 改变方案三:减量加移位方案。投食仅原来的一半分量,但同时将投食口移到踏板附近。结果呢,小猪和大猪都在拼命地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费 宀 完。 对于游戏设计者,这是一个最好的方案。成本不高,但收获最 大。 原版的智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。但是对于社会而言,因为小猪未能参与竞争,小猪搭便车时的社会资源配置的并不是最佳状态。为使资源最有效配置,规 则的设计者是不愿看见有人搭便车的,政府如此,公 司的老板也是如此。而能否完全杜绝搭便车”现象,就要看游戏 规则的核心指标设置是否合适了。

相关主题