纳什均衡与囚徒困境.ppt

上传人:hyn****60 文档编号:70709057 上传时间:2023-01-25 格式:PPT 页数:62 大小:1.50MB
返回 下载 相关 举报
纳什均衡与囚徒困境.ppt_第1页
第1页 / 共62页
纳什均衡与囚徒困境.ppt_第2页
第2页 / 共62页
点击查看更多>>
资源描述

《纳什均衡与囚徒困境.ppt》由会员分享,可在线阅读,更多相关《纳什均衡与囚徒困境.ppt(62页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、策略思维与博弈策略思维与博弈主主 讲讲 人:人:孙其龙孙其龙经济管理学院工业工程系经济管理学院工业工程系联系方式联系方式:内容提要掌握博弈的战略表示理解纳什均衡的概念及其求解囚徒困境:个人理性与集体理性游戏一:成绩博弈假如本课程的最后成绩有三种结果:0(重修)、1(及格)、-1(毕业大补考)和3(优秀).在不与其他人商量的前提下,请填写a或b,若你是a,你的同桌也是a,则你们两人均得0;若你是a,你的同桌是b,则你得3,你的同桌得-1;若你是b,你的同桌是a,则你得-1,你的同桌得3;若你是b,你的同桌也是b,则你们两人均得1;成绩博弈的战略表示A B同桌你aba0,03,-1b-1,31,1

2、纳什均衡的结果占优策略策略a严格优于策略b,如果从策略a中得到的收益严格大于从策略b中得到的收益。反之成为劣策略。教训1:选择优势策略,放弃劣势策略。教训2:理性的选择导致了次优的结果。个人理性与集体理性的冲突“囚徒困境”表明个人理性与集体理性的冲突。囚徒困境反映个人最佳选择并非团体最佳选择。反映个人最佳选择并非团体最佳选择。明知道合作是最佳选择,但事情的发展往往向坏的一方面发展。囚徒困境中的合作是不可信的,没有人愿意遵守合作的承诺。其结果是竞争、“背叛”,最终造成该行业集体受损。个人理性与集体理性的冲突这样的例子很多:寡头竞争,军备竞赛,团队生产中的劳动供给,公共产品的供给,等等;许多的制度

3、就是为解决“囚徒困境”而存在的;2、现实中的“囚徒困境”产品的价格战:家电企业的降价军备竞赛:两国的选择:增加军备(背叛)、或是达成削减武器协议(合作)。两国都无法肯定对方会遵守协议,因此两国最终会倾向增加军备。广告战:增加广告开支OPEC:私自增加石油产量关税战:私自提高关税对纳什均衡的理解定义:给定其他人策略的条件下,每个参与人选择自己的最优策略,从而使自己利益最大化。纳什均衡是所有参与人最优战略的组合。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。在成绩博弈中(a,a)是一个纳什均衡,其中第一个a是第一个参与人的最优策略,第二个a是第二个参与人的最优策略。纳什均衡是一个策略组合

4、。1、纳什均衡是一种“僵局”,给定别人不动的情况下,没有人有兴趣动。2、自动实施性。假设博弈中所有人事先达成一个协议,在没有外在的强制力约束时,当事人是否自觉遵守这个协议。或者说,这个协议可以自动实施。纳什均衡的启示1、一个协议如果不能构成纳什均衡,它就不能自动实施,也就是说,至少有一个参与人会违背这个协议。不满足纳什均衡的协议是没有意义的。2、一个制度(体制)的安排要发生效力,必须是一种纳什均衡。否则,这种制度安排便不能成立。例子1、囚徒困境2、公共产品的供给大家出钱兴办公用事业,所有人的福利都会增加,问题是,如果我出钱,你不出钱,我得不偿失;反之,你出钱,我不出钱,就可以占你的便宜。结果,

5、大家都不出钱。公共产品(public goods)提供不提供提供不提供4,4-1,55,-10,0无论对方如何选择,每个人的最优选择:不提供。所以,我们可以预测,结果将是(不提供,不提供)税收制度就是保证公共产品的生产,解决公共产品生产上的“囚徒困境”例子3、军备竞赛谁都知道大量扩军是劳民伤财,问题是,我不扩军,你扩军,我不是要受到军事威胁么?4、经济体制改革改革者要付出成本,甚至牺牲,而改革的成果大家共享,结果是,人人都知道改革好,但是却没有人真正的去改革。智猪博弈(boxed pigs)猪圈里圈两头猪,一头大猪,一头小猪。猪圈的一头有一个猪食槽,另一头安装一个按钮,控制着猪食的供应。按一下

6、按钮会有10个单位的猪食进槽,但谁按按钮谁就需要付2个单位的成本。若大猪先到,大猪吃到9个单位,小猪只能吃1个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃6个单位,小猪吃4个单位。结果是怎样呢?“智猪博弈”(boxed pigs)按等待按等待3,12,47,10,0这个博弈中,大猪的最优选择依赖于小猪的选择,但小猪的最优选择与大猪的选择无关。如果大猪知道小猪的理性的,大猪将选择“按”。均衡是“大猪按,小猪等待”。“劣”战略:无论对方选择什么,如果自己选择A得到的总是收益小于选择B得到的收益,A就是相对于B的劣战略。纳什均衡:举例广告博弈纳什均衡:(做广告,做广告)企业1企

7、业2利用纳什均衡寻租考虑股票市场融资的例子:设想企业价值是100,现在发行的流通股为100股,每股价值1元。现在假定经理想筹集100元,但是投资后的价值只有50元。有人买新股吗?(投100元,收回50元)从股东利益来讲,这100元是不应该筹集的。经理的策略:配股假定每一股配4股(100股,共配400股),价格为0.25元(4000.25=100)。假定100个股东,持股分散。如果股东不接受配股:原来一股1元的价值就变成0.3元(=150/500);如果接受配股,他持有的股票的价值是1.5(5股0.3)元;因为配股的成本是1(40.25)元,他多花1元,比不配股多得到1.2=1.5-0.3的总价

8、值。所以他的最优选择是接受配股。多有股东都接受配股时一个纳什均衡启示企业的配股价比市场价越低,配股越有可能是经理人的寻租行为,而不是股东利益的考虑。寻租:租,即租金。也就是利润、利益、好处。寻租,即对经济利益的追求寻租的意思人类对经济利益的追求可以分两类:一类是通过生产性活动增进自己的福利。另一类是通过一些非生产性的行为对利益的寻求。如有的政府部门通过设置一些收费项目,来为本部门谋求好处。有的官员利用手中的权利为个人捞取好处,有的企业贿赂官员为本企业得到项目、特许权或其它稀缺的经济资源。后者被称为寻租,后者被称为寻租,是一些既得利益者对既得利益的维护和对既得利益进行的再分配的活动。寻租往往使政

9、府的决策或运作受利益集团或个人的摆布。这些行为有的是非法的,有的合法不合理的。往往成为腐败、社会不公往往成为腐败、社会不公和社会动乱之源。和社会动乱之源。所有权配置与等级结构考虑团队生产:让其中的一个人变成所有者工作偷懒工作偷懒6,62,20,88,0甲乙团队生产的囚徒困境现在甲乙都努力工作,各得6支付,是帕累托最优的。但由于囚徒困境问题,每个人的占有策略都是偷懒,所以,结果,每个人都得2.如何解决?1972年,美国 科学家阿尔钦和德姆塞茨(Alchian and Demsetz)在美国经济评论(The American Economic Review)发表了生产、信息成本和经济组织一文,提出

10、了解决方案。是其中一人成为所有者,另一人变成雇员,让前者监督后者,并根据后者的表现对其实行奖惩。所有权配置与等级结构考虑团队生产:让其中的一个人变成所有者工作偷懒工作偷懒6,62,24,42,6雇员老板所有权解决囚徒困境效率标准问题:社会是由人组成的,每个人的行为都会影响到他人的利益。那么,我们用什么样的标准判断个人的行为是否正当?考虑两种情形:情形A:某店主雇人将竞争对手的店门堵上,使后者不能营业;情形B:某店主以更低的价格和更优良的服务将竞争对手打垮。这两种情形有什么不同?为什么法律允许第二种情形而不允许第一种情形?帕累托效率定义:一种状态(资源配置、社会制度等)被称为帕累托最优状态,如果

11、不存在另一种状态能使得没有任何人的处境变坏同时至少有一个人的处境变得更好。简单的说法是:对每个人来说,除非“损人”就不可能“利己”,社会就达到了帕累托最优状态。不同帕累托状态之间不可以比较所以,帕累托最优可能意味着收入分配的不公平;极端地,一个人得到所有收入,另一个人一无所有,也是一个帕累托最优以两人社会为例A的收入B的收入XYZXZX和Y都是帕累托最优状态,但Z不是帕累托最优状态帕累托改进与帕累托标准定义:一种变革没有使任何人的处境变坏,至少有一个人的处境变好。如果一种状态不是帕累托最优,意味着存在帕累托改进的可能。如果社会已经处在帕累托最优状态,就不可能有帕累托改进的余地。状态X帕累托优于

12、状态Y,如果在状态X下,至少有一个人的处境比状态Y下更好,而没有任何人的处境比在状态Y下坏。卡尔多卡尔多-希克斯希克斯(Kaldor-Hicks)标准设想:状态X下,A的收入是100,B的收入也是100;在状态Y下,A的收入是1000,B的收入是99。依帕累托标准,这两个状态是不可比较的:A在状态Y下更好,B在状态X下更好。卡尔多-希克斯标准:如果一种变革使得受益者的所得足以弥补受损者的所失,这种变革就是一个卡尔多-希克斯改进。如果补偿实际发生,就是帕累托改进。因此,“卡尔多-希克斯标准”就是“财富最大化”。应用:工人下岗让一部分工人下岗可以使企业提高效率,更有竞争力,但对于下岗的人来说,利益

13、受到损害,显然,解雇工人不是帕累托最优。但如果其带来的企业效益的提高足以弥补工人的损害,这就是一个卡尔多-希克斯改进。如果给下岗工人足够的实际补偿,使得他的收入比工作的时候并不变得更低。科斯定理很多社会变革都是卡尔多希克斯改进,要将其转化为帕累托改进,就必须解决利益受损者的补偿问题。根据科斯定理:如果产权界定是清楚的,在交易成本为零(很小)的前提下,无论初始的产权安排如何,市场谈判都可以实现帕累托最优。社会成本问题(1960,科斯)个人谈判可以保证卡尔多希克斯效率作为帕累托效率出现。现实如何?改革涉及的人数不多,补偿问题一般通过谈判解决;但对社会层面的大变革来说,由于受益者和受损者人数众多,谈

14、判并不是一件容易的事情,更由于,许多潜在(相对收入和相对地位)的卡尔多希克斯改进根本没有办法进行。公平问题假设原来每个人得100,现在第一个人得到1000,第二个还是100,按照先前的标准,这是一个帕累托改进。但如果公平与否进入了人们的效用函数,这种改进就不见得是帕累托改进。(收入差距变大)这就是心理成本。究竟应该给受损者补偿多少才能使他觉得自己没有受损,很难有客观的标准。进一步即使事后补偿实际上不会发生,变革不可能得到一致的同意。但,如果在作出制度安排前每个人成为赢家的机会均等,从事前角度看,卡尔多希克斯改进也是帕累托改进。如果每个人均有50%的机会成为1000的赢家,变革后每个人的预期0.

15、51000+0.5100=549.5 100预期效用最大化意味着社会成员会事先一致同意财富最大化的制度安排。(罗尔斯,正义论,中国社会科学出版社,2009版)社会公正:机会均等如果一种制度对社会中某些成员有系统性的歧视,财富最大化就可能不是一个合理的标准。从这个意义上,我们用“帕累托效率”作为社会最优集体理性的标准,我们将互换地使用“帕累托最优”,“社会最优”“集体理性”这三个概念。例子:效率标准在法律上的使用举一个法律的例子:过失责任杨颉等诉北京大华无线电仪器厂:杨颉、王磊、徐方略都是十三四岁的儿童,三人的爷爷和奶奶是邻居,居住在大华厂家属楼内。2000年10月2 日,三小孩相约各自携带火柴

16、、爆竹、手电等一起玩耍。大华的厂区与宿舍区有围墙相隔,但是,该围墙有一缺口,人们可以轻易翻越。为了上班方便,人们经常从缺口处翻越行走。三小孩来到大华厂围墙外,从缺口处翻墙进入厂区内,并找到一个装有液体(三氯乙烷,危险品)的白色塑料桶,三人将桶盖拧开倒出液体,王磊用火柴将液体点燃,后王磊又将桶内液体全部倒在火上,使火势突然增大,并发出巨响,随即大火朴到杨颉身上,将其烧伤。(王成,第122页)法院判决:大华厂承担责任HAND 规则。汉德法则(Hand rule)汉德是20世纪美国的大法官。内容是这样的:假如厂方把围墙上的窟窿补上,需要花费成本C,如果不补,发生事故的概率为P,造成的损失为L。因此,

17、如果不补这个窟窿的话,预期的损失是PL。汉德法则是:如果C大于PL,那么厂方无需对窟窿带来的事故后果承担责任;但如果C小于PL,厂方就必须承担责任。为什么法律保护自由贸易?一般来讲,如果每个人都是理性的,自由交换一定是帕累托改进,否则,理性人不会交换。自由交换生社会效率的必要条件。应用:交易效率人们为什么交易:偏好不同;生产成本不同;信息不同;风险态度不同。自愿的交易一定是一个帕累托改进(假定没有欺诈)设想:A拥有10个苹果,0个桃;B拥有0个桃,10个苹果。如果边际效用是递减的,A用5个苹果换B的5个桃,对双方是一个帕累托改进;交易的结果:各有5个苹果和5个桃。应用:竞争规则设想有一个商店。

18、如果一个人使用暴力捣毁这个商店,然后在旁边办起自己的商店销售同样的东西,这种行为就构成犯罪。但如果这个人用较低的价格和更好的服务挤这个商店,他就无须为此承担责任。从该商店的所有者来看,结果是一样,但为什么法律的规则不一样呢?原因在于后一种情况下,社会的所得(包括消费者和新店的所有者)大于所失,是一个卡尔多-希克斯改进,而在前 一种情况下,不如此。一般地,什么是所谓的社会允许甚至鼓励的“正当竞争”?答案是“卡尔多-希克斯标准”。应用:分工效率如果两个人同时生产两样产品(面包和牛奶),每人的产量为(50,50),总产量是(100,100);如果A专业化于生产面包,产量可以达到150;B专业化于生产

19、牛奶,产量可以达到140;那么,分工与不分工比较,就是一个帕累托改进,因为总产量可以达到(150,140)。经济增长很大程度上来自分工效率。经济增长很大程度上来自分工效率。应用:合作与组织如果两个人在一起工作创造的价值大于独立工作创造的价值之和,合作就是一个帕累托改进;当只当组织的价值必须大于个人独立的价值之和时,组织是可能一个帕累托改进;当个人才组织中获得的价值大于独立获得的价值时,加入组织是一个帕累托改进;1+12企业战略联盟:只有当联盟是一个帕累托改进时,联盟才会出现。应用:企业重组以郑百文为例:到2000年6月30日止,郑百文的债务总额达23.46亿,其中对信达资产管理公司负债20.9

20、9亿;在郑百文的资产中,固定资产2.5亿,流动资产61686万(其中大部分是高风险的应收帐款);郑百文的每股净资产为-6.81元,股东权益为-13.458亿。郑百文应该破产清算,还是进行资产重组?清算意味着着除债权人外,其他参与人的价值均为零;因此,只要债务人从重组得到的价值不低于预期可收回的债权,重组对所有参与人是一个帕累托改进。解雇员工能成为一个帕累托改进吗?应用:社会改革如果改革中没有人受损,至少有一些人受益,改革就是一个帕累托改进;如果改革使一部分人受益,另一部分人受损,但受益者所得大于受损者所失,改革是一个卡儿多-希克斯改进,或者说,潜在的帕累托改进;如果受损者得到足够的补偿,就是一

21、个帕累托改进;革命通常不是一个帕累托改进。应用:婚姻家庭自由结婚对夫妻双方是一个帕累托改进;买卖婚姻对买卖双方是一个帕累托改进;离婚不一定是一个帕累托改进;但如果提出离婚的一方愿意补偿另一方,使得对方同意离婚,离婚就是一个帕累托改进;所以,协议离婚是一个帕累托改进。但离婚对其他利益相关者(如父母和儿女)可能不是一个帕累托改进。以什么为比较基:第三者问题李敖之女哭了北京青年报2004年2月13日:为了邻居的狗叫鸡鸣、养花晒衣等,台湾著名作家李敖之女李文多次投诉邻居,以致她和几家邻居的关系日渐紧张。2月10日,嘉浩园区的物业突然向李文发出“逐客令”,以李文给整个园区的生活造成极坏的影响为由,要求李

22、文搬离小区,否则将遭到断水断电的处理。对此,李文流出委屈的泪水,并委托律师状告物业公司。李文说,这幢别墅是她以每月1300美元的租金租来的,租期是三年,从去年8月份开始她一直住在这儿。在别墅的二楼,李文指着某歌星的大院说,前段时间,三条大狼狗经常冲着大铁门狂叫,只要有人过来,大狼狗便不停地狂叫。接着她又指向右侧的一幢别墅说,他们家养了两只公鸡,每天5点左右就开始打鸣,吵得人无法正常休息。李文还说,有的邻居竟在院子内种植庄稼,因此招来了不少蚊虫;有的还将内衣挂在外面晾晒,这种做法很让她受不了。李敖之女哭了李文说,为了维护自己的权益,她多次向小区的物业投诉,而小区的物业只是非常被动地接待她的投诉。

23、无奈,她又多次找到几家邻居交涉,然而交涉的过程却非常艰难,为此还与邻居发生争吵。2月10日,小区的物业竟送来通知,要求她在一个星期内搬走,否则就将她所住的别墅断水断电。李文说,她只是想维护自己的权益,没想到物业竟然赶她走,而且她已经交纳了房屋的租金。说着李文已经泪流满面。当记者问及这些投诉是否挑剔时,李文说:“我感觉我不是那么挑剔,只是我的要求高一点,我的生活观念比人家高一点,只要有人侵犯到我的小范围,影响到我的生活了,我一定要投诉!”北京盟科置业有限公司的总经理陈渊宇接受了记者的采访。陈总说,之所以发出这样的通知,完全是因为李文与邻居的关系太紧张,再就是李文根本听不进别人的意见。李文非常注重

24、自己的权益,以至于到了苛刻的地步。邻居在家中养花、晾衣物她也认为侵犯了她的权益,并为此数次找到物业公司投诉、找到邻居理论。由于李文容易激动,所以从去年8月份她入住该小区以来,就一直与物业和周围邻居关系紧张。寻找纳什均衡C1C2C3R1R2R3100,1000,050,10150,01,160,00,3000,0200,200博弈论的数学表示成绩博弈的战略表示A B同桌你aba0,03,-1b-1,31,1纳什均衡的结果用数学符号表示?对成绩博弈占有策略的严格定义例子一个入侵者打算进入一个国家,有两条路(一条崎岖的路,一天平坦的路),侵略者必须选择一个进入,作为防守者应该选择在哪一条路进行防卫。

25、公元前公元前3世纪,汉尼拔进军罗马世纪,汉尼拔进军罗马 一个选择一个选择是翻越阿尔卑斯山,一个是从平坦的沿海是翻越阿尔卑斯山,一个是从平坦的沿海进军。进军。战略表达如下1,11,10,22,0汉尼拔罗马守军EHEH游戏在不与同桌商量的前提下,选择1-100中的某个数,其中,最接近所有人平均数的2/3的人将获得X元。X=10元减去(所选值与答案之差)比如平均数为30,则302/3=20,你选18(25),则18(25)与20的差为2(5),则你的收益为10-2(5)=8(5)元。这个游戏的策略是:不仅仅要站在其他人的角度思考,还要考虑的其他人也站在其他人的角度思考,并且其他人知道其他人站在其他人角度思考.“共识”(common knowledge)

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 生活常识

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com