《囚徒困境》PPT课件.ppt

上传人:wuy****n92 文档编号:79006061 上传时间:2023-03-19 格式:PPT 页数:42 大小:890.50KB
返回 下载 相关 举报
《囚徒困境》PPT课件.ppt_第1页
第1页 / 共42页
《囚徒困境》PPT课件.ppt_第2页
第2页 / 共42页
点击查看更多>>
资源描述

《《囚徒困境》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《囚徒困境》PPT课件.ppt(42页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、 经济博弈论经济博弈论 第一章第一章 导论导论1950年年7月美军第月美军第24师到师到达朝鲜大田火车站达朝鲜大田火车站 朝鲜战争于朝鲜战争于1950年年6月月25日爆发日爆发美国出兵干涉美国出兵干涉 美侵朝战争失败后美侵朝战争失败后,艾森豪威尔是如艾森豪威尔是如何评价那场战争何评价那场战争?艾将军说艾将军说,他们他们对朝鲜的战争是对朝鲜的战争是在错误的时间、在错误的时间、错误的地点、所错误的地点、所进行的一场错误进行的一场错误的战争的战争 我们来自不同的我们来自不同的地区地区,为了一个共同为了一个共同的目标走到了一起的目标走到了一起,我真诚地希望我真诚地希望,我们我们在今后这一段特定的在今后

2、这一段特定的时间、特定的地点、时间、特定的地点、能进行特别真诚的合能进行特别真诚的合作作,结成友好的朋友结成友好的朋友 冯海荣冯海荣教育经历:教育经历:时间时间学校专业学校专业学历学历2008.092012.07西南交通大学经济管理学院西南交通大学经济管理学院 管理科学与工程管理科学与工程博士博士2005.092008.07四川师范大学数学与软件科四川师范大学数学与软件科学学院学学院 运筹学与控制论运筹学与控制论硕士硕士2001.092005.07四川师范大学数学与软件科四川师范大学数学与软件科学学院学学院 数学与应用数学数学与应用数学本科本科联系方式:联系方式:QQ:1047823588 T

3、EL:1.1.1 1.1.1 什么是什么是“博弈博弈”?博弈Game(游戏)围棋等棋类比赛、桥牌拱猪等扑克游戏,以及田径、球围棋等棋类比赛、桥牌拱猪等扑克游戏,以及田径、球类等各种体育比赛类等各种体育比赛 人们在一定规则下进行竞赛人们在一定规则下进行竞赛 在竞赛中,策略,或者说计在竞赛中,策略,或者说计谋,有举足轻重的作用。谋,有举足轻重的作用。Game(游戏)博弈起源于游戏中的策略对抗博弈起源于游戏中的策略对抗 博弈是策略起关博弈是策略起关键作用的游戏键作用的游戏博弈,根据博弈,根据辞海辞海的解释,就是在多决策主体之的解释,就是在多决策主体之间行为具有相互作用时,各主体根据所掌握信息及间行为

4、具有相互作用时,各主体根据所掌握信息及对自身能力的认知,做出有利于自己的决策的一种对自身能力的认知,做出有利于自己的决策的一种行为。行为。博弈就是决策行为博弈就是决策行为“石头石头-剪子剪子-布布”游戏游戏游戏特点游戏特点有一定的规则,规定游戏的参加者,游戏者可以做什么,不有一定的规则,规定游戏的参加者,游戏者可以做什么,不可以做什么。可以做什么。都有结果,如一方赢、一方输、平局等都有结果,如一方赢、一方输、平局等 策略至关重要,每一个策略至关重要,每一个游戏者所得结果的好坏,游戏者所得结果的好坏,不仅取决于自身的策略不仅取决于自身的策略选择,也取决于其他参选择,也取决于其他参加者的策略选择。

5、加者的策略选择。游戏特点游戏特点在游戏中,也规定了游戏参加者出招的顺序,是同时做出选在游戏中,也规定了游戏参加者出招的顺序,是同时做出选择还是先后做出选择等。择还是先后做出选择等。1.1.2 博弈的非技术性定义博弈的非技术性定义 博弈博弈就是一些个人、对组或其它组织,面对一定的环就是一些个人、对组或其它组织,面对一定的环境条件、在一定的规则下,同时或先后,一次或多次,从境条件、在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。取得相应结果的过程。1.1.2 博弈的非技术性定义博弈的非

6、技术性定义博弈论就是系统研究可以用上述方法定义的各种博弈博弈论就是系统研究可以用上述方法定义的各种博弈问题,寻求在各博弈方具有充分或者有限理性能力的问题,寻求在各博弈方具有充分或者有限理性能力的条件下,合理的策略选择和合理策略选择时博弈的结条件下,合理的策略选择和合理策略选择时博弈的结果,并分析这些结果的经济意义、效率意义的理论和果,并分析这些结果的经济意义、效率意义的理论和方法。方法。囚徒困境囚徒困境有2个涉嫌共同作案偷窃的嫌疑人A和B被带进警察局。假定警方对2名犯罪嫌疑人实行隔离关押,隔离审讯,每个犯罪嫌疑人都无法观察到对方的选择。有2个涉嫌共同作案偷窃的嫌疑人A和B被带进警察局。假定警方

7、对2名犯罪嫌疑人实行隔离关押,隔离审讯,每个犯罪嫌疑人都无法观察到对方的选择。警方怀疑他们作案,但并没有掌握他们作案的确凿证据,于是明确地分别告诉2名嫌疑人:对他们犯罪事实的认定及相应的量刑,完全取决于他们自己供认与否。如果一方与警方合作,坦白所做违法之事,而另一方抵赖,招认方将无罪释放,另一方则会被判重刑8年;如果双方都与警方合作共同招认,各被判刑5年;而如果双方均不认罪,因为警察找不到其他证明他们违法的证据,则判刑1年。他们面临的选择和带来的后果组合,可以用下面的表格来表示。A B 不坦白不坦白 坦白坦白不坦白不坦白A:判刑:判刑1年年B:判刑:判刑1年年A:无罪释放:无罪释放B:判刑:判

8、刑8年年坦白坦白A:判刑:判刑8年年B:无罪释放:无罪释放A:判刑:判刑5年年B:判刑:判刑5年年请问,请问,他们会选择什么呢?他们会选择什么呢?坦白坦白oror不坦白不坦白坦白坦白oror不坦白不坦白从上面的表中我们可以知道:每个嫌疑人都有两种可供从上面的表中我们可以知道:每个嫌疑人都有两种可供选择的策略:选择的策略:坦白不坦白。坦白不坦白。如果如果A选择抵赖,那么就可能会出现两种情况,如果选择抵赖,那么就可能会出现两种情况,如果B选择坦白,那么选择坦白,那么A将被加重惩罚,判刑将被加重惩罚,判刑8年,而年,而B则无则无罪释放;如果罪释放;如果B也同样选择抵赖,那么他们将判刑也同样选择抵赖,

9、那么他们将判刑1年。年。但是,因为警方没有把两名嫌疑人放在一间囚房里,但是,因为警方没有把两名嫌疑人放在一间囚房里,彼此不知道对方的想法,也无法串供,因而这种合作难彼此不知道对方的想法,也无法串供,因而这种合作难以顺利进行,使得选择合作的风险性大大增加。以顺利进行,使得选择合作的风险性大大增加。实际上,如果两人都抵赖,会无罪释放,显然这个实际上,如果两人都抵赖,会无罪释放,显然这个结果是最好的。但人的理性算计排除了这一结果。结果是最好的。但人的理性算计排除了这一结果。每个人从自己收益最大化的角度出发来考虑问题,每个人从自己收益最大化的角度出发来考虑问题,最终往往落得两败俱伤的结果。最终往往落得

10、两败俱伤的结果。因此,基于人是理性的这一前提,无论同伙是否坦白,因此,基于人是理性的这一前提,无论同伙是否坦白,自己坦白总是比不坦白好。两个人这样一算计,最好的自己坦白总是比不坦白好。两个人这样一算计,最好的结果都是选择坦白,各判刑结果都是选择坦白,各判刑5年。年。这个结果具有必然性,很难摆脱,因此这个博弈被称为这个结果具有必然性,很难摆脱,因此这个博弈被称为“囚徒的困境囚徒的困境”。每个人从自己收益每个人从自己收益最大化出发来考虑最大化出发来考虑问题,最终往往落问题,最终往往落得两败俱伤的结果。得两败俱伤的结果。个人的理性算计,个人的理性算计,往往导致集体的非往往导致集体的非理性结局。理性结

11、局。囚徒的困境对社会利益来说是非常理想的结果,因囚徒的困境对社会利益来说是非常理想的结果,因为罪犯受到了应有的惩罚为罪犯受到了应有的惩罚(坦白,坦白坦白,坦白)是囚徒困境的是囚徒困境的纳什均衡。什均衡。纳什均衡是什么呢?纳什均衡是什么呢?假假设有有n人参与博弈,每个人人参与博弈,每个人选择自己的最自己的最优战略,所有参与人略,所有参与人选择的的战略构成一个略构成一个战略略组合。合。纳什均衡是什均衡是这样一个一个战略略组合,合,这种种战略略组合由所有参与人的最合由所有参与人的最优战略略组成,也就成,也就是是说,给定定别人人战略的情况下,没有略的情况下,没有任何任何单个参与人有个参与人有积极性极性

12、选择其他策其他策略,从而没有任何人有略,从而没有任何人有积极性打破极性打破这种均衡种均衡纳什均衡是一种“僵局僵局”,给定别人不动的情况下,没有人有兴趣动这个故事最早是这个故事最早是1950年,数学家塔克任斯坦福大年,数学家塔克任斯坦福大学客座教授给心理学家作讲演时提出的。时至今学客座教授给心理学家作讲演时提出的。时至今日,这个故事广为流传,在哲学、伦理学、政治日,这个故事广为流传,在哲学、伦理学、政治学、经济学等学科中获得了极为广泛的应用。学、经济学等学科中获得了极为广泛的应用。rtgrQ囚徒困境的应用囚徒困境的应用 在荷兰召开了一次在荷兰召开了一次“合作及社会两难困境研讨会合作及社会两难困境

13、研讨会”,与会者都是博弈论的专家。当大会结束后,有两个学者,与会者都是博弈论的专家。当大会结束后,有两个学者,麦息克和路特提议大家玩一个游戏。麦息克和路特提议大家玩一个游戏。他们将一个大信封拿出来,请在场的他们将一个大信封拿出来,请在场的43位学者专家拿位学者专家拿出金钱装到这个信封里。如果到最后这个信封里的钱超过出金钱装到这个信封里。如果到最后这个信封里的钱超过250元,麦息克和路特将自己掏腰包,退还每人元,麦息克和路特将自己掏腰包,退还每人10元。不元。不过,如果信封内的钱不足过,如果信封内的钱不足250元,就统统没收,大家拿不元,就统统没收,大家拿不到半毛钱。到半毛钱。请问,你会出多少钱

14、呢?请问,你会出多少钱呢?每个人应该要放入的数目:每个人应该要放入的数目:250/43=5.81。如果每人放进去如果每人放进去7元钱,应该就可以超过目标元钱,应该就可以超过目标250元元了。等到最后退还了。等到最后退还10元钱时,每人都还可以净赚元钱时,每人都还可以净赚3元呢。元呢。不过,这游戏特别要求大家不准讨论,也不能偷看别人不过,这游戏特别要求大家不准讨论,也不能偷看别人把多少钱放进信封里。把多少钱放进信封里。最后,等到大信封传回来的时候,两位主持人打开最后,等到大信封传回来的时候,两位主持人打开一数,里面的钱总共是一数,里面的钱总共是245.59元,离目标元,离目标250元就差元就差那

15、么一点点。那么一点点。看到这种结果,这些学者们群情哗然,一副不敢看到这种结果,这些学者们群情哗然,一副不敢相信的样子。这种事情怎么可能发生?他们统统都相信的样子。这种事情怎么可能发生?他们统统都是德高望重的学者,而且才刚刚结束了两天的是德高望重的学者,而且才刚刚结束了两天的“合合作研讨会作研讨会”啊!他们的合作结果居然比目标还少了啊!他们的合作结果居然比目标还少了近近5元钱,这下子,大家统统拿不回来半毛钱了。元钱,这下子,大家统统拿不回来半毛钱了。有些人抱怨只要再多一个有良心的人放进去有些人抱怨只要再多一个有良心的人放进去7块钱就好了;块钱就好了;有些人后悔自己应该再多放一点点的;有些人后悔自

16、己应该再多放一点点的;更有一些人说:更有一些人说:“早知道这早知道这样,我宁可那时候放十几块样,我宁可那时候放十几块钱,最后让每个人有钱赚,钱,最后让每个人有钱赚,让主持人付账。让主持人付账。”但问题是:事先根本不可能有人真的奉献超过但问题是:事先根本不可能有人真的奉献超过10元,因元,因为我们都预期别人会拿出他们所该奉献的那部分。为我们都预期别人会拿出他们所该奉献的那部分。如果真是那样,那么我就没有必要比别人多出一点,如果真是那样,那么我就没有必要比别人多出一点,反正拿出来的部分就是浪费。反正拿出来的部分就是浪费。另一方面,如果我一另一方面,如果我一个人少付一点点,最个人少付一点点,最后也会

17、超过目标嘛,后也会超过目标嘛,让自己多赚一点点大让自己多赚一点点大概没啥关系吧。概没啥关系吧。如果每人都付如果每人都付7元,而你不付钱,你可以不冒风险就元,而你不付钱,你可以不冒风险就白白赚白白赚10元元如果别人没有付足够的钱,你也没付,最坏的如果别人没有付足够的钱,你也没付,最坏的情况只是赚不到钱,你并没有损失什么。情况只是赚不到钱,你并没有损失什么。因此你的优势策略因此你的优势策略就是:根本不要放就是:根本不要放进去半毛钱。进去半毛钱。每个人都基于这样想法的话,最后的结果总是令每个人都基于这样想法的话,最后的结果总是令人失望的。造成这种结果同样是因为每个人都预人失望的。造成这种结果同样是因

18、为每个人都预期别人会拿出他们的本该奉献的部分,而自己又期别人会拿出他们的本该奉献的部分,而自己又想尽可能地多想尽可能地多“捞捞”一点,因此才会产生每个人一点,因此才会产生每个人都那不回钱的结果。都那不回钱的结果。2.1.3 划线法划线法 求纳什均衡求纳什均衡1,01,30,10,40,22,0-5,-50,-8-8,0-1,-1囚囚徒徒困困境境-1,11,-11,-1-1,1猜猜硬硬币币2,10,00,01,3夫夫妻妻之之争争2.2.1 纳什均衡的定义纳什均衡的定义v策略空间:策略空间:v博弈方博弈方 的第的第 个策略:个策略:v博弈方博弈方 的得益:的得益:v博弈:博弈:纳什均衡纳什均衡:在

19、博弈:在博弈 中,如果由各个博弈中,如果由各个博弈方的各一个策略组成的某个策略组合方的各一个策略组成的某个策略组合 中,任一博弈中,任一博弈方方 的策略,都是对其余博弈方策略的组合的策略,都是对其余博弈方策略的组合 的最佳对策,也即的最佳对策,也即 对任意对任意 都成立,则称都成立,则称 为为 的一个纳什均衡的一个纳什均衡2.3 无限策略分析和反应函数无限策略分析和反应函数2.3.1 古古诺的寡的寡头模型模型2.3.2 反反应函数函数2.3.3 伯特伯特兰德寡德寡头模型模型2.3.4 公共公共资源源问题2.3.5 反反应函数的函数的问题和局限性和局限性寡头产量竞争寡头产量竞争以两厂商产量竞争为例以两厂商产量竞争为例222126qqqq-=古诺的寡头模型古诺的寡头模型4.5,4.55,3.753.75,54,4不突破突破厂商厂商2不突破 突破厂厂商商1以自身最大利益以自身最大利益为目目标:各生:各生产2单位位产量,各自得益量,各自得益为4以两厂商以两厂商总体利益最大:各生体利益最大:各生产1.5单位位产量,各自得益量,各自得益为4.5两寡头间的囚徒困境博弈两寡头间的囚徒困境博弈2.3.2 反应函数反应函数古诺模型的反应函数古诺模型的反应函数 划线法在无划线法在无限策略上的应用限策略上的应用(3,0)(6,0)(0,3)(0,6)古诺模型的反应函数图示理性局限和古诺调整

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com