动态博弈与承诺.ppt-得力文库

资源描述

《动态博弈与承诺.ppt》由会员分享，可在线阅读，更多相关《动态博弈与承诺.ppt（40页珍藏版）》请在得力文库 - 分享文档赚钱的网站上搜索。

1、动态博弈与承诺现在学习的是第1页，共40页动态博弈行动有先后顺序，不同的参与人在不同时点行动，先行动者的选择影响后行动者的选择空间，后行动者可以观察到先行动者做了什么选择，因此，为了做出最优的行动选择，每个参与人都必须这样思考问题：如果我如此选择，对方将如何应对？如果我是他，我将会如何行动？给定他的应对，什么是我的最优选择？如下棋现在学习的是第2页，共40页博弈树（game tree)ABB进入不进入进入不进入进入不进入(-1,-1)(1, 0)(0, 1)(0, 0)现在学习的是第3页，共40页动态博弈中的战略战略是一个完备的行动计划：在博弈开始之前就规定出每一个决策点上的选择，即使这

2、个决策点实际上不会出现。考虑老师与学生之间考试之后的一个博弈：老师先行动（判分），学生后行动（在不同分数下如何应对）。假定学生的实际成绩是不及格。现在学习的是第4页，共40页战略表式下的纳什均衡及格不及格老师学生A，FF，AA，AF，F-1，1-10，-10-1，1-10，-10-10，-101，-11，-1-10，-10现在学习的是第5页，共40页三个纳什均衡（及格；A，F）；（不及格；F，A）；（不及格；A，A）问题：哪一个会出现呢？现在学习的是第6页，共40页不可置信的威胁(noncredible threat) 在（及格；A，F）和（不及格；F，A）中，学生“报复（F）”的威胁是

3、不可信的：无论老师判“及格”还是“不及格”，“报复”不是学生的最优选择；事前（ex ante)和事后(ex post)：一种战略所规定的行动在事前看来是最优的，但事后看并不是当事人的最优选择，这种行动就不可置信，该战略就不是一个合理的战略。现在学习的是第7页，共40页精炼纳什均衡（perfect NE)不包含不可置信的行动的战略所组成的纳什均衡被称为“精炼纳什均衡”；也就是说，不论过去发生了什么，构成精炼纳什均衡的战略，其所规定的行动在每一个决策点上都是最优的。所以，又称为“序惯均衡”(sequential equilibrium);首先必须是“纳什均衡”，但并非所有纳什均衡都是合理的；只有

4、其战略不包含不可置信行动的纳什均衡才是合理的。现在学习的是第8页，共40页子博弈（subgame) 由原博弈中某个决策点（信息集）开始的部分构成一个子博弈。12323原博弈子博弈I子博弈II现在学习的是第9页，共40页子博弈精炼纳什均衡精炼纳什均衡：（1）在原博弈是一个纳什均衡；（2）在每一个子博弈上都是纳什均衡。考试博弈：（及格；A，F）在第二个子博弈上不构成纳什均衡；（不及格；F，A）在第一个子博弈不构成纳什均衡；（不及格；A，A）在所有子博弈上都构成纳什均衡。现在学习的是第10页，共40页老师学生学生及格不及格报复接受报复接受(-10,-10)(-1, 1)(-10, -10)

5、(1, -1)考试博弈考试博弈现在学习的是第11页，共40页逆向归纳法(backward induction) 在有限博弈中，我们可以用逆向归纳法求解精炼纳什均衡：从最后一个决策点开始，找出该子博弈的纳什均衡；然后再倒回到倒数第二个决策点，找出决策者的最优决策（假定最后一个决策者的决策是最有的；如此一直到初始决策点，所有子博弈上的最优选择就是精炼纳什均衡。又称“rollback”.现在学习的是第12页，共40页举例121（2，0）（5，0）（4，2）（1，1）UDRLUD现在学习的是第13页，共40页均衡路径与非均衡路径精炼纳什均衡下所经过的决策点和最优选择构成的路径，称为均衡路径（equi

6、librium path); 其他的路径是非均衡路径（off-equilibrium path); 均衡结果依赖于非均衡路径上的选择：1只所以一开始就选择U，是因为他预期如果选择D的话，2将选择L；而2只所以选择L，是因为她预期如果选择R的话，1将选择U。现在学习的是第14页，共40页精炼均衡与理性共识逆向归纳的过程实际上就是重复剔除劣战略的过程，其前提是博弈规则和理性共识：每个人是理性的，每个人知道每个人是理性的，如此等等。因此，精炼纳什均衡的合理性取决于理性共识的合理性。后面再讨论。现在学习的是第15页，共40页先动优势与后动优势在动态博弈中，行动总有先后顺序。有些博弈具有先动优势(

7、first-mover advantage),但有些博弈具有后动优势(second-mover advantage). 让产量竞争具有先动优势，而价格竞争可能是后动优势；开会发言？在不完全信息下，顺序更重要。但有些博弈既没有先动优势，也没有后动优势，如抓阄。现在学习的是第16页，共40页练习：数30博弈数30游戏：两个人，交替选择数字，每次只能选择一个或两个数字。每次可以选择1-3个数字呢？现在学习的是第17页，共40页不可置信威胁精炼纳什均衡剔除了不可置信的威胁，使得我们可以更合理地对博弈中参与人行为的预测；不可置信威胁的根源是事前最优与事后最优不同，导致许多帕累托效率无法实现；劫

8、机事件为什么会发生？管教孩子为什么困难？家族企业为什么难以实行制度化管理？大企业为什么效率低？（TBTF）研究学录取中的问题；现在学习的是第18页，共40页承诺承诺是将不可置信的威胁变成可置信的威胁的行动：威胁不仅是事前最优的，也是事后最优的。承诺意味着限制自己的自由：选择少反而对自己好。如“破釜沉舟”的故事。围城战略。现在学习的是第19页，共40页举例：如果1承诺不选择U121（2，0）（5，0）（4，2）（1，1）UDRLUD现在学习的是第20页，共40页承诺举例婚姻中的承诺：彩礼、昂贵的婚礼可以理解为一种对婚姻的承诺；订金、抵押物做为对交易的承诺； “安营扎寨”；固定资产投

9、资可以作为承诺；所有权的承诺作用；现在学习的是第21页，共40页最惠条款生产耐用品的企业经常被“降价预期”所困扰：如果消费者预期企业将降价，他们将会等待，结果，企业只能降价。如汽车行业面临的问题；最惠条款可以起到承诺的作用：企业不会降价了。现在学习的是第22页，共40页例子产量价格收入1234100804030100160120120假定企业一开始定价80，如果前两个消费者购买了，企业将有积极性在50的价格下向第三个顾客出售。预期到这一点，前两个顾客将不会购买。如果企业向保证，任何降价的差额将返还顾客，前两个顾客将会购买。因为企业事实上不会降价了。现在学习的是第23页，共40页大学改革：

10、不升即走(up-or-out) 没有这样的制度，人才就可能得不到公正评价； “不升即走”是大学对教员的承诺：不会压制优秀人才。现在学习的是第24页，共40页Up-or-out 博弈教员学校学校努力不努力提升不提升提升不提升(4, 4)(1, 7)(3, 3)(2, 4）(4, 4)(x, 0)(3, 3)(y, 0)老制度新制度现在学习的是第25页，共40页画家和政府的苦恼名画的价值取决于数量，画家常为无法承诺而苦恼：谁相信他不会再画呢？这可能是为什么死了画家的画最值钱。政府也有类似的问题。政府经常缺乏承诺：给定投资者进入的情况下，多征税是最优的；但投资者预期到这一点，将不愿意进入。中国许

11、多地方支付有严重的机会主义行为。“坦白从宽，抗拒从严”面临的问题也如此。现在学习的是第26页，共40页作为承诺的法律法律改变事后的选择空间或选择成本，所以可以起到承诺的作用；合同的承诺作用（违约的成本增加，使得遵守合同更可能是事后最优的选择）；刑法：为什么不能商量？为什么对严重犯罪要执行死刑？台湾问题：立法还是政府随机应变？ “法治”(rule of law)是政府的承诺；现在学习的是第27页，共40页有限政府（limited government) 市场要求有限政府：政府不仅要保护个人的基本权利不受其他人的侵犯，而且要把尊重这些权利作为对政府行为的限制。如果政府的自由裁量权过大，政府官

12、员为所欲为，政府本身会受到损害；这里的关键是：老百姓与政府之间的博弈。现在学习的是第28页，共40页光荣革命与英国政府的财政年份总收入总支出总国债 1668-16881.9 2.1 2.0 1695 4.1 6.2 8.4 1697 3.3 7.9 16.7 1720 6.3 5.6 54.0 1770 11.4 10.5130.6 1780 12.5 22.6167.2 1790 17.0 16.8244.0现在学习的是第29页，共40页0 02 24 46 68 81010121214141616181816201620163016301645164516601660167016

13、70168016801691169116971697现在学习的是第30页，共40页主权债模型LDGLLHRP(a)P(a)现在学习的是第31页，共40页政府的举债能力假定政府借D的债务，利息率是r，贷款人对政府所能实施的最大可信惩罚是P，那么，如果D(1+r)P(a),政府将还钱，否则政府将不还钱。所以政府的举债能力为DP(a)/(1+r) 英国光荣革命通过制度变迁(改变a）提高了国王违约时面临的最大可能惩罚P(a)现在学习的是第32页，共40页英国光荣革命光荣革命前，国王可以随意单方面修改借款条款，拖延甚至拒绝支付；利用外国商人瓦解债权人之间的联盟；所以债权人不愿意向政府贷款；光荣革命后：

14、决定国债的权力在议会，议会主要由潜在债权人组成，可以推翻国王；BANK OF ENGLAND统一协调债权的行动，通过优先权的规定限制了政府“离间”债权人的可能。因为对违约的惩罚变大了，政府举债的能力提高了。现在学习的是第33页，共40页逆向归纳的问题：ABBDUDUDU(2,-1)(1,2)(4, 1)(3，4)(6，3)ADU现在学习的是第34页，共40页Counterfactual Problem 犯错误的可能（trembling hand); 参与人是非理性的（automation assumption)；假装非理性；理性非共识现在学习的是第35页，共40页人们为什么会受骗？如房地

15、产；政治运动；现在学习的是第36页，共40页The ultimatum game 两人之间分配一笔钱，其中一个人提出方案，另一个人可以接受，也可以拒绝；如果接受，每人得到方案规定的份额；如果拒绝，没有人得到任何东西。什么是这个博弈的精练纳什均衡？实验结果：现在学习的是第37页，共40页1.同班同学总数给对方最低接受 10 4.9 3.39 100 48.17 35.64 1000 463.08 363.45 10000 4537.43 3595.13 现在学习的是第38页，共40页 2北京大学同学总数给对方最低接受10 4.57 3.74 100 43.26 37.72 1000 409.26 370.17 10000 3880.78 3539.68 现在学习的是第39页，共40页 3.陌生人总数给对方最低接受 10 4.09 4.05 100 35.41 35.04 1000 343.11 342.67 10000 3134.37 3127.78 现在学习的是第40页，共40页

展开阅读全文