动态博弈与重复博弈.ppt-得力文库

资源描述

《动态博弈与重复博弈.ppt》由会员分享，可在线阅读，更多相关《动态博弈与重复博弈.ppt（26页珍藏版）》请在得力文库 - 分享文档赚钱的网站上搜索。

1、第四章重复博弈本章介绍基本博弈重复进行构成的重复博弈。虽然形式上是基本博弈的重复进行，但重复博弈中博弈方的行为和博弈结果却不一定是基本博弈的简单重复，因为博弈方对于博弈会重复进行的意识，会使他们对利益的判断发生变化，从而使他们在重复博弈过程中的行为选择受到影响。这意味着不能把重复博弈当作基本博弈的简单叠加，必须把整个重复博弈过程作为整体进行研究。本章分三节4.1 重复博弈引论4.2 有限次重复博弈4.3 无限次重复博弈4.1 重复博弈引论4.1.1 为何研究重复博弈4.1.2 基本概念4.1.1 为何研究重复博弈n 经济中的长期关系n 人们的预见性n 未来利益对当前行为的制约n 长期合同、

2、回头客、长客和一次性买卖的区别n 有无确定的结束时间4.1.2 基本概念n 有限次重复博弈：给定一个基本博弈G（可以是静态博弈，也可以是动态博弈），重复进行T次G，并且在每次重复G之前各博弈方都能观察到以前博弈的结果，这样的博弈过程称为“G的T次重复博弈”，记为G(T)。而G则称为G(T)的“原博弈”。G(T)中的每次重复称为G(T)的一个“阶段”。n 无限次重复博弈：一个基本博弈G一直重复博弈下去的博弈，记为G()n 策略：博弈方在每个阶段针对每种情况如何行为的计划n 子博弈：从某个阶段（不包括第一阶段）开始，包括此后所有的重复博弈部分n 均衡路径：由每个阶段博弈方的行为组合串联而成重复博弈

3、的得益4.2 有限次重复博弈4.2.1 两人零和博弈的有限次重复博弈4.2.2唯一纯策略纳什均衡博弈的有限次重复博弈4.2.3多个纯策略纳什均衡博弈的有限次重复博弈4.2.4 有限次重复博弈的民间定理4.2.1 两人零和博弈的有限次重复博弈n 零和博弈是严格竞争的，重复博弈并不改变这一点。n 以零和博弈为原博弈的有限次重复博弈与猜硬币博弈的有限次重复博弈一样，博弈方的正确策略是重复一次性博弈中的纳什均衡策略。唯一纯策略纳什均衡博弈的有限次重复博弈n 定理：设原博弈G有唯一的纯策略纳什均衡,则对任意整数T，重复博弈 G(T)有唯一的子博弈完美纳什均衡，即各博弈方每个阶段都采用G的纳什均衡

4、策略。各博弈方在G(T)中的总得益为在G中得益的T倍，平均得益的与原博弈G中的得益。-5，-5 0，-8-8，0-1，-1坦白不坦白囚徒2坦白不坦白囚徒1（-5，-5）-10，-10-13，-5-5，-13-6，-6坦白不坦白囚徒2坦白不坦白囚徒1（-10，-10）有限次重复削价竞争博弈100，100 20，150150，20 70，70高价低价高价低价寡头 2寡头1削价竞争博弈有唯一纯策略纳什均衡（70，70）有限次重复的结果仍然是（低价，低价）多个纯策略纳什均衡博弈的有限次重复博弈5，53，32，00，22，06，00，2 0，61，1HMH厂商2M L厂商1L三价博弈2，

5、2 3，1 3，11，3 4，4 7，11，3 1，7 8，8厂商1厂商2LMHH M L两次重复三价博弈的等价模型触发策略：两博弈方先试探合作，一旦发现对方不合作则也用不合作报复博弈方1：第一次选h；如第一次结果为(H,H)，则第二次选M，否则选L博弈方2：同博弈方1两市场博弈的重复博弈（重复两次）n(A,B)+(A,B)OR(B,A)+(B,A)(1,4)(4,1)n 连续两次采用混合策略(2,2)n(A,B)+(B,A)OR(B,A)+(A,B)(2.2,2.5)轮换策略n 一次纯策略+一次混合策略(1.5,3)(3,1.5)0，0 4，11，3 3，3厂商1厂商2BAA B两市场博弈重

6、复博弈不同策略、均衡及一次性博弈得益比较n 不同策略组合、均衡得益图示厂商2得益厂商1得益(1,4)(3,3)(2.5,2.5)(2,2)(3,1.5)(4,1)(1.5,3)4.2.4 有限次重复博弈的民间定理n 个体理性得益：不管其它博弈方的行为如何，一博弈方在某个博弈中只要自己采取某种特定的策略，最低限度保证能获得的得益n 可实现得益：博弈中所有纯策略组合得益的加权平均数组n 定理：设原博弈的一次性博弈有均衡得益数组优于w，那么在该博弈的多次重复中所有不小于个体理性得益的可实现得益，都至少有一个子博弈完美纳什均衡的极限的平均得益来实现它们厂商2得益厂商1得益(1,4)(3,3)(1，1)

7、(4,1)w=(1.1)4.3 无限次重复博弈4.3.1 两人零和博弈的无限次重复博弈4.3.2 唯一纯策略纳什均衡博弈的无限次重复博弈4.3.3 无限次重复古诺模型4.3.4 有效工资率4.3.1 两人零和博弈的无限次重复博弈n 两人零和博弈无限次重复的所有阶段都不可能发生合作，博弈方会一直重复原博弈的混合策略纳什均衡4.3.2唯一纯策略纳什均衡博弈的无限次重复博弈两寡头削价竞争博弈该博弈一次性博弈均衡是都采用低价，是囚徒困境型博弈4，4 0，55，0 1，1H LHL无限次重复两寡头削价博弈触发策略：第一阶段采用H，如果前t-1阶段的结果都是(H,H)，则继续采用H，否则采用L。如

8、果博弈方2采用L，总得益现值为如果博弈方2采用H，总得益现值为因此当时，此触发策略纳什均衡策略两寡头削价竞争无限次重复博弈的民间定理厂商2得益厂商1得益(1,4)(3,3)(1,1)(4,1)(5,0)(5,0)4.3.3 无限次重复古诺模型假定：，边际成本都为2。在无限次重复古诺模型中，当贴现率满足一定条件时，两厂商采用下列触发策略构成一个子博弈完美纳什均衡：在第一阶段生产垄断产量的一半1.5；在第 t 阶段，如果前 t-1 阶段结果都是(1.5,1.5)，则继续生产1.5，否则生产古诺产量2。设厂商1已采用该触发策略，若厂商2也采用该触发策略，则每期得益4.5，无限次重复博弈总得

9、益的现值为：如果厂商2偏离上述触发策略，则他在第一阶段所选产量应为给定厂商1产量为1.5时，自己的最大利润产量，即满足：解得，此时利润为5.0625，高于触发策略第一阶段得益4.5。但从第二阶段开始，厂商1将报复性地永远采用古诺产量2，这样厂商2也被迫永远采用古诺产量，从此得利润4。因此，无限次重复博弈第一阶段偏离的情况下总得益的现值为：当上述策略是厂商2对厂商1的同样触发策略的最佳反应，否则偏离是最佳反应。4.3.4 有效工资率模型设定：首先厂商选择工资率为，然后工人选择接受或拒绝。如果拒绝，则他作个体户得到收入小于，如果接受，则工人选择努力工作（负效用）还是偷懒（无负效用）。厂商只能看

10、到产量高低，高产量为，低产量0。工人努力工作时一定是高产量，不努力时却并不一定是0，而是高产量的概率为，低产量0的概率为。工人努力工作时，厂商得益为，工人得益为；工人偷懒时，厂商期望得益为，工人得益为。考虑如下的触发策略：厂商在第一阶段给工资率，在第t阶段，如果前面t-1阶段结果都是则继续给，否则从此永远是。工人的策略是如果则接受，否则宁愿作个体户得到，并在以前各期结果都是和当前工资率为时努力工作，否则偷懒。设厂商已采用上述触发策略。由于，工人接受工作是最佳反应。用记工人努力工作时无限次重复博弈得益的现值，则即用记工人选偷懒时无限重复博弈得益的现值，则：即因此当即时，努力是工人的最佳选择。反过来，设工人已采用上述触发策略。若厂商给的工资率满足上式条件，并且威胁一旦产量降低就解雇工人，则各阶段的得益为，无限次重复博弈得益现值为。若不愿给，则解雇工人，以后得益为0。因此只要，厂商选择前述触发策略就是最佳反应。综上所述，在满足的条件下，双方的触发策略构成一个纳什均衡。而上述两式实际上意味着即工人努力的产出扣除努力负效用后的剩余，必须不小于工人作个体户的收入即机会成本，加上一定比例的取决于努力负效用、贴现系数和偷懒可能得高产量概率的附加部分。最后这个不等式正是存在有效工资率，工作激励有效的基本条件。

展开阅读全文