博弈理论专题.ppt

上传人:石*** 文档编号:38708738 上传时间:2022-09-05 格式:PPT 页数:61 大小:3.56MB
返回 下载 相关 举报
博弈理论专题.ppt_第1页
第1页 / 共61页
博弈理论专题.ppt_第2页
第2页 / 共61页
点击查看更多>>
资源描述

《博弈理论专题.ppt》由会员分享,可在线阅读,更多相关《博弈理论专题.ppt(61页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、博弈理论专题博弈理论专题现在学习的是第1页,共61页v 第一节第一节 零和博弈和非零和博弈零和博弈和非零和博弈v 第二节第二节 相关均衡相关均衡v 第三节第三节 重复博弈重复博弈v 第四节第四节 消耗战博弈消耗战博弈v 第五节第五节 抢先博弈抢先博弈现在学习的是第2页,共61页第一节第一节 零和博弈和非零和博弈零和博弈和非零和博弈v 在零和博弈(在零和博弈(Zero-Sum Game)中,博弈一方获益必然意味)中,博弈一方获益必然意味着博弈另一方的损失,博弈各方的收益和损失相加总和永远为着博弈另一方的损失,博弈各方的收益和损失相加总和永远为“零零”。v 赌博是典型的零和博弈。赌博是典型的零和博

2、弈。v 与零和博弈不同,在非零和博弈(与零和博弈不同,在非零和博弈(Non-Zero-Sum Game)中博)中博弈各方的收益总和不是零。弈各方的收益总和不是零。v 博弈一方的收益并不建立在博弈另一方损失的基础上。博弈双博弈一方的收益并不建立在博弈另一方损失的基础上。博弈双方有可能达到方有可能达到“双赢双赢”的结果。的结果。现在学习的是第3页,共61页v 国际贸易早期的重商主义理论认为:国际贸易是零和博弈。国际贸易早期的重商主义理论认为:国际贸易是零和博弈。v 贸易顺差国家的福利水平增长建立在贸易逆差国家福利水平下降的基础贸易顺差国家的福利水平增长建立在贸易逆差国家福利水平下降的基础上。因此,

3、重商主义者认为一个国家应该尽可能的多出口、少进口。上。因此,重商主义者认为一个国家应该尽可能的多出口、少进口。v 亚当亚当 斯密(斯密(Adam Smith)指出:财富来自生产领域而非流通领域,)指出:财富来自生产领域而非流通领域,基于两国生产技术绝对差异的国际贸易是双赢的,能提高贸易参与国双基于两国生产技术绝对差异的国际贸易是双赢的,能提高贸易参与国双方的福利水平。方的福利水平。v 因此,政府没有必要干预国际贸易,应该实行自由贸易政策。不管是逆因此,政府没有必要干预国际贸易,应该实行自由贸易政策。不管是逆差国家还是顺差国家,都能从国家贸易中受益。差国家还是顺差国家,都能从国家贸易中受益。现在

4、学习的是第4页,共61页零和博弈和非零和博弈示意图现在学习的是第5页,共61页第二节第二节 相关均衡相关均衡v 相关均衡(相关均衡(Correlated Equilibrium)的概念首先由经济学家罗伯)的概念首先由经济学家罗伯特特 奥曼(奥曼(Robert Aumann)提出。)提出。v 在他发表于在他发表于 1974 年的文章中,奥曼指出:在相关均衡中,博弈参与年的文章中,奥曼指出:在相关均衡中,博弈参与者得到的收益可能高于混合策略纳什均衡。者得到的收益可能高于混合策略纳什均衡。v 例如:考虑如下完全信息静态博弈例如:考虑如下完全信息静态博弈参与者2策略U策略V参与者1策略L(6,6)(2

5、,7)策略R(7,2)(0,0)现在学习的是第6页,共61页v 在上表所示的完全信息动态博弈中,存在纯策略纳什均衡和混合策略纳什在上表所示的完全信息动态博弈中,存在纯策略纳什均衡和混合策略纳什均衡。均衡。v 根据根据“划横线法划横线法”,博弈的两个纯策略纳什均衡:(,博弈的两个纯策略纳什均衡:(L,V)和()和(R,U)。)。v 博弈还存在一个混合策略纳什均衡。博弈还存在一个混合策略纳什均衡。v 可以证明:在混合策略纳什均衡中:可以证明:在混合策略纳什均衡中:n参与者 1 选择策略 L 的概率为 p = 2/3;n参与者 2 选择策略 U 的概率为 q = 2/3;n参与者 1 选择策略 L

6、或策略 R 均能得到收益 14/3;n参与者 2 选择策略 U 或策略 V 均能得到收益 14/3。 现在学习的是第7页,共61页相关均衡相关均衡v 设计了这样的机制:考虑一个外生随机变量设计了这样的机制:考虑一个外生随机变量 X,该随机变量,该随机变量 X 可能的取可能的取值为值为1、2、3,且,且 P(X = 1) = P(X = 2) = P(X = 3) = 1/3v 当随机变量实现取值后:当随机变量实现取值后:n博弈参与者 1 会得到的信息是:X 是否取值是 1。n博弈参与者 2 会得到的信息是:X 是否取值是 2。v 当随机变量当随机变量 的取值实现后:的取值实现后:n如果参与者

7、1 被告知随机变量 X 的值为 1,那么参与者 1 选择策略 R;n如果参与者 1 被告知随机变量 X 的值不为 1,那么参与者 1 选择策略 L。n如果参与者 2 被告知随机变量 X 的值为 3,那么参与者 2 选择策略 V;n如果参与者 2 被告知随机变量 X 的值不为 3,那么参与者 2 选择策略 U。现在学习的是第8页,共61页v 在这种机制下,参与者在这种机制下,参与者 1 和参与者和参与者 2 的策略决策不再完全独立。的策略决策不再完全独立。v 参与者参与者 1 和参与者和参与者 2 的决策均和随机变量的决策均和随机变量 X 的取值相关。的取值相关。v 也就是说:参与者也就是说:参

8、与者 1 和参与者和参与者 2 的策略选择是的策略选择是“相关相关”的。这种情况下的均衡的。这种情况下的均衡称为称为“相关均衡相关均衡”。 X 的取值参与者1的策略参与者2的策略博弈均衡参与者1的收益参与者2的收益1RU(R,U)722LU(L,U)663LV(L,V)27随机变量 X 不同取值情况下的博弈均衡现在学习的是第9页,共61页v 由于由于 P(X = 1) = P(X = 2) = P(X = 3) = 1/3v 博弈参与者博弈参与者 1 的预期收益的预期收益 5v 博弈参与者博弈参与者 2 的预期收益的预期收益 5v 在相关均衡下,两名博弈参与者的收益均为在相关均衡下,两名博弈参

9、与者的收益均为 5。v 在混合策略纳什均衡中,博弈双方的收益均为在混合策略纳什均衡中,博弈双方的收益均为 14/3。v 因此,在相关均衡中,两名博弈参与者的收益均高于混合策略纳什均衡因此,在相关均衡中,两名博弈参与者的收益均高于混合策略纳什均衡的收益。的收益。v 在混合策略纳什均衡中,各博弈参与者按照一定的概率分布随机选择自己的策在混合策略纳什均衡中,各博弈参与者按照一定的概率分布随机选择自己的策略。然而在相关博弈中,博弈参与者并不是随机选择自己的策略,而是根据随略。然而在相关博弈中,博弈参与者并不是随机选择自己的策略,而是根据随机变量机变量 X 的取值进行策略选择。的取值进行策略选择。现在学

10、习的是第10页,共61页性别博弈与相关均衡性别博弈与相关均衡v 根据根据“划横线法划横线法”,可以博弈的两个纯策略纳什均衡:(看足球,看足球)和,可以博弈的两个纯策略纳什均衡:(看足球,看足球)和(听昆曲,听昆曲)。(听昆曲,听昆曲)。v 博弈还存在一个混合策略纳什均衡。博弈还存在一个混合策略纳什均衡。女方看足球听昆曲男方看足球(2,1)(0,0)听昆曲(0,0)(1,2)性别博弈的支付矩阵现在学习的是第11页,共61页v 可以证明:在混合策略纳什均衡中:可以证明:在混合策略纳什均衡中:n男方选择“看足球”的概率为 p = 2/3;n女方选择“看足球”的概率为 q = 2/3;n男方选择策略“

11、看足球”或“听昆曲”均能得到收益 2/3;n女方选择策略“看足球”或“听昆曲”均能得到收益 2/3。 v 考虑这样的机制设计考虑这样的机制设计n每到周末,这对男女朋友通过扔一个均匀硬币来决定各自的策略。n如果硬币正面朝上,男方选择“看足球”,女方选择“看足球”。n如果硬币反面朝上,男方选择“听昆曲”,女方选择“听昆曲”。现在学习的是第12页,共61页v 在相关均衡下,两名博弈参与者的收益均为在相关均衡下,两名博弈参与者的收益均为 3/2。v 在混合策略纳什均衡中,博弈双方的收益均为在混合策略纳什均衡中,博弈双方的收益均为 2/3。v 在相关均衡中,两名博弈参与者的收益均高于混合策略纳什均衡的收

12、益。在相关均衡中,两名博弈参与者的收益均高于混合策略纳什均衡的收益。v从直观上说,在性别博弈中,相关均衡的推理过程和思维模式比混合策略纳什均衡的推理从直观上说,在性别博弈中,相关均衡的推理过程和思维模式比混合策略纳什均衡的推理过程和思维模式更符合人们的习惯过程和思维模式更符合人们的习惯硬币朝向男方策略女方策略博弈均衡男方收益女方收益正面朝上看足球看足球(看足球,看足球)21反面朝上听昆曲听昆曲(听昆曲,听昆曲)12现在学习的是第13页,共61页专栏:罗伯特专栏:罗伯特 奥曼简介奥曼简介v 罗伯特罗伯特 奥曼(奥曼(Robert Aumann)1930 年出生于德国法兰克福,犹太人。年出生于德国

13、法兰克福,犹太人。v 1938 年随家人迁往美国纽约,幸运的躲过了纳粹对犹太人的残酷迫害。年随家人迁往美国纽约,幸运的躲过了纳粹对犹太人的残酷迫害。v 奥曼奥曼 1950 年获得纽约城市学院数学学士学位,年获得纽约城市学院数学学士学位,1955 年获得麻省理工学年获得麻省理工学院纯数学博士学位,其博士论文研究的是代数拓扑学中的纽结理论院纯数学博士学位,其博士论文研究的是代数拓扑学中的纽结理论(Knot Theory)。)。v 1956 年,奥曼进入以色列耶路撒冷希伯莱大学任教至今。年,奥曼进入以色列耶路撒冷希伯莱大学任教至今。现在学习的是第14页,共61页v 现任耶路撒冷希伯来大学理性分析中心

14、教授、纽约州立大学斯坦尼分校经济现任耶路撒冷希伯来大学理性分析中心教授、纽约州立大学斯坦尼分校经济系和决策科学院教授、以色列数学俱乐部主席、美国经济联合会荣誉会员等。系和决策科学院教授、以色列数学俱乐部主席、美国经济联合会荣誉会员等。v 他还担任他还担任国际对策论杂志国际对策论杂志、数理经济学杂志数理经济学杂志、经济学理论杂志经济学理论杂志、运筹学数学运筹学数学等多家专业杂志社的编辑。等多家专业杂志社的编辑。v 奥曼第一个提出了博弈论中奥曼第一个提出了博弈论中“相关均衡相关均衡”的概念。的概念。v 在非合作博弈中,相关均衡比传统的纳什均衡更具灵活性。在非合作博弈中,相关均衡比传统的纳什均衡更具

15、灵活性。v 奥曼在奥曼在“重复博弈重复博弈”研究领域也做出了杰出贡献。研究领域也做出了杰出贡献。v 奥曼第一个系统性定义了博弈中的奥曼第一个系统性定义了博弈中的“共同知识共同知识”。现在学习的是第15页,共61页v 奥曼使用博弈论分析犹太法典中的奥曼使用博弈论分析犹太法典中的“塔木德难题塔木德难题”,解决了长期悬而,解决了长期悬而未决的遗产分割问题未决的遗产分割问题 。v 奥曼把这篇文章献给了他在战场上死去的儿子萨蒙奥曼把这篇文章献给了他在战场上死去的儿子萨蒙 (Shlomo)。)。v 由于在博弈论领域的突出贡献,奥曼和美国经济学家托马斯由于在博弈论领域的突出贡献,奥曼和美国经济学家托马斯 谢

16、林谢林(Thomas Schelling)分享了)分享了 2005 年诺贝尔经济学奖。年诺贝尔经济学奖。现在学习的是第16页,共61页专栏:专栏:“塔木德难题塔木德难题”及奥曼的解决方案及奥曼的解决方案v 塔木德塔木德是一部犹太教经典著作,地位仅次于是一部犹太教经典著作,地位仅次于圣经圣经,是犹太教口传律,是犹太教口传律法汇编。创作于法汇编。创作于 2 世纪至世纪至 6 世纪。整书反映世纪。整书反映 7 世纪前犹太教的宗教信仰、世纪前犹太教的宗教信仰、口传律法、伦理规范和社团生活的历史发展。口传律法、伦理规范和社团生活的历史发展。v 在在塔木德塔木德 妇女部妇女部 婚书卷婚书卷里记载了这样一个

17、财产分配的故事。里记载了这样一个财产分配的故事。v “犹太教规定:一个人死后,他的妻妾有权继承他的财产。犹太教规定:一个人死后,他的妻妾有权继承他的财产。n假设一个人有三个伴侣:分别是妻子、妾和婢女 。n如果这个人的遗产超过 600 金。那么妻子有权要求继承 300 金,妾有权要求得到 200 金,婢女有权要求得到 100 金。n如果这个人的财产不足600金,怎样将有限的财产在妻子、妾和婢女之间分配呢?现在学习的是第17页,共61页v 犹太教规定的分配方案如上表所示犹太教规定的分配方案如上表所示遗产数目(金)妻子妾婢女10033.333.333.320075755030015010050600

18、300200100犹太教遗产分配方案现在学习的是第18页,共61页v 按照惯常的思维方式:按照惯常的思维方式:n当遗产超过 600 金时,妻子可分得 300 金,妾得到 200 金,婢女得到100 金。说明妻子、妾和婢女在继承遗产上享有的权利比例为:3:2:1。n那么当遗产不足 600 金时,妻子应得遗产的 3/6;妾应得遗产的 2/6;婢女应得遗产的 1/6。但是塔木德中的分配方案与此直观逻辑不符。v 怎样解释怎样解释塔木德塔木德中这个与直觉看似相悖的遗产分配方案,成为几千年来学中这个与直觉看似相悖的遗产分配方案,成为几千年来学者们十分疑惑的问题。者们十分疑惑的问题。v 通常将此问题称为通常

19、将此问题称为“塔木德难题塔木德难题”。现在学习的是第19页,共61页v 奥曼通过对奥曼通过对塔木德塔木德的深入阅读,利用现代博弈理论完美的解决了的深入阅读,利用现代博弈理论完美的解决了困扰了学者们多年的困扰了学者们多年的“塔木德塔木德”难题。难题。v 奥曼在奥曼在塔木德塔木德 损害部损害部 中门卷中门卷中找到了这样一个故事:中找到了这样一个故事:n“甲、乙两个人共同抓着一件大衣来到法官面前。n如果甲、乙二人都宣称自己拥有这件大衣的全部所有权,那么甲乙两人分别得到这件大衣的二分之一。n如果甲宣称自己拥有这件大衣的全部所有权、乙宣称自己拥有这件大衣的二分之一所有权,那么法官将宣判给甲大衣所有权的四

20、分之三,给乙大衣所有权的四分之一”。现在学习的是第20页,共61页v 根据这个故事,奥曼仔细思索了古代犹太律法原则后,总结出了古代犹太律根据这个故事,奥曼仔细思索了古代犹太律法原则后,总结出了古代犹太律法的三个原则:法的三个原则:n第一:仅分割具有争议的财产。对没有争议的财产不予分割。n第二:宣称拥有更多财产权力的一方最终得到的收益不少于宣称拥有较少财产权力的一方。n第三:对有争议财产进行分配时,当财产诉求者超过两人时,将所有提出财产诉求者按其诉求金额排序。最小者自成一组,剩下所有诉求者组成另一组,争议财产在两组间公平分配。v 根据这样的分配原则,可以解释对争执大衣的分配原则。根据这样的分配原

21、则,可以解释对争执大衣的分配原则。现在学习的是第21页,共61页v 明确了明确了“大衣分配原则大衣分配原则”后,即可将这种思路应用于解决后,即可将这种思路应用于解决“塔木德难塔木德难题题”。v 在在“塔木德难题塔木德难题”中,如果遗产仅有中,如果遗产仅有 100 金,由于妻子、妾和婢女金,由于妻子、妾和婢女都宣称有权力得到这都宣称有权力得到这 100 金。因此,将这金。因此,将这 100 金平均分配。妻子、金平均分配。妻子、妾和婢女均得到妾和婢女均得到 33.3 金。金。现在学习的是第22页,共61页v 如果遗产有如果遗产有 200 金,那么由于婢女宣称自己只拥有金,那么由于婢女宣称自己只拥有

22、 100 金的继承权,因此剩余金的继承权,因此剩余的的 100 金已经可以明确分配给妻子和妾。金已经可以明确分配给妻子和妾。v 将妻子和妾看成一个整体,不妨称为将妻子和妾看成一个整体,不妨称为“妻妾集团妻妾集团”。v “妻妾集团妻妾集团”需要与婢女分割婢女宣称自己有权继承的那需要与婢女分割婢女宣称自己有权继承的那 100 金。由于婢女和金。由于婢女和“妻妾集团妻妾集团”均宣称拥有这均宣称拥有这100金的继承权。因此婢女和金的继承权。因此婢女和“妻妾集团妻妾集团”各得各得 50 金。婢女的财产继承结束。金。婢女的财产继承结束。v “妻妾集团妻妾集团”此时总共拥有此时总共拥有 150 金。由于妻子

23、和妾都宣称拥有这金。由于妻子和妾都宣称拥有这 150 金的继承金的继承权,因此这权,因此这 150 金在妻子和妾之间平均分配,每人得到金在妻子和妾之间平均分配,每人得到 75 金。因此当遗产为金。因此当遗产为 200 金时,分配结果为:妻子得到金时,分配结果为:妻子得到 75 金,妾得到金,妾得到 75 金,婢女得到金,婢女得到 50 金。金。现在学习的是第23页,共61页v 如果遗产有如果遗产有 300 金,那么由于婢女宣称自己只拥有金,那么由于婢女宣称自己只拥有 100 金的继承权,因此剩金的继承权,因此剩余的余的 200 金已经可以明确分配给妻子和妾。金已经可以明确分配给妻子和妾。v “

24、妻妾集团妻妾集团”需要与婢女分割婢女宣称自己有权继承的那需要与婢女分割婢女宣称自己有权继承的那 100 金。婢女和金。婢女和“妻妾妻妾集团集团”各得各得50金。婢女的财产继承结束。金。婢女的财产继承结束。v “妻妾集团妻妾集团”此时总共拥有此时总共拥有 250 金。由于妾宣称自己拥有金。由于妾宣称自己拥有 200 金的继承权,金的继承权,因此其中因此其中 50金可以明确分配给妻子。金可以明确分配给妻子。v 妻子和妾只需要分割妾宣称自己有权继承的那妻子和妾只需要分割妾宣称自己有权继承的那 200 金。妻子和妾各得金。妻子和妾各得100 金。金。妾的财产继承结束。妻子总计得到妾的财产继承结束。妻子

25、总计得到 150 金。金。v因此当遗产为因此当遗产为 300 金时,分配结果为:妻子得到金时,分配结果为:妻子得到 150 金,妾得到金,妾得到 100 金,婢女金,婢女得到得到 50 金。金。现在学习的是第24页,共61页v 根据根据“大衣分配原则大衣分配原则”中的犹太律法思想,通过利用现代博弈中的犹太律法思想,通过利用现代博弈的观点,奥曼解决了困扰学者多年的的观点,奥曼解决了困扰学者多年的“塔木德难题塔木德难题”。v “塔木德塔木德”难题的成功破解一方面显示了现代博弈理论的强大解释力和难题的成功破解一方面显示了现代博弈理论的强大解释力和奥曼的高超技巧,另一方面也揭示出古代犹太民族的智慧深度

26、和精湛思奥曼的高超技巧,另一方面也揭示出古代犹太民族的智慧深度和精湛思维。维。现在学习的是第25页,共61页第三节第三节 重复博弈重复博弈v 重复博弈(重复博弈(Repeated Game)是一类特殊的完全信息动态博弈。)是一类特殊的完全信息动态博弈。v 在重复博弈中存在一个重复多次的基础博弈(在重复博弈中存在一个重复多次的基础博弈(Base Game)。)。v 基础博弈又常被称为阶段博弈(基础博弈又常被称为阶段博弈(Stage Game)。)。v 基础博弈被重复有限次的博弈称为有限次重复博弈。相应的,基础博弈基础博弈被重复有限次的博弈称为有限次重复博弈。相应的,基础博弈被重复无限次的博弈称为

27、无限次重复博弈或无穷次重复博弈。被重复无限次的博弈称为无限次重复博弈或无穷次重复博弈。v 与重复博弈相对应,非重复博弈也常被称为单一阶段博弈(与重复博弈相对应,非重复博弈也常被称为单一阶段博弈(Single Stage Game)或单次博弈()或单次博弈(Single Shot Game)。)。v 单次博弈、有限次重复博弈、无限次重复博弈的求解思路和均衡往往存在很大区别。单次博弈、有限次重复博弈、无限次重复博弈的求解思路和均衡往往存在很大区别。现在学习的是第26页,共61页一、有限次重复博弈一、有限次重复博弈参与者2锤头剪刀布参与者1锤头(0,0)(1,-1)(-1,1)剪刀(-1,1)(0,

28、0)(1,-1)布(1,-1)(-1,1)(0,0)“锤头、剪刀、布”博弈的支付矩阵v “锤头、剪刀、布”博弈没有纯策略纳什均衡,但存在一个混合策略纳什均衡。现在学习的是第27页,共61页v 如果将如果将“锤头、剪刀、布锤头、剪刀、布”博弈从博弈一次转化为博弈多次。博弈从博弈一次转化为博弈多次。即博弈参与者进行多轮相同的博弈。在每次博弈中,博弈参与即博弈参与者进行多轮相同的博弈。在每次博弈中,博弈参与者的策略是否会发生变化呢?者的策略是否会发生变化呢?v 定理:在有限次重复博弈中,如果单次博弈为零和博弈,那么增加定理:在有限次重复博弈中,如果单次博弈为零和博弈,那么增加博弈次数不会改变博弈均衡

29、。博弈次数不会改变博弈均衡。v 简单重复多次简单重复多次“锤头、剪刀、布锤头、剪刀、布”博弈,不会改变两名博弈参与者的策博弈,不会改变两名博弈参与者的策略选择。两名博弈参与者在每次博弈中,都按照单次博弈的混合策略纳略选择。两名博弈参与者在每次博弈中,都按照单次博弈的混合策略纳什均衡行动。什均衡行动。现在学习的是第28页,共61页v “囚徒困境”博弈的纯策略纳什均衡:(坦白、坦白)。嫌疑人乙坦白不坦白嫌疑人甲坦白(-5,-5)(-1,-10)不坦白(-10,-1)(-2,-2)“囚徒困境”博弈的支付矩阵现在学习的是第29页,共61页v 定理:在有限次重复博弈中,如果单次博弈存在唯一的纯策略定理:

30、在有限次重复博弈中,如果单次博弈存在唯一的纯策略纳什均衡,则有限次重复博弈的唯一均衡是:各博弈参与者在纳什均衡,则有限次重复博弈的唯一均衡是:各博弈参与者在每阶段都采用该纯策略纳什均衡中的策略每阶段都采用该纯策略纳什均衡中的策略 。有限次重复博弈不。有限次重复博弈不过是一次性博弈的简单重复。过是一次性博弈的简单重复。v 由于(坦白、坦白)是由于(坦白、坦白)是“囚徒困境囚徒困境”博弈唯一的纯策略纳什均衡,博弈唯一的纯策略纳什均衡,因此在任意有限次重复博弈因此在任意有限次重复博弈“囚徒困境囚徒困境”中,两名嫌疑人每次博弈中,两名嫌疑人每次博弈都必然选择都必然选择“坦白坦白”策略。策略。现在学习的

31、是第30页,共61页二、连锁超市悖论二、连锁超市悖论v 莱茵哈德莱茵哈德 泽尔滕(泽尔滕(Reinhard Selten)1978 年发表了著名的年发表了著名的“连锁连锁超市悖论(超市悖论(The Chain Store Paradox)”。v 假设市场中有一个连锁超市,不妨称其为博弈参与者假设市场中有一个连锁超市,不妨称其为博弈参与者 A。v 连锁超市在连锁超市在 20 个城市中有自己的店面。个城市中有自己的店面。v 将这将这 20 个城市进行编号,分别记为个城市进行编号,分别记为 1,2,20。v 在每一个城市都有一个潜在的进入者。在每一个城市都有一个潜在的进入者。v 潜在进入者逐渐积累资

32、本。只有当潜在进入者积累的资本达到一定数量时,潜在进潜在进入者逐渐积累资本。只有当潜在进入者积累的资本达到一定数量时,潜在进入者才有可能进入市场。入者才有可能进入市场。现在学习的是第31页,共61页v 不妨将城市不妨将城市 k 中的潜在进入者称为博弈参与者中的潜在进入者称为博弈参与者 k,k = 1,2,20 。v 因此,博弈共有因此,博弈共有 21 个参与者:连锁超市(参与者个参与者:连锁超市(参与者 A)和)和 20 个潜在进入者。个潜在进入者。v 在初始时,假设在初始时,假设 20 个潜在进入者都没有足够的资本进入市场。个潜在进入者都没有足够的资本进入市场。v 但随着时间的推移,潜在进入

33、者积累的资本逐渐增多。但随着时间的推移,潜在进入者积累的资本逐渐增多。v 假设城市假设城市 1 的潜在进入者将首先积累到足够的资本额进入市场,其次是城市的潜在进入者将首先积累到足够的资本额进入市场,其次是城市 2 中的潜在进入者,中的潜在进入者,最后是城市,最后是城市20中的潜在进入者。中的潜在进入者。现在学习的是第32页,共61页v 当城市当城市 k 中的潜在进入者积攒了足以进入市场的资本后,他有两个策略选中的潜在进入者积攒了足以进入市场的资本后,他有两个策略选择:择:“进入进入”和和“不进入不进入”。v 当博弈参与者当博弈参与者 k 选择选择“不进入不进入”时,在城市时,在城市 k 中的博

34、弈结束。中的博弈结束。v 当博弈参与者当博弈参与者 k 选择选择“进入进入”时,参与者时,参与者 A 有两个策略选择:有两个策略选择:“斗争斗争”和和“默许默许”。现在学习的是第33页,共61页“连锁超市悖论”的基础博弈现在学习的是第34页,共61页v 根据根据“连锁超市悖论连锁超市悖论”的基础博弈。的基础博弈。v 当潜在进入者选择当潜在进入者选择“不进入不进入”时,博弈结束。潜在进入者得到收益时,博弈结束。潜在进入者得到收益 1。连锁超市独。连锁超市独享垄断利润,得到收益享垄断利润,得到收益 5。v 当潜在进入者选择当潜在进入者选择“进入进入”时,连锁超市具有两个策略选择。时,连锁超市具有两

35、个策略选择。n当连锁超市选择“斗争”策略时,潜在进入者和连锁超市均得到收益 0。n当连锁超市选择“默许”策略时,潜在进入者和连锁超市均得到收益 2。连锁超市斗争默许潜在进入者不进入(1,5)(1,5)进入(0,0)(2,2)“连锁超市悖论”的基础博弈的策略型表达式现在学习的是第35页,共61页v 连锁超市和潜在进入者之间的重复博弈是一个动态博弈。连锁超市和潜在进入者之间的重复博弈是一个动态博弈。v博弈共有九种情况。博弈共有九种情况。博弈进行到城市2时的博弈树现在学习的是第36页,共61页v情形一:如果潜在进入者情形一:如果潜在进入者 1 选择选择“不进入不进入” ,那么轮到潜在进入者,那么轮到

36、潜在进入者 2 进行策略选择。进行策略选择。如果潜在进入者如果潜在进入者 2 选择选择“不进入不进入”,那么连锁超市在城市,那么连锁超市在城市 1和城市和城市 2 均保持其垄断地位。均保持其垄断地位。在每个城市均得到收益在每个城市均得到收益 5,总计得到收益,总计得到收益 10。两个城市的潜在进入者均得到收益。两个城市的潜在进入者均得到收益 1。即:。即:潜在进入者潜在进入者 1、连锁超市、潜在进入者、连锁超市、潜在进入者 2的收益为(的收益为(1,10,1) 。v情形二:如果潜在进入者情形二:如果潜在进入者 1 选择选择“不进入不进入”、潜在进入者、潜在进入者 2 选择选择“进入进入” ,那

37、么连锁,那么连锁超市需要选择自己在城市超市需要选择自己在城市 2 的策略。如果连锁超市在城市的策略。如果连锁超市在城市 2 选择选择“斗争斗争” ,那么,那么连锁超市在城市连锁超市在城市 1 得到收益得到收益 5,在城市,在城市 2 得到收益得到收益 0,总计得到收益,总计得到收益 5。潜在参与者。潜在参与者 1 得到收益得到收益 1,潜在参与者,潜在参与者 2 得到收益得到收益 0。即:潜在进入者。即:潜在进入者 1、连锁超市、潜在进入者、连锁超市、潜在进入者 2 的收益为(的收益为(1,5,0) 。现在学习的是第37页,共61页v 情形三:如果潜在进入者情形三:如果潜在进入者 1 选择选择

38、“不进入不进入”、潜在进入者、潜在进入者 2 选择选择“进入进入”、连、连锁超市在城市锁超市在城市 2 选择选择“默许默许” ,那么连锁超市在城市,那么连锁超市在城市 1 得到收益得到收益 5,在城市,在城市 2 得到收益得到收益 2,总计得到收益,总计得到收益 7。潜在参与者。潜在参与者 1 得到收益得到收益 1,潜在参与者,潜在参与者 2 得到收益得到收益 2。即:。即:潜在进入者潜在进入者 1、连锁超市、潜在进入者、连锁超市、潜在进入者 2 的收益为(的收益为(1,7,2) 。v情形四:如果潜在进入者情形四:如果潜在进入者 1 选择选择“进入进入”,那么连锁超市需要选择自己在城市,那么连

39、锁超市需要选择自己在城市 1 的策略。的策略。如果连锁超市在城市如果连锁超市在城市 1 选择选择“斗争斗争”,那么连锁超市在城市,那么连锁超市在城市 1 得到收益得到收益 0,潜在参与,潜在参与者者 1 得到收益得到收益 0。在城市。在城市 2,潜在进入者,潜在进入者 2 进行策略选择。如果潜在进入者进行策略选择。如果潜在进入者 2 选择选择“不不进入进入”,那么连锁超市在城市,那么连锁超市在城市 2 得到收益得到收益 5,潜在进入者,潜在进入者 2 得到收益得到收益 1。即:潜在进入。即:潜在进入者者 1、连锁超市、潜在进入者、连锁超市、潜在进入者 2 的收益为(的收益为(0,5,1) 。现

40、在学习的是第38页,共61页v 情形五:如果潜在进入者情形五:如果潜在进入者 1 选择选择“进入进入”、连锁超市在城市、连锁超市在城市 1 选择选择“斗争斗争”,那么,那么连锁超市在城市连锁超市在城市 1 得到收益得到收益 0,潜在参与者,潜在参与者 1 得到收益得到收益 0。在城市。在城市 2,如果潜在进入,如果潜在进入者者 2 选择选择“进入进入”,连锁超市选择,连锁超市选择“斗争斗争”,那么连锁超市在城市,那么连锁超市在城市 2 得到收益得到收益 0,潜在,潜在进入者进入者 2 得到收益得到收益 0。连锁超市在两个城市中总计得到收益。连锁超市在两个城市中总计得到收益 0。即:潜在进入者。

41、即:潜在进入者 1、连锁、连锁超市、潜在进入者超市、潜在进入者 2 的收益为(的收益为(0,0,0) 。v 情形六:如果潜在进入者情形六:如果潜在进入者 1 选择选择“进入进入”、连锁超市在城市、连锁超市在城市 1 选择选择“斗争斗争”,那么,那么连锁超市在城市连锁超市在城市 1 得到收益得到收益 0,潜在参与者,潜在参与者 1 得到收益得到收益 0。在城市。在城市 2,如果潜在进,如果潜在进入者入者 2 选择选择“进入进入”,连锁超市选择,连锁超市选择“默许默许”,那么连锁超市在城市,那么连锁超市在城市 2 得到收益得到收益 2,潜在进入者潜在进入者 2 得到收益得到收益 2。即:潜在进入者

42、。即:潜在进入者 1、连锁超市、潜在进入者、连锁超市、潜在进入者 2 的收益为的收益为(0,2,2) 。现在学习的是第39页,共61页v 情形七:如果潜在进入者情形七:如果潜在进入者 1 选择选择“进入进入”,连锁超市在城市,连锁超市在城市 1 选择选择“默许默许”,那么,那么连锁超市在城市连锁超市在城市 1 得到收益得到收益 2,潜在参与者,潜在参与者 1 得到收益得到收益 2。在城市。在城市 2,潜在进入者,潜在进入者 2 进行策略选择。如果潜在进入者进行策略选择。如果潜在进入者 2 选择选择“不进入不进入”,那么连锁超市在城市,那么连锁超市在城市 2 得到收益得到收益 5,潜在进入者,潜

43、在进入者 2 得到收益得到收益 1。连锁超市在两个城市中总计得到收益。连锁超市在两个城市中总计得到收益 7。即:潜在。即:潜在进入者进入者 1、连锁超市、潜在进入者、连锁超市、潜在进入者 2 的收益为的收益为 (2,2,0)。)。v 情形八:如果潜在进入者情形八:如果潜在进入者 1 选择选择“进入进入”、连锁超市在城市、连锁超市在城市 1 选择选择“默许默许”,那么连锁,那么连锁超市在城市超市在城市 1 得到收益得到收益 2,潜在参与者,潜在参与者 1 得到收益得到收益 2。在城市。在城市 2,如果潜在进入者,如果潜在进入者 2 选择选择“进入进入”,连锁超市选择,连锁超市选择“斗争斗争”,那

44、么连锁超市在城市,那么连锁超市在城市 2 得到收益得到收益 0,潜在进入者,潜在进入者 2 得到收益得到收益 0。即:潜在进入者。即:潜在进入者 1、连锁超市、潜在进入者、连锁超市、潜在进入者 2 的收益为(的收益为(2,2,0) 。现在学习的是第40页,共61页v 情形九:如果潜在进入者情形九:如果潜在进入者 1 选择选择“进入进入”、连锁超市在城市、连锁超市在城市 1 选择选择“默许默许”,那么连锁超市在城市那么连锁超市在城市 1 得到收益得到收益 2,潜在参与者,潜在参与者 1 得到收益得到收益 2。在城市。在城市 2,如,如果潜在进入者果潜在进入者 2 选择选择“进入进入”,连锁超市选

45、择,连锁超市选择“默许默许”,那么连锁超市在,那么连锁超市在城市城市 2 得到收益得到收益 2,潜在进入者,潜在进入者 2 得到收益得到收益 2。连锁超市在两个城市中总计。连锁超市在两个城市中总计得到收益得到收益 4。即:潜在进入者。即:潜在进入者 1、连锁超市、潜在进入者、连锁超市、潜在进入者 2 的收益为(的收益为(2,4,2) 。v 在了解了在了解了 m = 2 时的连锁超市博弈后,便不难理解时的连锁超市博弈后,便不难理解 m 等于任意自然数的连锁超等于任意自然数的连锁超市博弈的博弈模式。市博弈的博弈模式。现在学习的是第41页,共61页“连锁超市悖论连锁超市悖论”的由来的由来v 可以通过

46、两种思路求解可以通过两种思路求解“连锁超市悖论连锁超市悖论”的均衡。的均衡。v 第一种思路是根据第一种思路是根据“逆向归纳法逆向归纳法”,由最后一期博弈均衡开始,从后向,由最后一期博弈均衡开始,从后向前,找到整个博弈的均衡。前,找到整个博弈的均衡。v 第二种思路是通过第二种思路是通过“威慑原理(威慑原理(The Deterrence Theory)”,寻找博弈,寻找博弈的均衡解。的均衡解。v 原则上两种思路找到的均衡应该相同,但实际并非如此,这构成了原则上两种思路找到的均衡应该相同,但实际并非如此,这构成了“连锁超市连锁超市悖论悖论”。现在学习的是第42页,共61页v “连锁超市博弈连锁超市博

47、弈”是一个有限次重复博弈。是一个有限次重复博弈。v 博弈的次数与城市个数相等。博弈的次数与城市个数相等。v 不失一般性,假设城市数目为不失一般性,假设城市数目为 20。v 按照按照“逆向归纳法逆向归纳法”的求解思路,首先考察第的求解思路,首先考察第 20 个城市的博弈情况。在第个城市的博弈情况。在第 20 个城市中,潜在进入者个城市中,潜在进入者 20 与连锁超市进行单阶段博弈。与连锁超市进行单阶段博弈。v 根据完全且完美信息动态博弈的求解方法,在第根据完全且完美信息动态博弈的求解方法,在第20个城市中,潜在进入者个城市中,潜在进入者20将选择将选择“进入进入”,连锁超市会选择,连锁超市会选择

48、“默许默许”。根据根据“逆向归纳法逆向归纳法”求解求解“连锁超市博弈连锁超市博弈”现在学习的是第43页,共61页v 根据根据“逆向归纳法逆向归纳法”,从后向前倒推一期。,从后向前倒推一期。v 在第在第 19 个城市,潜在进入者个城市,潜在进入者 19 的最优策略也是的最优策略也是“进入进入”,连锁超市的最优,连锁超市的最优策略是策略是“默许默许”。,依此类推,在第,依此类推,在第 1 个城市,潜在进入者个城市,潜在进入者 1 的最优策的最优策略也是略也是“进入进入”,连锁超市的最优策略是,连锁超市的最优策略是“默许默许”。v 对于任意的对于任意的 k,k = 1,2,20,都有:潜在进入者,都

49、有:潜在进入者 k 选择选择“进入进入”,连锁,连锁超市选择超市选择“默许默许”。在这样的均衡下,每个潜在进入者均得到收益。在这样的均衡下,每个潜在进入者均得到收益 2,连锁超市得到收益连锁超市得到收益 40。现在学习的是第44页,共61页v 根据根据“威慑原理威慑原理”,连锁超市不一定会选择,连锁超市不一定会选择“默许默许”策略。策略。v 试想这样的情形:在第试想这样的情形:在第 1 个城市,潜在进入者个城市,潜在进入者 1 选择了选择了“进入进入”,但连锁超市选择了但连锁超市选择了“斗争斗争”。在这种情况下,潜在进入者。在这种情况下,潜在进入者 1 得到得到收益收益 0。如果潜在进入者。如

50、果潜在进入者 1 选择选择“不进入不进入”,至少可以得到收益,至少可以得到收益 1。潜。潜在进入者在进入者 1 进入市场后,非但没有得到收益进入市场后,非但没有得到收益 2,反而仅得到收益,反而仅得到收益 0。v 可以用可以用“偷鸡不成反蚀一把米偷鸡不成反蚀一把米”来形容潜在进入者来形容潜在进入者 1 的境遇。的境遇。根据根据“威慑原理威慑原理”求解求解“连锁超市博弈连锁超市博弈”现在学习的是第45页,共61页v 在城市在城市 1 的博弈结束后,进入到在城市的博弈结束后,进入到在城市 2 的博弈阶段。的博弈阶段。v 城市城市 1 中的潜在进入者中的潜在进入者 1 的境遇对城市的境遇对城市 2

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com