最优控制模型精选PPT.ppt

上传人:石*** 文档编号:84326952 上传时间:2023-04-04 格式:PPT 页数:108 大小:1.03MB
返回 下载 相关 举报
最优控制模型精选PPT.ppt_第1页
第1页 / 共108页
最优控制模型精选PPT.ppt_第2页
第2页 / 共108页
点击查看更多>>
资源描述

《最优控制模型精选PPT.ppt》由会员分享,可在线阅读,更多相关《最优控制模型精选PPT.ppt(108页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、关于最优控制模型第1页,讲稿共108张,创作于星期二6.0 引言1、经济行为人决策的典型特征 经济活动的行为主体主要有家庭、企业和政府。家庭在做决策时,既要考虑今天,也要考虑明天,既要考虑当代,还要考虑下一代;企业在做决策时,不仅要考虑当期的收益,也要考虑未来的持续经营;政府在做决策时,不仅要考虑当前,也要考虑未来。总之,经济行为人的决策是一个跨期优化(intertemporal optimazation)问题。2、处理跨期优化问题的方法(1)最优控制(optimal control)(2)变分法(calculus of variations)(3)动态规划(dynamic programmi

2、ng)第2页,讲稿共108张,创作于星期二6.1 离散跨期选择问题1、离散跨期选择的经典问题“吃糕”问题假设行为人拥有一些不可再生的资源,如一块蛋糕,该资源的初始存量为S0,行为人在时期t的消费量为ct,则在时期t资源的存量为:St=St-1-ct 再假设行为人确切地知道他能活3个时期,如青年、中年、老年三个时期,问题是该行为人如何将其资源在各个时期中消费?第3页,讲稿共108张,创作于星期二6.1 离散跨期选择问题2、“吃糕”问题的数学表述记行为人的效用函数为u(ct),该效用函数在各个时期均相同,且有:u(c)0,u(c)0,则有:u(c1)u(c2)c2c3如果确切知道和S0的值,则可具

3、体求出c1、c2和c3。第6页,讲稿共108张,创作于星期二6.2 连续时间的最优控制6.2.1 基本概念1、跨期效用函数所谓跨期效用函数,即行为人一生的总效用函数,如“吃糕”问题中的效用函数:U(c1,c2,c3)=u(c1)+u(c2)/(1+)+u(c3)/(1+)2 其中,每个时期的效用函数u(ct)称为“幸福”(felicity)函数。对于连续时间的情形,跨期效用函数通常写为:U(ct)=t0Tu(ct)e-tdt 其中每时刻的效用函数u(ct)又称为瞬时效用函数,或“幸福”函数。第7页,讲稿共108张,创作于星期二6.2 连续时间的最优控制1、跨期效用函数如此设定的跨期效用函数具有

4、可加性(additivity)或称可分离性(separability)的性质。可分离性的条件为:Mij/ck=0 其中Mij为不同时期消费的边际替代率(marginal rate of substitution between consumption in period i and j),即:Mij=Ui(.)/Uj(.)=(U/ci)/(U/cj)第8页,讲稿共108张,创作于星期二6.2 连续时间的最优控制2、指数折现率在跨期效用函数中,通常需要有折现因子。一般地,折现因子可表示为(t)。在连续时间的跨期效用函数中,折现因子一般设定为指数形式,即有:(t)=e-t设定指数折现形式的好处是可

5、避免时间不一致性(time inconsistency)。所谓时间不一致性是指,一个消费计划在开始时被认为是最优的,但过了一段时间再评估就不是最优的了。第9页,讲稿共108张,创作于星期二6.2 连续时间的最优控制3、目标函数跨期最优化问题的目标函数的一般形式为:F(s,c,t)=t0Tfs(t),c(t),tdt 其中,T可以是无穷大,折现因子已包含在了fs(t),c(t),t函数之中。s(t)称为状态变量,c(t)称为控制变量,t为时间。若时间t只是间接地通过s(t)和c(t)出现在函数f之中,则称此跨期优化问题为自治问题(autonomous problem),若t直接出现在函数f之中,

6、则称为非自治问题(non-autonomous problem)。第10页,讲稿共108张,创作于星期二6.2 连续时间的最优控制4、状态变量的运动方程状态变量就是不由行为人直接控制的系统内生决定的变量,而控制变量则是行为人可直接控制的变量。行为人通过对控制变量的控制可以间接地影响状态变量,状态变量的变化方程是控制变量的函数,可表示为:(t)=gs(t),c(t),t 称为状态变量的运动方程。最优控制问题就是要找出控制变量在各个时刻的最优取值,使得目标函数值达到最大(或最小)。控制变量从初始时刻到终结时刻的变化过程称为控制变量的路径,状态变量的变化过程称为状态变量的路径。第11页,讲稿共108

7、张,创作于星期二6.2 连续时间的最优控制5、横截条件所谓横截条件,就是可以把状态变量的最优路径与其他允许路径区别开来的条件。类似于微分方程中的初始条件,横截条件确定了状态变量的具体路径,即决定了状态变量和控制变量的最优轨线(optimal trajectory)。最简单的横截条件是固定始点和固定终点条件,即:s(t0)=s0,s(T)=sT 许多经济问题都有一个给定的出发点s0,当其终点值sT本身就是优化问题的一部分。第12页,讲稿共108张,创作于星期二6.2 连续时间的最优控制6、拉格朗日函数最简单的最优控制问题可以写为:J(s,t)=Max t0Tf(s,c,t)dt s.t:(t)=

8、g(s,c,t)s(t0)=s(0)=s0,s(T)自由由于在区间t0,T上,状态变量的运动方程(t)=g(s,c,t)始终成立,从而始终有g(s,c,t)-=0。使用拉格朗日乘子的概念,则有:(t)g(s,c,t)-=0 也必然有:t0T(t)g(s,c,t)-dt=0第13页,讲稿共108张,创作于星期二6.2 连续时间的最优控制6、拉格朗日函数因此,将此式0T(t)g(s,c,t)-dt加入目标函数之中,并不影响目标函数的值,于是可将目标函数扩展为:L=t0Tf(s,c,t)dt+t0T(t)g(s,c,t)-dt =t0Tf(s,c,t)+(t)g(s,c,t)-(t)dt对于此式中的

9、最后一部分使用分部积分,则有:-t0T(t)(t)dt=-(t)s(t)|0T+t0Ts(t)(t)dt =-(T)s(T)+(t0)s(t0)+t0Ts(t)(t)dt 代入前式,得拉格朗日函数为:L=t0Tf(s,c,t)+g(s,c,t)+sdt-(T)s(T)+(t0)s(t0)第14页,讲稿共108张,创作于星期二6.2 连续时间的最优控制7、一阶条件为了导出最优控制问题的一阶条件,假设已得到了拉格朗日函数的最大值L,则拉格朗日函数中变量的任何变化都会引起L值的下降。也就是说,在最优点,将L对c和s微分,必然有dL0,即有:dL=t0Tfc+gc)dc+(fs+gs+)dsdt -(

10、T)ds(T)+(t0)ds(t0(0要使dL0成立,上式中的每一项都必须小于或等于0。由于dc和ds均可正可负,所以必须有:fc+gc=0 fs+gs+=0 此二必要条件就称为最优控制问题的一阶条件。第15页,讲稿共108张,创作于星期二6.2 连续时间的最优控制8、横截条件在最优控制问题中,如果状态变量的初始值s(t0)和终点值s(T)都已给定,则ds(t0)和ds(T)都为0。如果仅初始值s(t0)给定,而终点值s(T)没有给定,则要使dL中的(T)ds(T)0,就必须有:(T)=0 这也称为固定时限的自由终值问题的横截条件。该条件表明,对于可以自由选择终点值的最优控制问题,终点时刻的拉

11、格朗日乘子值必须为0。第16页,讲稿共108张,创作于星期二6.2 连续时间的最优控制9、共态变量在最优控制问题的拉格朗日函数中,拉格朗日乘子(t)是伴随着状态变量而引进的,称为共态变量(costate variables)。由拉格朗日函数可得:L/s0=(t0)L/sT=-(T)这表明,状态变量的初始值每增加一个单位,就可使优化目标函数值增加(t0)个单位;而状态变量的终点值每增加一个单位,则可使优化目标函数值减少(T)个单位。因此,共态变量(t)用目标函数的度量单位计量了状态变量s(t)的价值,可称为状态变量的影子价格(shadow price)。第17页,讲稿共108张,创作于星期二6.

12、2 连续时间的最优控制10、汉密尔顿(Hamilton)函数在最优控制问题的拉格朗日函数中,与控制变量c(t)有关的只有其前两项,因此可单独列出此两项为:H=f(s,c,t)+g(s,c,t)此式就称为汉密尔顿函数。对于拉格朗日函数细加分析,可以看出汉密尔顿函数的经济含义。第18页,讲稿共108张,创作于星期二6.2 连续时间的最优控制11、庞特里雅金(Pontryagin)最大值原理最优控制问题的一阶条件,如果使用汉密尔顿函数,则可表示为:Hc=fc+gc=0 =-Hs=-(fs+gs)其中,第1个方程是最优化问题的必要条件,它给出了控制变量c在每个时刻可能的最优值;第2个方程是共态变量的运

13、动方程,称为辅助方程或伴随方程(auxiliary or adjoint equation),该方程与状态变量s的运动方程:=H=g(s,c,t)一起称为最优控制问题的汉密尔顿系统或标准系统。第19页,讲稿共108张,创作于星期二6.2 连续时间的最优控制11、庞特里雅金(Pontryagin)最大值原理由上述一阶条件和状态变量的运动方程,还可导出控制变量的运动方程。一阶条件方程对时间求导,得:fcc+fcs+gcc+gcs+gc+fct+gct=0 将=g(s,c,t)代入,并解出,得:=-(fcc+gcc)+(fcs+gcs)g+(fct+gct)/gc 令此式与前面给出的共态变量的运动方

14、程相等,并将必要条件=-fc/gc代入,得控制变量的运动方程为:=(gcfs-fcgs)gc-(gcfcs-fcgcs)g-(gcfct-fcgct)/(gcfcc-fcgcc)在相位图分析中,视方便可以作出c和s的相位图,也可以作出和s的相位图。第20页,讲稿共108张,创作于星期二6.2 连续时间的最优控制12、边界解 如果控制域是一个闭区间ac(t)b,则汉密尔顿函数H的最大值可能出现在控制域的一个内部点(曲线1),也可能出现在边界点如c=a或c=b处(曲线2和3)。对于边界点,一阶条件H/c=0将不再适用。此时,最大值原理可以表述为:Maxc H(s,c,t,)=H=g(s,c,t)=

15、-Hs=-(fs+gs)这时,需要对边界点进行考察。H 曲线1 曲线2 曲线3 a 0 b c第21页,讲稿共108张,创作于星期二6.2.2 吃糕控制问题1、问题假设行为人拥有一些不可再生的资源,如一块蛋糕s,该资源的初始存量为s0,行为人在时刻t的消费量为c(t),消费的效用函数为u(c)。又假设行为人的规划期从0时到T时,时期长度固定,其未来效用的折现率为固定折现率,且行为人要在T时期末将此蛋糕消费完,不留遗产。问题是,该行为人如何在0到T的整个时期内分配此蛋糕的消费量,以使其获得的效用最大?第22页,讲稿共108张,创作于星期二6.2.2 吃糕控制问题2、吃糕问题的数学表述由于行为人追

16、求整个规划期内效用的最大化,所以该行为人的消费决策问题就可表示为:Max:Uc(t)=0Te-tuc(t)dt uc(c)0,ucc(c)0,uc0,ucc0,所以有0,即行为人的蛋糕消费持续下降。第25页,讲稿共108张,创作于星期二6.2.2 吃糕控制问题4、吃糕问题的求解在经济学中,常用的瞬时效用函数是不变跨期替代弹性(CIES)效用函数:u(c)=(c1-1)/(1-)使用此效用函数,就有:uc=c-,ucc=-c-1 由此得消费的边际效用替代弹性为:cucc/uc=-其中,=-cucc/uc又称为相对风险规避系数。将此边际效用替代弹性代入蛋糕消费增长率方程,得:/c=-/第26页,讲

17、稿共108张,创作于星期二6.2.2 吃糕控制问题5、相位图分析稳定线 =0:c=0 =0不存在相箭头 相对于稳定线=0,有:/c=-10 对于消费c,有:=uc/ucc0,而fkk0,所以此曲线的斜率先正后负。第33页,讲稿共108张,创作于星期二6.3 新古典经济增长模型6、状态变量-控制变量空间(k,c)中的相位图 相箭头 对于稳定线=0,有:c /k=-fkkuc/ucc0 =0 对于稳定线=0,有:/k=fk-(+)/c=-1的情形2)、kT的情形 k0 kT kT k第34页,讲稿共108张,创作于星期二6.3 新古典经济增长模型7、状态变量-共态变量空间(k,)中的相位图(k,)

18、空间的微分方程组 =f(k)-c-(+)k =-fk(k)-(+)在的微分方程中,需将c变换为的函数,由一阶条件Hc=e-tuc-=0,有:=e-tuc 其中显含有时间t,代入的微分方程,将使此微分方程成为非自治的。若画相位图,将需要每个不同时刻画一个,非常不便,因此需要先变换。第35页,讲稿共108张,创作于星期二6.3 新古典经济增长模型7、状态变量-共态变量空间(k,)中的相位图 现值(present value)汉密尔顿函数和当期值(current value)汉密尔顿函数 现值汉密尔顿函数:H=e-tu(c)+f(k)-c-(+)k 当期值汉密尔顿函数:=etH=u(c)+f(k)-

19、c-(+)k 其中=et,为当期值共态变量,而则是现值共态变量。第36页,讲稿共108张,创作于星期二6.3 新古典经济增长模型7、状态变量-共态变量空间(k,)中的相位图 当期值汉密尔顿函数下的一阶条件 由现值汉密尔顿函数下的一阶条件,可导出当期值汉密尔顿函数下的一阶条件为:Hc=0 etHc=c=0 =-Hk =et+et=-etHk+=-k+即当期值汉密尔顿函数下的一阶条件为:c=0 =-k 于是就有:uc-=0 =-fk-(+)=(+)-fk第37页,讲稿共108张,创作于星期二6.3 新古典经济增长模型7、状态变量-共态变量空间(k,)中的相位图(k,)空间的微分方程 =f(k)-c

20、-(+)k,=uc;=(+)-fk 稳定线 =0:fk()=+=fk-1(+),为常数,稳定线=0是一条垂直于k轴的直线。=0:c=f(k)-(+)k,其中含有c,需将c变换为的函数。第38页,讲稿共108张,创作于星期二6.3 新古典经济增长模型7、状态变量-共态变量空间(k,)中的相位图 稳定线 在稳定线=0:c=f(k)-(+)k两边对k求导,得:(c/)(/k)=fk-(+)由此得:/k=fk-(+)/(c/)由一阶条件uc=,两边对求导,得:ucc(c/)=1 c/=1/ucc(+),则有:/k|=0=fk-(+)/(c/)0 若fk0 由于fk0,而fkk0 =0 对于稳定线=0,

21、有:/k=fk-(+)/-=c/=-1/ucc的情形2)、kTsT,则类似自由终值问题,有条件(T)=0。将两种情况合并,即有横截条件为:(T)s(T)-sT=0(T)是T时状态变量s(t)的影子价格,若(T)0,表明行为人多消费1单位资源会增加其效用,从而必定有s(T)=sT,若放松约束,状态变量的终值将会达到sT以下;而(T)=0,则表明行为人多消费资源已无效用,故会有s(T)sT。第42页,讲稿共108张,创作于星期二6.4 其他终结条件6.4.2 终值的遗产函数或残值函数如果留有遗产也给行为人带来效用,则以效用测度的遗产函数将直接进入行为人的目标函数。记以效用度量的遗产函数为Bs(T)

22、,T,则行为人的最优目标为:J(s,t)=Maxt0Tf(s,c,t)dt+Bs(T),T 由此得最优化的拉氏函数为:L=t0Tf(s,c,t)+g(s,c,t)+sdt-(T)s(T)+(t0)s(t0)+Bs(T),T将此拉氏函数对c和s微分,得:dL=t0Tfc+gc)dc+(fs+gs+)dsdt+(t0)ds(t0)+Bs-(T)ds(T)要使dL0,除了前面已给出的各项条件以外,还必须有:Bs(s(T),T)-(T)ds(T)=0 即必须有:(T)=Bs(s(T),T)第43页,讲稿共108张,创作于星期二6.4 其他终结条件6.4.2 终值的遗产函数或残值函数此条件(T)=Bs(

23、s(T),T)表明,共态变量的终端值必须等于单位状态变量对遗产函数的边际贡献。由于共态变量是1单位状态变量的影子价格,这一条件就是说,状态变量在行为人消费和留作遗产之间的最优分配是使最终1单位的资源在二者之间配置的效用无差别。将终值不等式约束和遗产函数两种情形合并,则最优化的拉氏函数为:L=t0Tf(s,c,t)+g(s,c,t)+sdt-(T)s(T)+(t0)s(t0)+s(T)-sT+Bs(T),T 上述横截条件变为:+Bs(s(T),T)-(T)ds(T)=0 即:(T)=+Bs(s(T),T)第44页,讲稿共108张,创作于星期二6.4 其他终结条件6.4.3 可变的时间期限自由终结

24、时间如果终结时间也是最优化选择的一部分,即最优化问题为:J(s,t)=Max t0Tf(s,c,t)dt s.t:(t)=g(s,c,t)s(t0)=s0,T自由。则相应的拉氏函数为:L=t0Tf(s,c,t)+g(s,c,t)-dt =t0TH+sdt-(T)s(T)+(t0)s(t0)此拉氏函数的微分为:dL=t0T(H/c)dc+(H/s+)dsdt+(H+s)t=TdT -(T)s(T)dT-(T)(T)dT+(t0)ds(t0(=t0T(H/c)dc+(H/s+)dsdt+H(T)dT-(T)ds(T)+(t0)ds(t0 (第45页,讲稿共108张,创作于星期二6.4 其他终结条件

25、6.4.3 可变的时间期限自由终结时间由此可得最优化条件为:H/c=0 =-H/s H(T)=0 若ds(T)0,则(T)=0与前面的优化问题相比,这里增加的横截条件为:H(T)=f(s,c,t)-g(s,c,t)t=T=0 因为汉密尔顿函数H表示目标函数值随着时间的推移而发生的变化,所以行为人将会在汉密尔顿函数的数值不再随时间而增加的时刻终止此最优化问题。第46页,讲稿共108张,创作于星期二6.4 其他终结条件6.4.3 可变的时间期限自由终结时间如果行为人还愿意留有遗产,则拉式函数中还需有遗产函数,且该遗产函数直接是T的函数,为B(s(T),T),则上述横截条件就变为:H(T)+B/T=

26、0如果对终结时间还有不等式约束,如TT*,即T*T,则需在拉氏函数中再加上约束项u(T*-T),从而又有约束条件为:u0或(T*-T)0,即u(T*-T)=0 由此得横截条件为:H(T)+B/T-u=0如果(T*-T)0,约束是松弛的,则u=0;若(T*-T)=0,约束是紧的,则u0,即有u=H(T)+B/T0。第47页,讲稿共108张,创作于星期二6.5 不可再生资源开采控制问题6.5.0 基本假设与赫特林规则(1)资源是不可再生的,且是有限的;(2)资源所有者可以一次性地将所有资源全部开采出来卖掉(如将矿山或油田卖掉),也可以一点一点地逐渐开采出售,还可以握在手中。(3)存在一个完善的金融

27、市场,市场利率为r;(4)资源所有者开采与否以及如何开采取决于哪种方式可使其利润现值最大化,若资源的未来价格较高,现可不开采;若现价高,未来价低,则现在就开采完。第48页,讲稿共108张,创作于星期二6.5 不可再生资源开采控制问题6.5.0 基本假设与赫特林规则赫特林(Hotelling)规则:资源价格的上涨率必等于市场利率。若资源价格的上涨率高于市场利率,则资源所有者将减少现期的开采,减少现期供给,使现价上涨,从而使未来的供给增加,未来价格下降,也就使资源价格的上涨率下降;若资源价格的上涨率低于市场利率,则资源所有者将加大现期的开采,增加现期供给,使现价下跌,相应地使未来供给减少,未来价格

28、上涨,从而使资源价格的上涨率上升。第49页,讲稿共108张,创作于星期二6.5.1 不可再生资源的垄断开采6.5.1 垄断开采问题1、问题的数学表示假设只有一个企业进行垄断性开采,该企业追求的是利润的最大化,则有最优控制问题:Max t0Te-rtp(q)q-c(q)dt s.t.:=-q,s(0)=s0,s(T)0;p(q)0,c(q)0,c(0)=0 式中q为资源的开采率,即时刻t的瞬间开采量,s为未开采的资源存量,p(q)是逆需求函数,c(q)是开采的成本函数。其中,q为控制变量,s为状态变量。第50页,讲稿共108张,创作于星期二6.5.1 不可再生资源的垄断开采2、一阶条件该最优化问

29、题的当期值汉密尔顿函数为:H=p(q)q-c(q)-q 由此可得一阶条件为:Hq=p(q)+qp(q)-c(q)-=0 =r-Hs=r 由必要条件式Hq=0,可得:=p(q)+qp(q)-c(q)这表明,在最优开采路径上,资源的影子价格将等于资源开采的边际收益p(q)+qp(q)与边际成本c(q)之差,即等于资源开采的边际利润。第51页,讲稿共108张,创作于星期二6.5.1 不可再生资源的垄断开采2、一阶条件由共态变量的运动方程=r,可得:/=r 该式给出了最优开采路径上的赫特林规则,即资源的影子价格必须以市场利率的速度上升。将必要条件和赫特林规则合并则得:资源开采的边际利润必以市场利率的速

30、度上升。即有:/=(p+qp-c)/(p+qp-c)=r 也就是有:/=(2p+qp-c)q/(p+qp-c)第52页,讲稿共108张,创作于星期二6.5.1 不可再生资源的垄断开采2、一阶条件记(2p+qp-c)q/(p+qp-c)/(q/q)=q,为资源开采的边际利润的弹性,则就有:/=qq/q 式中/=r0,而q/q 0。因为在最优开采路径上,开采量的增长速度为常数,而资源越开采越少,最终会趋于0,所以要使q/q为常数,就必须有q/q0。这表明:q=(2p+qp-c)q/(p+qp-c)0 由于(p+qp-c)为资源开采的边际利润,为正,所以:2p+qp-c0,所以必有:s(T)=0 这

31、表明,垄断开采企业将会按照边际利润以利率r速度增长的时间路径把所有的资源都开采完毕。第58页,讲稿共108张,创作于星期二6.5.1 不可再生资源的垄断开采5、相位图状态-控制变量微分方程组:=-q q=(r/q)q状态-共态变量微分方程组:=-q =r由于赫特林规则的重要性,选择在状态-共态变量空间作相位图。第59页,讲稿共108张,创作于星期二6.5.1 不可再生资源的垄断开采(1)稳定线 =r=0:=0(横轴)=-q=0:q=0由一阶条件:p*=0 Hq=p(q)+qp(q)-c(q)-=0 有:(q)=p(q)+qp(q)-c(q)当q=0时,(0)=p(0)-c(0),由于c(0)=

32、0,有:s (0)=p(0)=p*由于p=p(q)是资源量q的逆需求曲线,该曲线给出了各种不同的资源量消费者愿意并能够支付的最高价格,所以p(0)=p*是使资源需求量为0的“窒息价格”。第60页,讲稿共108张,创作于星期二6.5.1 不可再生资源的垄断开采(2)相箭头 对于=0,有:/=r0 在=0的上方,表示 p*=0 运动方向的箭头向上。对于=0,有:/=-q/由一阶条件:=0 (q)=p(q)+qp(q)-c(q)s 得:/q=2p+qp-c0(由q0 在=0上方,箭头向右;在=0下方,箭头向左。第61页,讲稿共108张,创作于星期二6.5.1 不可再生资源的垄断开采(3)相轨线 在稳

33、定线=0的上方,和s都随时间而增加,由于资源s是不可再生的,所以系统不可能进入这一区域。因此,最优路径必须位于稳定线=0下方的区域,并从垂直线s=s0上的某点处开始。由于在最优路径上,是垄断企业开采资源的边际利润,不可能为负,所以最优路径的出发点在垂线s=s0上的0p*之间。第62页,讲稿共108张,创作于星期二6.5.1 不可再生资源的垄断开采(3)相轨线 沿着最优路径,影子价格以与市场利率r的速度增长。轨线的斜率为:/s=/=-r/q()0 所以,最优轨线凸向原点。第63页,讲稿共108张,创作于星期二6.5.1 不可再生资源的垄断开采(3)相轨线为了确定最优路径终点的位置,由横截条件s(

34、T*)=0可知,最优路径的终点将会到达纵轴,且在终结时间开采资源的边际利润等于平均利润。随着开采量q减少到0,该条件得到满足。因此,终止时间将在q=0时到达,在q=0时,有p(T*)=p*。确定了最优路径的终点和形状以后,用倒推的方式就可确定出最优路径的出发点,即在0到T*的时间内,以r的增长率上升,由初值上升到(T*)=p*,而s则由s0减少到0。第64页,讲稿共108张,创作于星期二6.5.1 不可再生资源的垄断开采(4)比较动态分析概念:比较动态分析就是分析外生变量的变化如何影响均衡解以及最优路径。分析内容:资源存量变化的影响;窒息价格(如:替代品出现)变化的影响;利率变化的影响:利率上

35、升,将会使轨线斜率/s=/=-r/q()0,所以有:s(T)=0如果终结时间是最优化问题的一部分,则还有横截条件为:H(T)=Wq(T)-(T)q(T)=0 即有:(T*)=Wq(T*)/q(T*)由一阶条件=Wq,可将此横截条件写为:单位资源的平均福利W(q)/q=Wq单位资源的边际福利 第68页,讲稿共108张,创作于星期二6.5.2 社会计划者最优开采5、(s,q)相位图状态-控制变量微分方程组 =-q q=r(p-c)/(p-c)稳定线 =0:q=0(横轴)q=0:p(qe)=c(qe)qe=常数相箭头 /q=-10(假设p-c=0)轨线路径 qqe q=0 s0 s第69页,讲稿共1

36、08张,创作于星期二6.5.2 社会计划者最优开采6、(s,)相位图状态-共态变量微分方程组 =-q =r稳定线 =0:q(e)=0e=常数 =0:=0(横轴)相箭头 /=-q/=-1/(p-c)0 /=r0轨线路径 e =0 s0 s第70页,讲稿共108张,创作于星期二6.5.3 小企业竞争性开采1、小企业的最优化问题若从事资源开采的企业相对市场而言很小,其产出对市场价格无影响,即开采企业没有定价权,则开采企业的最优化问题为:Max 0T pq-c(q)e-rtdt s.t.:=-q,s(0)=s0,s(T)0 其中仍s为状态变量,q为控制变量。第71页,讲稿共108张,创作于星期二6.5

37、.3 小企业竞争性开采2、小企业的最优化问题的求解汉密尔顿函数:H=pq-c(q)-q一阶条件:Hq=p-c(q)-=0 =r-Hs由=p-c(q)对时间求导,得:=-c(q)q 若=0,则有:q=r(p-c)/(-c)且有:/=r=(p-c)/(p-c)若企业开采的边际成本是变动的,则不需要市场价格变动,赫特林规则也可满足。如果企业开采的边际成本不变,则要满足赫特林规则,就需要市场价格以利率r的速度上升。第72页,讲稿共108张,创作于星期二6.5.3 小企业竞争性开采3、相位图如果市场价格变化,则难以画出相位图;如果市场价格不变,则此小企业将沿着产量递减的路径进行开采生产,其相位图与前两种

38、情形类似。状态-共态变量微分方程组 =-q =r稳定线:=0:=0(横轴)=0:q(e)=0e=常数相箭头:/=r0 /=-q/=-1/(-c)0轨线路径 e =0 s0 s第73页,讲稿共108张,创作于星期二6.5.4 三种情形的比较1、垄断开采的赫特林规则 /=r=(p+qp-c)/(p+qp-c)2、社会计划者最优开采的赫特林规则 /=r=(p-c)/(p-c)3、小企业竞争性开采的赫特林规则 /=r=(p-c)/(p-c)=-/(p-c)第74页,讲稿共108张,创作于星期二6.6 多个状态和控制变量问题6.6.1、问题假设存在n个状态变量s1,sn和m个控制变量c1,cm,则自由终

39、值最优控制问题可表示为:Max V=0Tf(s1,sn,c1,cm,t)dt s.t.1=g1(s1,sn,c1,cm,t)n=gn(s1,sn,c1,cm,t)s1(0)=s10,sn(0)=sn0 s1(T),sn(T)自由.第75页,讲稿共108张,创作于星期二6.6 多个状态和控制变量问题6.6.1、问题使用向量符号,记:s=(s1,sn),c=(c1,cm),=(1,),g(s,c,t)=(g1,gn),则上述自由终值最优控制问题可表示为:Max V=0Tf(s,c,t)dt s.t.=g(s,c,t)s(0)=s0,s(T)自由.第76页,讲稿共108张,创作于星期二6.6 多个状

40、态和控制变量问题6.6.2、最大值原理多变量最优控制问题的汉密尔顿函数为:H=f(s,c,t)+igi(s,c,t)或者用共态向量=(1,n),为:H=f(s,c,t)+g(s,c,t)类似于单变量情形,一阶条件为:Maxc H ,或者 H/c=0(内部解)且有:=H/=-H/s横截条件为:Ht=T=0,如果T是自由的;j(T)=0,如果sjT是自由的。第77页,讲稿共108张,创作于星期二6.6.3能源使用与环境污染控制1、能源使用与污染的关系用S表示石油资源的存量,假设石油的消耗用于两个方面,一是用于生产和生活,消耗量为E,二是用于反污染,消耗量为A,石油资源的变化方程为:=-E-A用Z表

41、示污染的存量,用表示污染的流量,假设污染流量以正比于石油的生产和生活消耗,以反比于反污染行动,且污染以速率指数衰减,则污染的变化方程为:=E-A-Z,(,0,00,UZ0,UCC0,C0,C”0,Z(T)0自由;S(0)=S00,S(T)0自由 E0,0A 其中,S和Z为状态变量,E和A为控制变量,E的控制区域是0,,A的控制区域是0,,为最大可行反污染行动水平。第79页,讲稿共108张,创作于星期二6.6.3能源使用与环境污染控制3、最大化汉密尔顿函数汉密尔顿函数为:H=UC(E),Z+S(-E-A)+Z(E-A-Z)由于有约束E0,根据具有不等式约束的静态最优化原理,其库恩-塔克条件即必要

42、条件为:H/E 0 并具有互补松弛条件:E(H/E)=0,由于可以排除极端情形E=0(即完全停止生产和消费),所以必须规定E0,从而有:H/E=UCC(E)-S+Z=0 由于2H/E2=UCCC2+UCC”0,所以H的确被最大化而不是最小化了。第80页,讲稿共108张,创作于星期二6.6.3能源使用与环境污染控制3、最大化汉密尔顿函数由于H关于A的一阶偏导数是线性的:H/A=-S-Z 而A的控制区域为0,,所以为了最大化H,如果H/A是负的,则应该选择左边界解A*=0;如果H/A是正的,则应该选择右边界解A*=。即:若-S-Z0,则A*=.由H关于E的一阶条件可知:S=UCC(E)+Z,上述条

43、件又可写为:若UCC(E)-(+)Z,则A*=0;若UCC(E)-Z,则A*=0;若能源的影子价格S大于治理污染的收益(将能源用于治理污染的效率污染的影子价格),即若边际成本边际收益,则不进行污染治理。若S-Z,则A*=;若能源的影子价格S小于治理污染的收益(将能源用于治理污染的效率污染的影子价格),即若边际成本边际收益,则尽力进行污染治理。第82页,讲稿共108张,创作于星期二6.6.3能源使用与环境污染控制5、能源与污染存量的路径共态变量的运动方程为:S=-H/S=0 S=(正)常数 Z=-H/Z=-UZ+Z且有横截条件为:S(T)S(T)=0 Z(T)Z(T)=0由于UZ0,则有Z0,即

44、必然有Z(0)0且Z(T)0,由横截条件可知,这最终将导致Z(T)=0,由于Z(0)=Z00,且UZ0,所以不论采用哪种污染处理政策,都不会有Z(T)=0,因此也不可能有Z0。因此,Z(t)的路径就只能是:Z(0)0,最终Z(T)=0。若采用不治理政策,则:Z(0)=Z00,(t)0,Z(T)Z(0)0;若采用尽力治理政策,则:Z(0)=Z0,(t)或=或0.第83页,讲稿共108张,创作于星期二6.6.3能源使用与环境污染控制5、能源与污染存量的路径能源使用的一阶条件式对时间t求导,得:(UCCC2+UCC”)=-Z 由于括号中的表达式为负,所以与Z同号,有:0 这表明能源使用量将一直增长。

45、由横截条件S(T)S(T)=0和S(T)=正常数可知,必有:S(T)=0 这表明,到终结时刻T,能源将枯竭。第84页,讲稿共108张,创作于星期二6.7 约束最优控制问题6.7.1 约束的类型1、涉及控制变量的约束 (1)等式约束 (2)不等式约束 (3)等式积分约束 (4)不等式积分约束不涉及控制变量的约束(只涉及状态变量的约束)状态空间约束第85页,讲稿共108张,创作于星期二6.7 约束最优控制问题6.7.2 涉及控制变量的等式约束1、问题假设状态变量为s,控制变量有两个c1和c2,且具有关系式:r(s,c1,c2,t)=b,则最优控制问题可表述为:Max 0Tf(s,c1,c2,t)d

46、t s.t.=g(s,c1,c2,t)r(s,c1,c2,t)=b 及边界条件注意:等式约束的个数q必须小于控制变量的个数m,即要求q0;若z(t,s)b,=0 0 =0当z(t,s)b =L/=g(s,c,t)=-L/s=-fs-gs+zts+zsgs+zssg第98页,讲稿共108张,创作于星期二6.8 政治的经济周期1、模型说明这是William D.Nordhaus(1975)给出的一个经济周期模型。该模型表明,在一个民主社会中,执政党为了防止在野党把它从台上赶下来所在的努力可能促使它执行某些政策,它们导致在每个竞选周期内呈现一种特殊的失业率和通货膨胀变化。在一个接一个的竞选周期中,这

47、种模式的重现将表现为一系列的经济周期,而这些经济周期完全是由政治活动引起的。第99页,讲稿共108张,创作于星期二6.8 政治的经济周期2、得票函数与菲利普斯曲线执政党执政期间的经济的好坏是影响选民投票选择的重要因素,其中失业u和通货膨胀p对居民的生活水平影响很大。因此可设定执政党的得票函数为:V=V(u,p),Vu0,Vp0.由宏观经济学可知,通货膨胀率与失业率之间存在反向的相关关系,可用菲利普斯曲线描述:p=(u)+a,u0,00.第100页,讲稿共108张,创作于星期二6.8 政治的经济周期3、等式约束最优控制问题假设一个政党在t=0时赢得了大选,下次选举将在t=T时举行。在时期0,T中

48、任何时刻的u和p值都会对执政党下次的选举有影响,但越接近选举日这些变量的值的影响就越大。假设选民记忆的衰退率为r,则可构造出执政党的最优控制问题为:Max 0TV(u,p)ertdt s.t.p=(u)+a =b(p-)(0)=0,(T)自由此问题中有三个变量u、p和,其中是状态变量,u和p是控制变量。这是一个具有涉及控制变量等式约束的最优控制问题。第101页,讲稿共108张,创作于星期二6.8 政治的经济周期3、等式约束最优控制问题为了能求解此问题,Nordhaus假设执政党的得票函数和菲利普斯曲线的具体形式为:V(u,p)=-u2-hp,h0.p=(j-ku)+a ,j,k0,0a1.此等

49、式约束最优控制问题可具体表示为:Max 0T(-u2-hp)ertdt s.t.p=(j-ku)+a =bp-(0)=0,(T)自由第102页,讲稿共108张,创作于星期二6.8 政治的经济周期4.等式约束最优控制问题的一阶条件增广汉密尔顿函数为:L=(-u2-hp)ert+b(p-)+(j-ku)+a-p根据最大值原理,一阶条件为:L/u=-2uert-k=0 L/p=-hert-b-=0 L/=(j-ku)+a-p=0 =L/=b(p-)=-L/=b-a由第2式解出=-hert-b,分别代入第1和第5式,并将第3式的p=(j-ku)+a代入第4式,则得:H/u=(-2u+hk)ert-bk

50、=0 =bj-ku-(1-a)=-H/=haert+b(1-a)第103页,讲稿共108张,创作于星期二6.8 政治的经济周期5.等式约束最优控制问题化为无约束最优控制问题等式约束最优控制问题也可先化为无约束的最优控制问题,然后再求解。如果根据约束等式,将p的等式分别代入目标函数和状态变量的运动方程,则此问题就化为一个无约束的最优控制问题:Max 0T(-u2-hj+hku-ha)ertdt s.t.=bj-ku-(1-a)(0)=0,(T)自由其中是状态变量,u作为控制变量。对此问题进行求解,结果与前面直接求解的结果相同。第104页,讲稿共108张,创作于星期二6.8 政治的经济周期6、汉密

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 资格考试

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com