《计量经济学讲义》新.pdf

上传人:w**** 文档编号:73581672 上传时间:2023-02-19 格式:PDF 页数:32 大小:1.61MB
返回 下载 相关 举报
《计量经济学讲义》新.pdf_第1页
第1页 / 共32页
《计量经济学讲义》新.pdf_第2页
第2页 / 共32页
点击查看更多>>
资源描述

《《计量经济学讲义》新.pdf》由会员分享,可在线阅读,更多相关《《计量经济学讲义》新.pdf(32页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、 第一章 绪论 计量经济学 一、计量经济学的产生与发展 计量经济学是经济学的一个分支,是以揭示经济活动中的客观存在的数量关系为内容的分支学科。其创立者 R.弗里希将其定义为经济理论、统计学、数学三者的结合,但它又完全不同于这三个学科的每一个分支。计量经济学(Econometrics)1926 年由挪威经济学家弗里希(R.Frish)仿造生物计量学(Biometrics)一词提出的。1930 年 12 月弗里希、丁百根和费歇耳等经济学家在美国克利夫兰市成立经济计量学会。1933 年出版计量经济学杂志在发刊词中弗里希将计量经济学定义为:经济理论、数学、统计学的结合。计量经济学的学术渊源和社会历史根

2、源:17 世纪英国经济学家威廉.配弟在政治算术一书中应用“数字、重量或尺度”来阐述经济现象 19 世纪法国经济学家古尔诺财富理论的数学原理研究中认为:某些经济范畴、需求、价格、供给可以视为互为函数关系,从而有可能用一系列的函数方程表述市场中的关系,并且可以用数学语言系统地阐述某些经济规律(数理学派的奠基者)其后瑞士经济学家瓦尔拉斯创立了一般均衡理论,利用联立方程研究一般均衡的决定条件(洛桑学派的先驱)意大利经济学家帕累托发展了一般均衡理论。用立体几何研究经济变量之间的关系。1890 年(剑桥学派的创始人)马歇尔的经济学原理的问世,使数学成为经济学研究不可缺少的描述与分析推理的工具为计量经济学奠

3、定了基础 计量经济学从二十世纪三十年代诞生起就显示了极强的生命力。一方面出于对经济的干预政策的需要,许多国家都广泛采用经济计量理论和方法,进行经济预测,加强市场研究,探讨经济政策的效果。另一方面随着科学技术的发展与进步,各门科学相互协作、相互渗透,计算机科学、数学、系统论、信息论、控制论等相继进入了经济研究领域。特别是计算机技术的高速发展为计量经济学广泛应用铺平了道路。计量经济学的发展过程是计量经济模型的建立、应用和发展的过程。主要是应用代数模型对客观经济现象进行数量上的描述和概括。大体经历了由简单到复杂、由微观到宏观分析、由局部均衡分析到全部均衡分析。20 世纪 30 年代研究为消费者、生产

4、者、厂商的微观分析。40、50 年代为消费、投资、收入、就业的宏观分析。同时由局部均衡到全部均衡分析。60、70 年代美国的连接计划采用宏观计量经济模型包括 18 个国家、7447 个方程和 3368 个外生变量。可以归结为:20、30 年代创立,40、50 年代大发展,60、70 年代大扩张。我国 20 世纪 80 年代引入了计量经济学的内容。目前对计量经济学的研究与应用十分充分。有专门的学会与杂志。每年的文献量是很大的。二、计量经济学的涵义 1、计量经济学的地位 诺贝尔经济学奖获得者克莱因:“计量经济学已经在经济学科中居于最重要的地位”“在大多数大学和学院中计量经济学的讲授已经成为经济学课

5、程表中最有权威的一部分”诺贝尔经济学奖获得者萨缪尔森:第二次世界大战后的经济学是计量经济学的时代。许多世界一流大学在教学计划中提出:现代经济学理论的一个显著特点是数学的广泛应用,学生必须学会用数学工具描述和发展经济学理论。1969 年设立诺贝尔经济学奖。第一届获得者为弗里希、丁百根。1987 年索罗用计量经济学建立总量生产函数以及导出增长方程 19691997 年有 42 个获诺贝尔经济学奖,有 9 人与计量经济学有关。2、计量经济学的内容体系 计量经济学分为广义计量经济学和狭义计量经济学划分依据为应用方法 广义计量经济学的利用经济理论、数学和统计学定量研究经济现象的经济计量方法的统称。包括回

6、归分析方法、投入产出分析方法、时间序列分析方法。狭义计量经济学主要是回归分析方法。计量经济学分为初级、中级、高级三个层次划分依据为建模理论与方法。由静态到动态。由线性到非线性。计量经济学分为理论计量经济学与应用计量经济学划分依据为研究对象和内容侧重面。理论计量经济学侧重理论与方法的数学证明与推导,与数理统计学极为密切。应用计量经济学以建立与应用计量经济学模型为主要内容,强调应用模型的经济学和经济统计学基础,侧重建立和应用模型过程中实际问题的处理。三、计量经济学的类型 单一方程:广义最小二乘法极大似然法工具变量法最小二乘法异方差自相关多重共线性预测检验理论估计方法 联立方程完全信息极大似然法三阶

7、段最小二乘法完全信息估计方法有限信息极大似然法间接最小二乘法二阶段最小二乘法有限信息估计方法估计方法识别理论 建立计量经济学模型的步骤与要点 计量经济学的研究主要归结为:设定理论模型、估计参数、验证理论、运用模型这四个步骤。首先,根据经济理论和观测经济现象取得的实践经验,确定经济变量之间的关系构成相应的数学方程,也就是设定理论模型。其次,设定理论模型以后,根据相应的统计数据对理论模型中的参数进行估计。进而,在此基础上对于已估计的参数,应用统计假设检验原理与方法进行检验。这就是验证理论的内容。所以验证理论也就是进行统计推断。如果经验数据与理论一致,就接受该理论;否则,就否定该理论。最后,估计的模

8、型一经验证,基本符合理论假设,就可以用来进行结构分析、政策评价和经济预测。运用模型的主要内容也就是结构分析、政策评价和经济预测。1、设定数学模型 在对社会经济现象进行定性分析的基础上,根据经济理论与实践经验,确定经济变量之间的关系,构成相应的反映客观经济过程运转机制的数学方程。例:计量经济学者为了检验边际消费倾向是大于 0 小于 1 建立消费函数:bxay (1-1)y:消费支出 x:收入ba,参数 dxdyb 为边际消费倾向(MPC)。为单一方程是确定性的关系 事实上经济变量之间不是确定性的关系有误差,随机取得几千户为样本得消费支出数据iy,可支配收入数据ix得散点图并不都在方程表示的直线上

9、。因为除了收入外还与家庭人员多少、构成、嗜好等有关。设为bxay其中为随机扰动项或误差项,代表了对消费不太重要的影响因素,是一个不可观察的随机项。例如,考察某农产品的供求平衡,依据经济理论,对农产品的需求(dQ)取决于农产品的价格(P),以及消费者的收入(Y)。如果这个变量之间呈线性关系,于是对农产品的需求函数可写成 1121110uYbPbbQd (1-2)其中1u为随机项,2,1,0 1 jibij为待估的参数。对农产品的供给(sQ)取决于农产品的价格(P),以及影响农产品生产的天气条件(W)。如果这个变量之间呈线性关系,于是对农产品的供给函数可写成 2222120uWbPbbQs (1-

10、3)其中2u为随机项,2,1,0 2 jibij为待估的参数。供求平衡的条件为:dQ=sQ。(1-4)由(1-2)、(1-3)、(1-4)可得一联立方程组。令Q为平衡销售量,所以Q=dQ=sQ 把上述(1-2)、(1-3)两个方程并在一起,就得到了一个反映农产品供求平衡的联立方程模型 22221201121110uWbPbbQuYbPbbQ (1-5)(1-5)是一个简单的联立方程模型,其中WYPQ,是变量,1u、2u是随机项。设立模型应考虑忽略次要因素,根据目的,便于处理。从真实性、可操作性两方面权衡。2、估计参数 根据统计资料对参数的符号与大小进行估计。参数指方程中的表示解释变量与被解释变

11、量之间数量关系的常系数。利用样本数据用最小二乘法估计出8.0b即得到每一收入中有 80%用于消费。估计参数所需资料有三种类型:时间序列资料(容易产生序列相关或自相关),横断面资料(普查资料等容易产生异方差问题)虚拟变量数据(0,1)3、验证理论 应用统计假设检验的原理与方法验证模型的变量的结合形式、结合程度 结合形式:变量之间是加减、乘除、乘方关系?方程式为直线、曲线关系 结合程度:检验参数估计值的符号、大小与经济理论是否相符 进行统计推断1121110uYbPbbQd 11b为负表示价格(P)与需求相反,12b为正消费者的收入(Y)与需求一致。这是经济意义的检验还有显著性检验、标准差检验、拟

12、合优度检验等。边际消费倾向8.0b是否接受该理论 4、运用模型 运用模型的主要内容也就是结构分析、政策评价和经济预测。结构分析:测定经济系统内经济变量之间的关系。最常用的是影响乘数 政策评价:在对投资政策、经营政策等进行可能效益和代价进行权衡选出最有利的政策。经济预测:5、计量经济学软件 计量经济学模型的应用 1、模型构成的 4 要素 1)变量 内生变量(或因变量)是由所研究系统内部确定的,换句话说,根据模型可以求出它们的值。它的严格定义是,它是一个有概率分布的随机变量,这种变量的分布参数是估计的联立方程中的元素。一般说来,它与模型的随机干扰项是相关的。内生变量对方程系统有作用并受其影响。外生

13、变量(或自变量)不是由所研究系统内部决定的,它们的值是在模型之外确定的,它的严格定义是,它或者是一组已知数,这就是没有概率分布的普通变数;或者是有边缘概率分布的随机变量。对于后一种情况,这种变量分布参数不是估计方程系统中的元素,它与模型的随机干扰项是不相关的。外生变量对方程系统有作用但不受它的影响。(包括政策变量:政府支出、利息率等,非政策变量:农业收成、汇率)内生变量的滞后变量如1tY,2tY等,称先决变量。先决变量与外生变量同样对方程系统有作用,与模型的随机干扰项是不相关的。通常把外生变量与内生变量的滞后变量统称先决变量。(1-5)中消费者的收入(Y)、影响农产品生产的天气条件(W)是外生

14、变量、它决定内生变量平衡销售量(Q)、农产品的价格(P)。内生变量和外生变量是相对的,同一变量对某个模型是外生的,而对另一个模型而言却是内生的。2)参数 包括参数隐含参数(随机误差项的概率分布)3)随机误差项 4)方程式 包含变量、参数、随机误差项的数学表达式。有 4 类 行为方程:描述居民、企业、政府等决策单位的经济行为,有宏观关系式、微观关系式 如居民的消费方程bxay 技术方程:由科学技术水平确定的生产技术关系的方程 如柯布-道格拉斯生产方程 生产函数ULAKQ ULKAQlnlnlnlnln Q总产量,K资本,L劳力 制度方程:根据法律、制度、政策所规定的数量关系式 如销售税金=销售收

15、入销售税率 定义方程:经济理论所确定的关系式 如国民收入=消费+投资 前两类最重要 2、模型的选择 1)常用的方程形式:一次方程、二次方程、双曲线方程、对数方程等 2)模型的选择的准则:方程形式与经济基本原理一致。两种都能表达选简单的。模型能概括实际经济现象也有预测的功能。第二章 单方程计量经济学模型理论与方法 线性回归模型 一、线性回归模型的特征 计量经济学模型分线性与非线性模型。在线性模型中,变量之间的关系呈线性关系。在非线性模型中,变量之间的关系呈非线性关系。线性回归模型是线性模型的一种。根据凯恩斯的绝对收入假设消费理论,认为消费是由收入唯一决定的,是收入的线性函数。随着收入的增加,消费

16、增加,但消费的增长低于收入的增长,即边际消费倾向递减。bYaC C:消费支出 Y:收入ba,参数 dYdCb 为边际消费倾向(MPC)10dYdC YCdYdC 计量经济学方程为 ubYaC 引入随机误差项,将变量之间的关系用随机线性方程来描述,用随机数学的方法估计参数,就是线性回归模型的特征。一般线性回归模型为:uxbxbbymm110 iimmiiuxbxbby110 ni,2,1 随机误差项包括:1、解释变量中被忽略的因素影响;2、观察误差的影响;3、模型设定误差的影响;4、其他随机因素的影响;二、线性回归模型的普遍性 一般经济现象为非线性的可以化为线性的。1、直接置换:拉弗曲线描述税收

17、s和税率r的关系为 2crbras 令221,rxrx 得21cxbxas 2、对数置换 如柯布-道格拉斯生产方程 生产函数ULAKQ可化为 ULKAQlnlnlnlnln Q总产量,K资本,L劳力 三、线性回归模型的基本假设 iimmiiuxbxbby110 ni,2,1 基本假设:1、mxxx,21为解释变量不是随机变量。之间互不相关 2、随机误差项具有:2)(,0)(iiuVaruE ni,2,1 3、随机误差项在不同样本点是独立的,不存在序列相关 0)(jiuuCov jinji ,2,1,4、随机误差项与解释变量之间不相关 0),(jjiuxCov ni,2,1 mj,2,1 5、随

18、机误差项服从正态分布),0(2Nui ni,2,1 一元线性回归的参数估计 一元线性回归模型 iiiuxbby10 (3-1)ni,2,1 满足:2)(,0)(iiuVaruE ni,2,1 0)(jiuuCov jinji ,2,1,0),(jiuxCov ni,2,1 nj,2,1),0(2Nui ni,2,1 一、最小二乘法(OLS)对yx,进行n次独立观测,得到n个观测如下nnyxyxyx,2211,其中ix表示x的第i次观测值,iy表示y的第i次观测值,在直角坐标系中描述出其散点图,对(3-1)作10,bb的最小二乘估计 即设 niiniiiuxbbyQ121210 (3-2)令 0

19、10bQbQ 得方程组 niiiiniiixxbbybQxbbybQ1101110002 02 (3-3)即 niniiiiyxbxbxnynbxnbn1112010 其中niixnx11,niiyny11 此方程组称正规方程组,其系数行列式为 niiniixxnxxnxnn1212 解此方程组得 10,bb的估计量10,bb为 xbybxxyyxxxxnyxnyxnxxnyxxnynnbniiniiiniiniiiniiniii01211211211 (3-4)记niniiixxxnxxxL11222 niniiiiixyyxnyxyyxxL11 niniiiyyynyyyL11222 于是

20、(3-4)式可写成 xxxyLLbxbyb10 (3-5)(3-5)式中的10,bb分别是10,bb的最小二乘估计量,所以 xbby10 (3-6)称为y关于x的经验线性回归方程,简称为线性回归方程,10,bb 称为回归系数,直线 xbby10称为回归直线。可以证明回归直线始终是通过点yx,的,因此有时为了计算简便,常常可利用平移坐标的方法适当地选择邻近yx,的点00,yx为新的坐标原点。设 0 xxxi,0yyyi,则有 0 xxx,0yyy xxxxLL,yxxyLL,yyyyLL 于是有 01001xxbyybLLbxxyx (3-7)例 以家庭为单位,某商品的需求量y与该商品价格x之间

21、的一组调查数据如下表(见表 3.1),求y对x的回归直线方程。表 3.1 商品价格x(元)1.0 2.0 2.0 2.3 2.5 2.6 2.8 3.0 3.3 3.5 商品需求量y(千克)5.0 3.0 3.5 2.7 2.4 2.5 2.0 1.5 1.2 1.2 解 从观测值的散点图(见图 3.1)上来看,一些点分布在直线附近,作一元线性回归比较合适。为求一元线性回归方程 xbby10 将所求计算列表如下(见表 3.2)图 3.1 y=-1.5753x+6.4383R2=0.9739012345600.511.522.533.54 表 1.2 i ix iy 2ix 2iy iiyx 1

22、 2 3 4 5 6 7 8 9 10 1.0 2.0 2.0 2.3 2.5 2.6 2.8 3.0 3.3 3.5 5.0 3.0 3.5 2.7 2.4 2.5 2.0 1.5 1.2 1.2 1.00 4.00 4.00 5.29 6.25 6.76 7.84 9.00 10.89 12.25 25.00 9.00 12.25 7.29 5.76 6.25 4.00 2.25 1.44 1.44 5.00 6.00 7.00 6.21 6.00 6.50 5.60 4.50 3.96 4.20 25.0 25.0 67.28 74.68 54.97 由此得x=2.5 y=2.5 n=1

23、0 10122278.45.228.67iixxxnxL 10153.75.25.21097.54iiixyyxnyxL 10122218.12251068.74iiyyynyL 58.178.453.71xxxyLLb 45.65.258.15.20 xbyb 故所求回归方程 xy58.145.6 这里回归系数58.11b表示商品的价格每增加 1 元,该商品的需求量平均减少1.58 千克。二、极大似然法(ML)一元线性回归模型 iiiuxbby10 (3-1)ni,2,1 满足:2)(,0)(iiuVaruE ni,2,1 0)(jiuuCov jinji ,2,1,0),(jiuxCov

24、ni,2,1 nj,2,1),0(2Nui ni,2,1 假设模型的参数估计为10,bb那么iy服从正态分布)(210iixbbNy)(21exp21)(2102iiixbbyyP)(21exp)2(121022/iinnxbbyL 2102)(21)2ln(lniixbbyL 求极值得 niiiniiixbbybxbbyb12101121000 0 即 niiiiniiixxbbyxbby11011002 02 得xxxyLLbxbyb10 三、参数估计量的性质:1、线性:10,bb是nyy 1的线性函数 iiiyxxxxb21)()(yxxxxii2)()(=iiiyxxxx2)()(ii

25、yc xbyb10=xycyniii1=iiyxcn)1(iiyd 2、无偏性 估计量是随机变量,对于不同的样本值会得到不同的估计值.我们希望估计值在未知参数真值附近,它的数学期望等于未知参数的真值,这就导致无偏性这个标准.定义 设),(21nXXX是未知参数的估计量,若)(E,则称是的无偏估计量 iiiEyxxxxbE21)()(=)(10iixbbc=120)()(bxxxxbiiiiixxxxx2)()(121)()()(bxxxxxxbiii 011010)(1bbxxbbnxbEyEbEi 3、有效性 22121)()(iniiiiicDycycDbD=222222)()()(xxx

26、xxxiii)()()()(1210bDxyDxbyDbD=n2222)(xxxi=(n122)(xxxi)2 高斯马尔柯夫定理:10 bb为10 bb的最佳线性无偏估计(最佳即在一切线性无偏估计中方差最小)4、22)(21iiyyn是2的无偏估计。下面来讨论回归分析中具有重要意义的分解公式,进而给出2的估计值。对于任意n组数据nnyxyxyx,2211,恒有 niiyy12niiiyy12niiyy12 其中iixbby10(ni,2,1),我们将iy与其均值y之间的差称为离差,将离差分解为 yyyyyyiiii 故 niiiyy12 niiiiyyyy12 niiiyy12niiiyy12

27、niiiiyyyy12 又 niiiiyyyy1niiiiyxbbxbby11010=niiiixxbxxbyy111 =niiniiixxbxxyyb122111=0 xxxyLbLb 故 niiiyy12 niiiyy12niiyy12 上式称平方和分解式。该式中三个平方和的意义如下:yyLniiiyy12 是nyyy,21这n个数据的离差平方和,它的大小描述了这n个数据的分散程度,称总离差平方和,称niiyy12为回归平方和,niiiyy12 就是Q,它反映了观测值iy偏离回归直线的程度,称剩余平方和或残差平方和,在分解公式的基础上可以证明2的估计值 22)(21iiyyn 因为niiy

28、y12=niixxb1221=xxLb21 而 21121bEbDbE=212bLxx 于是)(12niiyyE xxLbE21=xxLb212 而 22iiiyEyDyE=2102ixbb 且 22yEyDyE=210121xbbyDnnii=21021xbbn 故niiyyE12=niiynyE122 =212ynEyEnii =2102121021xbbnnxbbnii =2211020212211020222xnbxbnbnbxbxbbbnniii =2211020212211020222xnbxbnbnbxbxbnbnbnnii =221122121xnbxbnnii =211221

29、221xnxxxbnniinii =niixxbn122121=xxLbn2121 综上述可知)(2iiyyEniiyyE12-)(12niiyyE =xxxxLbLbn2122121 =22n 所以 2=2/)(2nyyEii 这表明22)(21iiyyn是2的无偏估计。多元线性回归模型的参数估计 一、多元线性回归模型 在许多实际问题中,随机变量y常与多个普通变量mxxx,21有着线性相关关系,即回归模型为uxbxbbymm110,其中),0(2Nu,这里mbbbb,210及2都是未知参数。设来自上述模型的1m维观测值为 ),;(112111mxxxy),;(222212mxxxy ),;(

30、21nmnnnxxxy 其中ijx是自变量jx的第i个观测值,iy是随机变量y的第i个观测值,它们满足 nnmmnnnmmmmuxbxbxbbyuxbxbxbbyuxbxbxbby2211022222211021112211101 其中),0(2Nui,(ni,2,1)且彼此独立,写成矩阵形式为 UXBY nyyyY21 nmnmmxxxxxxX1221111111 mbbbB10nuuuU21 像一元线性回归一样,我们希望由观测值得到其回归方程,首先用最小二乘法对未知参数mbbbb,210进行估计,其次对其回归方程进行显著性检验。令niimmiiixbxbxbbyQ1222110)(对Q求偏

31、导,令每个偏导等于零得方程组,该方程组经整理可写成如下正规方程组,)(2211002211022222121011212111mmmmmmmmmmmmxbxbxbyblblblbllblblbllblblbl 其中niiyny11,nkkiixnx11,=1,2,m nkjkjikijiijxxxxll1)(,mji,2,1,nkkikiiyyxxl10)(,mi,2,1,解此方程组便可得到mbbbb,210的估计值mbbbb,210,故m元线性回归方程为 mmxbxbxbby22110 例 拉弗曲线描述税收s和税率r的关系为 2crbras 令221,rxrx 得21cxbxas 已知某税收

32、y(亿元)与他的税率x(1/1000)有关,下表记录了相应的观测值,试找出x与y的关系式 表 1.8 x y 34 36 37 38 39 39 39 40 1.30 1.00 0.73 0.90 0.81 0.70 0.60 050 x y 40 41 42 43 43 45 47 48 0.44 0.56 0.30 0.42 0.35 0.40 0.41 0.60 解:由散点图(见图)看出用二次曲线去描述它较好,图 00.20.40.60.811.21.40102030405060 于是可设y与x之间的关系为 22210,0,Nuuxbxbby 令221,xxxx上式为 222110,0

33、,Nuuxbxbby 对这个二元线性回归模型经计算得,6875.4016651,6263.01602.101xy,3125.166916267092x 于是得正规方程 21021213125.16696875.406263.005.923151368518283649.111828344.221bbbbbbb 解方程得 484.180b,8205.01b,009301.02b 于是得回归方程为 21009301.08205.0484.18xxy 即x与y的关系为 2009301.08205.0484.18xxy 可进一步算出当11.44009301.028205.00 x时y 的最小值39.0

34、0y 即当这种税率x为 44/1000 左右时,税收y约为 0.39 二、多元线性回归模型参数估计的矩阵形式 1、最小二乘估计 多元线性回归模型的矩阵形式为 UXBY nyyyY21 nmnmmxxxxxxX1221111111 mbbbB10nuuuU21 如果模型的参数估计值已经得到则有 BXY 被解释变量的观察值与估计值之差的平方和为 niniiiimmiiiyyxbxbxbbyQ112222110)()()()(12BXYBXYeeenii 由最小二乘法参数估计值为 0)()(BXYBXYB 的解。求解过程如下 0)(BXXBBXYYXBYYB 0)2(BXXBYXBYYB 0BXXY

35、X YXBXX YXXXB1)(2、极大似然估计 多元线性回归模型之中 ),0(2Nui 所以 ),(2BXNyii 其中),1(21imiiixxxX 写出似然函数),(21nyyyPL 22/21exp)2(1nnniimmiiixbxbxbby1222110)(22/21exp)2(1nn)()(BXYBXY 对数似然函数为 )2ln(lnnL221)()(BXYBXY 对对数似然函数求极大值即求 0)()(BXYBXYB 得到YXXXB1)(与最小二乘法的估计一致。三、参数估计的量的性质 1、无偏性)()(1YXXXEBE)()(1UXBXXXE=BUXEXXB1)(这里利用了解释变量

36、与随机误差项不相关的假设 0UXE 2、有效性)()()(BEBBEBEBCov)(BBBBE)()(11XXXUUXXXE 11)()()(XXXUUEXXX 1)(XXUUE12)(XXI 12)(XX 这里利用了 YXXXB1)(=)()(1UXBXXX=UXXXB1)(根据高斯马尔柯夫定理在所有无偏估计量的方差中上述方差最小。所以该参数具有有效性。3、随机误差项的方差估计 )()(1UXBXXXXUXBBXYe UXXXXU1)(UXXXXI)(1=MU 这里M=XXXXI1)(为对称幂等阵 M=M MMMM2所以 MUUee )(eeE)(1UXXXXIUE=(2tr)(1XXXXI

37、=trtrI 2)(1XXXX=)1(2 mn 可得1)(2mneeE 方差的估计为12mnee 多元线性回归的统计检验 多元线性回归的统计检验包括:拟合优度检验、方程的显著性检验、和变量的显著性检验。一、拟合优度检验 1、一元线性回归的平方和分解:我们将iy与其均值y之间的差称为离差,将离差分解为 yyyyyyiiii 故 niiiyy12 niiiiyyyy12 niiiyy12niiiyy12niiiiyyyy12 又 niiiiyyyy1niiiiyxbbxbby11010=niiiixxbxxbyy111 =niiniiixxbxxyyb122111=0 xxxyLbLb 故 nii

38、iyy12 niiiyy12niiyy12 上式称平方和分解式。该式中三个平方和的意义如下:TSS=niiiyy12=yyL 是nyyy,21这n个数据的离差平方和,它的大小描述了这n个数据的分散程度,称总离差平方和,称 ESS=niiyy12为回归平方和,RSS=niiiyy12 就是Q,它反映了观测值iy偏离回归直线的程度,称剩余平方和或残差平方和,2、多元线性回归的平方和分解:niiiiyyyy1=)()(iiiiiyyyyyy=)(110iiimmiyyxbxbb)(iiyyy=)(0iiyyb)(11iiiyyxb)(iiimmyyxb)(iiyyy 由正规方程得)(iiyy=0)(

39、1iiiyyx=0 0)(iiimyyx 所以有niiiiyyyy1=0 即 TSS=RSS+ESS 对拟合得好的模型 总离差平方和与回归平方和比较接近。决定系数为拟合优度的标准。TSSRSSTSSESSr12 完全拟合时12r 一元时 TSS=yyL ESS=niiyy12=niixxb1221=xxLb21 所以xxyyxyyyxxLLLLLbr222进而定义x与y的相关系数 yyxxxyLLLr 相关系数反映了x与y的相关关系。从上式可看出,r的符号与xyL的符号相同,从而与回归系数b的符号一致。若r=0 时,则xyL=0,因此b=0。根据最小二乘法确定的回归直线平行于x,说明y的变化与

40、x无关。当1 r时,说明所有的点都在一条直线上,称x与y完全线性相关;当1r 时称完全正相关,当1r时,称完全负相关。而绝大多数情况为1 0 r,此时对给定的显著水平查相关系数表R,当 Rr 时,拒绝0H,认为相关系数显著,反之,当Rr 时,接受0H,认为x与y无显著相关关系。(见前例9739.02r)二、方程显著性检验 (一)假设检验 1.基本思想 概率性质的反证法 2.基本步骤 1)提出零假设、备择假设.2)寻找统计量.3)选择显著水平.4)统计量与临界值的比较 3.双尾检验与单尾检验 双尾检验0100:,:HH 单尾检验0100:,:HH 0100:,:HH 一般单尾检验更容易否定0H

41、单样本正态总体的假设检验 2已知,检验0100:,:HH)1,0(0NnXu 双尾 02HZZ接受 2未知,检验0100:,:HH )1(0ntnSXt 双尾 02),1(Hntt接受 查表问题:单尾检验 单尾表 查 单尾检验 双尾表 查2 双尾检验 单尾表 查2 双尾检验 双尾表 查(二)一元线性回归的t 检验 在求回归方程的计算过程中,并不需要事先假定x与y之间具有线性关系,即不管yx,在坐标平面上多么杂乱无章,总可给它配一条回归直线xbby10,显然所配直线是否有意义,即y与x是否确有线性关系。需进一步进行检验,下面来讨论如何检验uxbby10,2,0Nu这一假设是否合适,亦即检验 0H

42、:01b,1H:01b 的真假问题。由xxLbNb211,知 1,0111NLbbxx。由t分布的定义统计量 2212211nnLbbTxx=211ntLbbxx 在0H为真的条件下 221ntLbxx 对于给定的显著性水平,查自由度为2n的t分布临界值表,得临界值2t,由样本值计算统计量T的值t,若2 tt 则拒绝0H,认为回归效果显著。反之,若2 tt,则接受0H,认为回归效果不显著。例、某地区第一年到第六年之间用电量y与年次x的统计数据如表所示。表 年次ix 1 2 3 4 5 6 用电量iy(亿度)10.4 11.4 13.1 14.2 14.8 15.7 求y对x的回归方程,并在 0

43、1.0 下作显著性检验,解 作散点图,观察知y与x近似直线关系,因此设 uxbby10,计算得 5.3x27.13y5.17xxL9.18xyL87.20yyL 故08.15.179.181xxxyLLb,49.95.308.127.130b 所以线性回归方程为 xy08.149.9 又22nRSS=1121021iiixbbyn=ESSTSSn21=xyyyLbLn121=9.1808.187.2041=0.1145 0H:01b,1H:01b xxLbt 1=13.3514.6041=4005.0t 从而知回归效果显著。(三)一元线性回归的F检验 总离差平方和 TSS 的自由度1 nfTS

44、S,回归平方和 ESS 是由 1 个普通变量x对y的线性影响决定的,所以它的自由度1ESSf,前述已知残差平方和 RSS的自由度为2 nfRSS。所以有 RSSESSTSSfff 在0H为真的前提条件下,前述已知2RSS2)2(n,可以证明2ESS2)1(。由于ESS与RSS相互独立,由F分布的定义知F统计量 222nRSSESSF=2nRSSESS2,1nF 给定显著性水平查F分布表,由样本值计算F统计量的值F,如果FF 则拒绝0H,认为回归效果显著,反之FF 则接受0H认为回归效果不显著。(四)、多元线性回归模型的显著性F检验检验 下面检验方程是否显著,也就是检验假设0:210mbbbH是

45、否成立,作统计量)(1mnRSSmESSF 可以证明在假设0H成立时 1,mnmFF 这样对给定显著水平,可查F分布表得临界值1,mnmF,如果由观测值算出统计量F的值0F,使得1,0mnmFF,则拒绝0H,认为线性关系显著,否则接受0H,认为线性关系不显著。三、变量的显著性检验 因为)()()(BEBBEBEBCov12)(XX 以iic表示1)(XX的主对角线上的第i个元素则iiicbD2)(),(2iiiicbNb 方差的估计为12mnee ee)1(2 mn)1(1mntmneecbbtiiii 如果ix是显著的ib应该不为 0 设0H:0ib,1H:0ib 1mntt 这样对给定显著

46、水平,可查t分布表得临界值12/mnt,如果由观测值算出统计量t的值,使得12/mntt,则拒绝0H,认为ix显著,否则接受0H,认为ix不显著。多元线性回归的统计推断 一、多元线性回归的参数估计量的置信区间 YXXXB1)()1(111mntsbbmneecbbtbiiiii 1)(2/2/tttP 1)(112/2/biibistbbstbP 所以其置信区间为),(112/2/bibistbstb 二、多元线性回归的预测 (一)一元线性回归的预测 预测是回归分析的重要应用,当求得的回归方程xbby10经检验确认y与x有线性关系后,对给定的某个0 xx 可以以一定的置信度预测对应的y的观测值

47、的取值范围,这就是所谓对y的预测。我们来看预测问题,假定在0 xx 时y的相应量为0y 即有 00100uxbby,其中 20,0Nu,0y是个随机变量。而对任意给定的0 x,由回归方程0100 xbby可以算出y的一个回归值0 y,0 y 是0 xx 时y的估计,一般来说0 xx 时y的预测区间较y的估计0 y更有实用价值。1bDxxL2 2201)(xxLxnbD)()cov(110010bbbbEbb=xxLx2)()()cov(2)()()(12001000100bDxbDbbxxbDbDyD+)cov(2100bbx=221xxLxn+xxLx220 xxLxx202=xxLxxn2

48、0)(1 因为20100,xbbNy,而22001001,xxLxxnxbbNy,且因为 nyyyy,210 相互独立,2,0y,0 y 相互独立,故 2200011,0 xxLxxnNyy 或 1,0112000NLxxnyyxx 又由2RSS2)2(n,niiixbbyn1210221知222n2)2(n 于是 xxLxxnyy200011=xxLxxnyy2000112222nn2nt 给定置信度1,有P(xxLxxnyy20 0011 22nt)=1 故0y的置信度为1的预测区间为 xxxxLxxnntyLxxnnty20202020112,112 显然当0 x与x越接近,在给定的样本

49、观测值与置信度下,预测区间宽度越窄,预测也越精确,反之,精度越差,如果预测点远离 通常不能获得满意的结果。上例中 把80 x代入回归直线方程 xy08.149.9 得 13.18808.149.90y(亿度)又6n因此第 8 年用电量0y的置信度为 0.95 置信区间为 5.1725.206113384.0413.18,5.1725.206113384.0413.180025025.0tt 即56.19,75.16(二)多元线性回归的预测 BXY 对),1(002010mxxxX得预测值 BXy00(由000uBXy),0(20Nu得到的估计)求置信区间)()(100000000UXBXXXX

50、uBXBXyyye UXXXXu100)(0Ee)(100UXXXXuE=0)(0eVar=20Ee2100)(UXXXXuE)(1(0102XXXX)(1(,001020XXXXNe )1(11)(12201000mntmnmnXXXXyyt 即)1()(101000mntXXXXyyt 所以对置信水平1有0y的置信区间为 002/0)(1XXXXty0y002/0)(1XXXXty 例 某厂总成本、劳动量、用电量数据如下:月份 1 2 3 4 5 6 7 总成本y(万元)14.5 15.6 15.7 17.5 18.3 16.6 18 劳动量1x(万小时)1.9 2.1 2.1 2.4 2

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 工作报告

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com