计量经济学课件5讲课教案.ppt

上传人:豆**** 文档编号:62832255 上传时间:2022-11-22 格式:PPT 页数:133 大小:1.01MB
返回 下载 相关 举报
计量经济学课件5讲课教案.ppt_第1页
第1页 / 共133页
计量经济学课件5讲课教案.ppt_第2页
第2页 / 共133页
点击查看更多>>
资源描述

《计量经济学课件5讲课教案.ppt》由会员分享,可在线阅读,更多相关《计量经济学课件5讲课教案.ppt(133页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、end计量经济学课件5end 采采用用普普通通最最小小二二乘乘法法,估估计计线线性性回回归归模模型型的的参参数数从从而而得得到到OLS估估计计量量,要要使使估估计计量量具具有有令令人人满满意意的的性性质质,线线性性回回归归模模型型必必须须满满足一组假设条件。足一组假设条件。在在实实践践中中,如如果果某某些些假假设设条条件件不不能能满满足足,则则OLS法法就就不不再再适适用用于于模模型型的的估估计计。在在这这种种情况下,分析方法就需要改变。情况下,分析方法就需要改变。2end实践中可能碰到的一些常见问题如下:实践中可能碰到的一些常见问题如下:l l误误设设定定(Misspecification

2、或或specification error)l l多重共线性多重共线性(Multicollinearity)l l异方差性异方差性(Heteroscedasticity)l l自相关自相关(Autocorrelation)本本章章将将对对上上述述问问题题作作简简要要讨讨论论,主主要要介介绍绍问题的后果、检测方法和解决途径。问题的后果、检测方法和解决途径。3end第一节第一节 误设定误设定 采采用用OLS法法估估计计模模型型时时,实实际际上上有有一一个个隐含的假设隐含的假设,即,即模型是正确设定的模型是正确设定的。这这包包括括两两方方面面的的含含义义:函函数数形形式式设设定定正正确确和和解解释释

3、变变量量选选择择正正确确。但但在在实实践践中中这这个个假假设设却却不不一一定定能能实实现现。可可能能犯犯下下列列三三个个方面的错误:方面的错误:选择错误的函数形式选择错误的函数形式遗漏有关的解释变量遗漏有关的解释变量包括无关的解释变量包括无关的解释变量从而造成所谓的从而造成所谓的“误设定误设定”问题。问题。4end一一.选择错误的函数形式选择错误的函数形式 这类错误中比较常见的是这类错误中比较常见的是将非线性关系作将非线性关系作为线性关系处理为线性关系处理。函数形式选择错误,所建立。函数形式选择错误,所建立的模型便无法反映所研究现象的的模型便无法反映所研究现象的实际情况实际情况,会,会产生很严

4、重的后果。产生很严重的后果。除了除了双对数模型双对数模型,下面再介绍几种比较常,下面再介绍几种比较常见的非线性回归模型。这几种模型是:见的非线性回归模型。这几种模型是:半对数半对数模型,双曲函数模型和多项式回归模型模型,双曲函数模型和多项式回归模型。5end 1.半对数模型半对数模型 因变量和解释变量中一个为对数形式而另因变量和解释变量中一个为对数形式而另一个为线性的模型。因变量为对数形式的称为一个为线性的模型。因变量为对数形式的称为对数对数-线性模型线性模型(log-lin model)。解释变量为对。解释变量为对数形式的称为数形式的称为线性线性-对数模型对数模型(lin-log model

5、)。先介绍前者,其形式如下先介绍前者,其形式如下:对数对数-线性模型中线性模型中,斜率的含义是斜率的含义是Y的百分的百分比变动比变动,即解释变量即解释变量X变动一个单位引起的因变变动一个单位引起的因变量量Y的百分比变动的百分比变动。利用微分可以得出。利用微分可以得出:6end 这表明,斜率度量的是解释变量这表明,斜率度量的是解释变量X的单位的单位变动所引起的因变量变动所引起的因变量Y的的相对变动相对变动,即,即Y的的增增长率长率。由于对数由于对数-线性模型中斜率系数的这一含线性模型中斜率系数的这一含义,因而也叫义,因而也叫增长模型增长模型(growth model)。增长模型通常用于测度所关心

6、的经济变量增长模型通常用于测度所关心的经济变量(如(如GDP)的)的增长率增长率。例如,可以通过估计下。例如,可以通过估计下面的半对数模型面的半对数模型 得到一国得到一国GDP的年平均增长率的估计值,这的年平均增长率的估计值,这里里t为时间趋势变量。为时间趋势变量。7end实例:实例:1973-1987年间美国未偿付消费者信年间美国未偿付消费者信贷的增长贷的增长下表给出了下表给出了1973-1987年间美国未偿付消费年间美国未偿付消费者信贷的数据,者信贷的数据,Y 单位为百万美元单位为百万美元 表示表示未偿付消费者信贷额,未偿付消费者信贷额,t表示年份数,试估表示年份数,试估计未偿付消费者信贷

7、的年增长率并进行分析。计未偿付消费者信贷的年增长率并进行分析。8end年份年份Yt年份年份Yt1973190601119813665979197419936521982381115101975204963319834303821119762281624198451176812197726380851985592409131978308272619866460551419793475077198768554515198034938689end要估计未偿付消费者信贷的年增长率,即估要估计未偿付消费者信贷的年增长率,即估计以下模型:计以下模型:lnYt=1+2t+ut根据以上数据得到回归结果如下:根

8、据以上数据得到回归结果如下:10end回归系数均是统计显著的,回归方程显著成立。回归系数均是统计显著的,回归方程显著成立。对回归结果解释如下:对回归结果解释如下:回归系数回归系数0.0946表示未偿付消费者信贷表示未偿付消费者信贷Y的年的年增长率为增长率为9.46%.对截距对截距12.007解释如下,解释如下,当当t=0时,时,lnY0=12.007,即当即当t=0时,时,Y0163911.7,即,即1973年初未偿付年初未偿付消费者信贷量为消费者信贷量为163911.7百万美元。百万美元。11end线性线性-对数模型对数模型的形式如下:的形式如下:可用微分得到可用微分得到因此因此这表明这表明

9、上式表明,上式表明,Y的绝对变动量等于的绝对变动量等于 乘以乘以X的的相对变动量相对变动量。因此。因此,线性线性-对数模型通常用对数模型通常用于研究解释变量每变动于研究解释变量每变动1%引起的因变量的引起的因变量的绝对变动量是多少这类问题。绝对变动量是多少这类问题。12end实例:实例:1973-1987年美国年美国GNP与货币供给间的与货币供给间的关系关系下表给出了下表给出了1973-1987年间美国年间美国GNP与货币供与货币供给的数据,给的数据,Y表示表示GNP,X表示货币供给表示货币供给 用用M2度量度量 单位均为亿美元。试估计货币供给每单位均为亿美元。试估计货币供给每增加一个百分点,

10、增加一个百分点,GNP的绝对变动量。的绝对变动量。13end年份年份YX年份年份YX19731359.3861.019813052.61795.519741472.8908.519823166.01954.019751598.4 1023.219833405.72185.219761782.8 1163.719843772.22363.619771990.5 1286.719854014.92562.619782249.7 1389.019864240.32807.719792508.2 1500.219874526.72901.019802723.0 1633.114end根据以上数据估计以

11、下模型:根据以上数据估计以下模型:Yt=1+2lnXt+ut得到回归结果如下:得到回归结果如下:15end回归系数均是统计显著的,回归方程显著成立。回归系数均是统计显著的,回归方程显著成立。对回归结果解释如下:对回归结果解释如下:回归系数回归系数2584.8表示货币供给每增加一个百分表示货币供给每增加一个百分点,点,GNP的绝对变化量为的绝对变化量为25.848亿美元。亿美元。16end2.双曲函数模型双曲函数模型双曲函数模型的形式为:双曲函数模型的形式为:不难看出,这是一个仅存在变量非线性的模不难看出,这是一个仅存在变量非线性的模型,很容易用重新定义的方法将其线性化。型,很容易用重新定义的方

12、法将其线性化。双曲函数模型的特点是,当双曲函数模型的特点是,当X趋向无穷时,趋向无穷时,Y趋向趋向 0,反映到图上,就是当,反映到图上,就是当X趋向无穷时,趋向无穷时,Y将无限靠近其渐近线(将无限靠近其渐近线(Y=0)。)。双曲函数模型通常用于描述著名的双曲函数模型通常用于描述著名的恩格尔曲恩格尔曲线和菲利普斯曲线线和菲利普斯曲线。17end3.多项式回归模型多项式回归模型多多项项式式回回归归模模型型通通常常用用于于描描述述生生产产成成本本函函数数,其一般形式为:其一般形式为:多项式回归模型中,解释变量多项式回归模型中,解释变量X以不同幂次以不同幂次出现在方程的右端。这类模型也仅存在变量出现在

13、方程的右端。这类模型也仅存在变量非线性,因而很容易线性化,可用非线性,因而很容易线性化,可用OLS法估法估计模型。计模型。其中其中Y表示总成本,表示总成本,X表示产出,表示产出,P为多项为多项式的阶数,一般不超过式的阶数,一般不超过四阶四阶。18end二二.模型中遗漏有关的解释变量模型中遗漏有关的解释变量 模模型型中中遗遗漏漏了了对对因因变变量量有有显显著著影影响响的的解解释释变变量量的的后后果果是是:将将使使模模型型参参数数估估计计量量不不再再是无偏估计量是无偏估计量。下面用一个简单例子说明:下面用一个简单例子说明:设正确模型为设正确模型为Y=0+1X1+2X2+u(5.9)而实际估计的模型

14、为而实际估计的模型为Y=0+1X1+u(5.10)也就是说忽略了对也就是说忽略了对Y有重要影响的变量有重要影响的变量X2估计式估计式(5.10),得,得19end而由式而由式(5.9)有有将式将式(5.12)代入式代入式(5.11),得,得取期望值,取期望值,得得20end上式右边第三项等于零,而第二项方括号中上式右边第三项等于零,而第二项方括号中内容可以看做回归方程内容可以看做回归方程X2=+X1+u中斜率中斜率系数的估计量系数的估计量 。可以预期,。可以预期,X1和和X2之间存之间存在一定程度的相关,从而第二项不等于在一定程度的相关,从而第二项不等于0,因此,因此,是真实参数是真实参数 1

15、的一个有偏估计量的一个有偏估计量。遗漏有关的解释变量将使参数估计量产生偏倚。遗漏有关的解释变量将使参数估计量产生偏倚。21end三三.包括无关的解释变量包括无关的解释变量 模模型型中中包包括括无无关关的的解解释释变变量量,参参数数估估计计量量仍仍无无偏偏,但但会会增增大大估估计计量量的的方方差差,即即增增大大误差。误差。设正确模型为设正确模型为Y=0+1X1+u(5.13)而实际估计的模型为而实际估计的模型为Y=0+1X1+2X2+u(5.14)也就是说也就是说X2与与Y无关,因而应有无关,因而应有 2=0可以证明可以证明 ,即,即 是真实参数是真实参数 1的无的无偏估计量。偏估计量。22en

16、d其中其中r12是是X1和和X2的相关系数。的相关系数。故模型中包括无关的解释变量,参数估计量故模型中包括无关的解释变量,参数估计量仍无偏,但会增大估计量的方差,即增大误仍无偏,但会增大估计量的方差,即增大误差。差。23end 四四.解决解释变量误设定问题的原则解决解释变量误设定问题的原则 在模型设定中的一般原则是在模型设定中的一般原则是尽量不漏掉有尽量不漏掉有关的解释变量关的解释变量。因为。因为估计量有偏比增大误差更估计量有偏比增大误差更严重严重。但如果方差很大,得到的无偏估计量也。但如果方差很大,得到的无偏估计量也没有多大意义,因此也没有多大意义,因此也不宜随意乱增加解释变不宜随意乱增加解

17、释变量量。在回归实践中,有时要准确判断某个变量在回归实践中,有时要准确判断某个变量是否应该作为解释变量包括在方程中不是一件是否应该作为解释变量包括在方程中不是一件容易的事。下面给出一些判断准则。容易的事。下面给出一些判断准则。24end3.:该变量加进方程中后,:该变量加进方程中后,是否增大?是否增大?选择解释变量的四条准则选择解释变量的四条准则1.理论理论:从理论上看,该变量是否应该作为解:从理论上看,该变量是否应该作为解释变量包括在方程中?释变量包括在方程中?2.t检验检验:该变量的系数是否显著?:该变量的系数是否显著?4.偏倚偏倚:该变量加进方程中后,其它变量的:该变量加进方程中后,其它

18、变量的系数估计值是否显著变化?系数估计值是否显著变化?如果对四个问题的回答都是如果对四个问题的回答都是肯定的肯定的,则该变,则该变量应该包括在方程中;量应该包括在方程中;如果对四个问题的回答都是如果对四个问题的回答都是“否否”,则该变则该变量是无关变量,可以安全地从方程中删掉它。量是无关变量,可以安全地从方程中删掉它。这是两种容易决策的情形。这是两种容易决策的情形。25end 但但在在很很多多情情况况下下,这这四四项项准准则则的的判判断断结结果果会会出出现现不不一一致致。例例如如,有有可可能能某某个个变变量量加加进进方方程后,程后,增大,但该变量不显著。增大,但该变量不显著。在在这这种种情情况

19、况下下,一一般般而而言言采采用用的的办办法法是是将将理理论论准准则则放放在在第第一一位位,否否则则产产生生不不正正确确结结果的风险很大。果的风险很大。26end五五.检验误设定的检验误设定的RESET方法方法 上上面面给给出出了了选选择择解解释释变变量量的的四四条条准准则则。但但有有时时只只凭凭这这些些准准则则并并不不能能确确定定设设定定是是最最恰恰当当的的,这这种种情情况况下下,可可使使用用一一些些更更正正规规的的检检验方法来检验验方法来检验误设定误设定。这这类类方方法法相相当当多多,有有一一、二二十十种种,这这里里仅仅介介绍绍拉拉姆姆齐齐(J.B.Ramsey)的的回回归归设设定定误误差检

20、验法差检验法(RESET法)。法)。27end RESET检验法的思路检验法的思路 RESET检验法的思路检验法的思路是在要检验的回归是在要检验的回归方程中加进方程中加进 等项作为解释变量,然等项作为解释变量,然后看结果是否有显著改善。如有,则可判断后看结果是否有显著改善。如有,则可判断原方程存在遗漏有关变量的问题或其它的误原方程存在遗漏有关变量的问题或其它的误设定问题。设定问题。直观地看,这些添加的项是任何可能的直观地看,这些添加的项是任何可能的遗漏变量或错误的函数形式的遗漏变量或错误的函数形式的替身替身,如果这些替身能够通过如果这些替身能够通过F检验检验,表明它们表明它们改善了原方程的拟合

21、状况,则有理由说原方改善了原方程的拟合状况,则有理由说原方程存在误设定问题。程存在误设定问题。28end 等项形成多项式函数形式,等项形成多项式函数形式,多项式是一种强有力的曲线拟合工具,因而多项式是一种强有力的曲线拟合工具,因而如果存在误设定,则用这样一个工具可以很如果存在误设定,则用这样一个工具可以很好地代表它们。好地代表它们。如果不存在误设定,则可以预期,这如果不存在误设定,则可以预期,这些新添加项的些新添加项的系数不显著异于系数不显著异于0,因为不存,因为不存在让它们做替身的东西。在让它们做替身的东西。29endRESET检验法的步骤检验法的步骤拉姆齐拉姆齐RESET检验的具体步骤是:

22、检验的具体步骤是:(1)用用OLS法估计要检验的方程,得到法估计要检验的方程,得到(2)由上一步得到的值由上一步得到的值 (i=1,2,n),),计算计算 ,然后用,然后用OLS法估计:法估计:(3)用用F检验比较两个方程的拟合情况(类似检验比较两个方程的拟合情况(类似于上一章中于上一章中联合假设检验联合假设检验采用的方法),采用的方法),如果如果两方程总体拟合情况两方程总体拟合情况显著不同,则得出显著不同,则得出原方程可能存在误设定的结论。原方程可能存在误设定的结论。30end使用的检验统计量为:使用的检验统计量为:其中:其中:RSSM为第一步中回归(有约束回归)为第一步中回归(有约束回归)

23、的残差平方和,的残差平方和,RSS为第二步中回归(无约为第二步中回归(无约束回归)的残差平方和,束回归)的残差平方和,M为约束条件的个为约束条件的个数,这里是数,这里是M=3。拉姆齐拉姆齐RESET检验检验仅能检验误设定的存在仅能检验误设定的存在,而不能指出是哪一类的误设定,即不能得到而不能指出是哪一类的误设定,即不能得到正确的模型是什么。另一方面,如果模型设正确的模型是什么。另一方面,如果模型设定正确,定正确,RESET检验能够排除误设定的存在,检验能够排除误设定的存在,转而去查找其它方面的问题。转而去查找其它方面的问题。31end第二节第二节 多重共线性多重共线性 应用应用OLS法的一个假

24、设条件是:法的一个假设条件是:矩矩阵阵X的的秩秩=K+1N。即即自自变变量量之之间间不不存存在在严严格格的的线线性性关关系系,观观测测值值个个数数大大于待估计的参数的个数于待估计的参数的个数。否否则则,OLS估估计计值值的的计计算算无无法法进进行行,估估计计过过程程由由于于数数学学原原因因而而中中断断,就象分母为就象分母为0一样。一样。32end 这两种情况都很罕见。但经济变量这两种情况都很罕见。但经济变量之间存在之间存在近似的线性关系近似的线性关系是很常见的。是很常见的。当当某某些些解解释释变变量量高高度度相相关关时时,尽尽管管估估计计过过程程不不会会中中断断,但但会会产产生生严严重重的的估

25、估计计问问题题,这这种种现现象象称称为为多多重重共共线线性性。解解释释变变量量间间存存在在严严格格线线性性相相关关关关系系时时,称称为为完全的多重共线性完全的多重共线性。33end一、一、多重共线性的定义多重共线性的定义多多重重共共线线性性是是指指解解释释变变量量Xi(i=1,2,k)之间存在之间存在完全的完全的或或近似的近似的线性关系。线性关系。可分为可分为完全完全和和不完全多重共线性不完全多重共线性:完完全全多多重重共共线线性性是是指指rank(X)k1,X矩矩阵阵的的列列向向量量线线性性相相关关,至至少少有有一一列列向向量量可可以以由由其它列向量线性表示。其它列向量线性表示。34end例

26、例如如:在在回回归归模模型型Y=b0+b1X1+b2X2+u中中,X2=X1,为为不不为为0的的常常数数,这这时时X2与与X1的的相相关关系系数数为为1,解解释释变变量量X2对对因因变变量量Y的的作作用用可由可由X1完全替代。完全替代。不不完完全全多多重重共共线线性性是是指指解解释释变变量量Xi之之间间存存在在着着近似的线性关系近似的线性关系。例例如如:X2=X1+,为为随随机机项项,X2与与X1的的相关系数近似等于相关系数近似等于1。35end二、二、多重共线性的原因多重共线性的原因产产生生多多重重共共线线性性的的原原因因主主要要有有以以下下三三个个方面:方面:36end1.有关经济变量存在

27、相似变化趋势有关经济变量存在相似变化趋势时时间间序序列列样样本本中中,某某些些变变量量的的行行为为方方式式相相同同,变变化化增增量量近近似似等等比比,出出现现同同步步增增长长或或同同步步下下降降的的趋趋势势。这这些些变变量量的的样样本本数数据据就就会会存存在在某某些些近近似似的的比比例例关关系系,若若把把这这些些变变量量作作解解释释变变量,就会产生多重共线性。量,就会产生多重共线性。横横截截面面数数据据也也有有可可能能产产生生多多重重共共线线性性,例例如如在在研研究究企企业业生生产产函函数数时时,资资本本投投入入和和劳劳动动力力投入几乎是高度线性相关的。投入几乎是高度线性相关的。37end2.

28、滞后变量的引入滞后变量的引入在在经经济济计计量量模模型型中中,需需要要用用滞滞后后变变量量来来反反映映真真实实的的经经济济关关系系,同同一一变变量量的的前前后后期期之之值值很很可可能能是是高高度度线线性性相相关关的的。(关关于于滞滞后后变变量量将将在在第六章介绍第六章介绍)38end3.样本资料原因样本资料原因在在(总总体体)理理论论模模型型中中不不存存在在多多重重共共线线性性,但但在在特特定定的的样样本本数数据据中中存存在在某某种种程程度度的的多多重重共共线性。线性。(纯粹是由样本数据引起的纯粹是由样本数据引起的.)39end三、三、多重共线性的影响后果多重共线性的影响后果 若若完完全全多多

29、重重共共线线性性则则无无法法估估计计模模型型参参数数,不完全多重共线性的影响后果如下:不完全多重共线性的影响后果如下:1.不不改改变变参参数数估估计计量量的的无无偏偏性性。对对于于不不完完全全多多重重共共线线性性,参参数数OLS估估计计量量仍仍为为BLUE。2.各共线变量的参数的各共线变量的参数的OLS估计量方差估计量方差很大,即估计值精度很低很大,即估计值精度很低。(。(BLUE表明在表明在各线性无偏估计量中方差最小各线性无偏估计量中方差最小,但不等于方,但不等于方差的值很小。)差的值很小。)40end例如:例如:Yt=0+1X1t+2X2t+ut其中其中r12是是X1和和X2的相关系数。的

30、相关系数。当当r12接近接近1时,时,将非常高。将非常高。41end 3.由于由于若干个若干个X变量共变变量共变,它们各自对,它们各自对因变量的影响无法确定。因变量的影响无法确定。4.各共线变量系数估计量的各共线变量系数估计量的t值低值低,使得,使得犯犯第第类错误类错误的可能性增加。的可能性增加。由于各共线变量的参数的由于各共线变量的参数的OLS估计量方估计量方差大,因而系数估计量的差大,因而系数估计量的t值低,使得犯第值低,使得犯第类错误(类错误(接受错误的原假设接受错误的原假设H0:j=0)的可)的可能性增加,容易将本应保留在模型中的解释能性增加,容易将本应保留在模型中的解释变量舍弃了。变

31、量舍弃了。42end三、多重共线性的判别和检验三、多重共线性的判别和检验 1根据回归结果判别根据回归结果判别 判判别别是是否否存存在在多多重重共共线线性性的的最最简简单单方方法法是是分分析回归结果。如果发现析回归结果。如果发现:(1)系数估计值的符号不对系数估计值的符号不对;(2)某些重要的解释变量某些重要的解释变量t值低值低,而,而R2不低不低;(3)当当一一不不太太重重要要的的解解释释变变量量被被删删除除后后,回回归归结果显著变化结果显著变化。则则可可能能存存在在多多重重共共线线性性。其其中中上上述述第第二二种种现现象象是多重共线性存在的典型迹象。是多重共线性存在的典型迹象。此此方方法法简

32、简便便易易行行,因因而而是是实实践践中中最最常常用用的的方方法,缺点是无法确诊。法,缺点是无法确诊。43end 2使用相关矩阵检验使用相关矩阵检验 统统计计软软件件一一般般提提供供各各解解释释变变量量两两两两之之间间的的相相关关系系数数矩矩阵阵,如如发发现现某某些些相相关关系系数数高高(绝绝对对值值高高于于0.8或或0.90),则则表表明明多多重重共线性存在。共线性存在。但但即即使使解解释释变变量量两两两两之之间间的的相相关关系系数数都都低低,也也不不能能排排除除存存在在多多重重共共线线性性的的可可能能性。性。44end3.使用使用VIF检验检验 VIF是方差膨胀因子的英文是方差膨胀因子的英文

33、(variance inflation factors)缩写缩写,这是一种比较正规的检这是一种比较正规的检验方法。验方法。该方法通过检查该方法通过检查指定的解释变量指定的解释变量能够被回能够被回归方程中归方程中其它全部解释变量其它全部解释变量所解释的程度来检所解释的程度来检测多重共线性。测多重共线性。方程中每个解释变量有一个方程中每个解释变量有一个VIF,该,该VIF是关于多重共线性使是关于多重共线性使相应的系数估计量的方差相应的系数估计量的方差增大了多少的一个估计值。增大了多少的一个估计值。45endVIF检验的具体步骤如下检验的具体步骤如下:设原方程为设原方程为Y=0+1X1+2X2+kX

34、k+u要计算要计算k个不同的个不同的VIF,每个,每个Xi一个,分三步:一个,分三步:(1)Xi对原方程中其它全部解释变量进行对原方程中其它全部解释变量进行OLS回归回归.例如,若例如,若i=1,则回归下面的方程则回归下面的方程X1=0+2X2+3X3+kXk+v(2)计算计算 的方差膨胀因子的方差膨胀因子VIF。46end(3)分析多重共线性的程度分析多重共线性的程度VIF越高,多重共线性的影响越严重越高,多重共线性的影响越严重。由于。由于没有没有VIF临界值表,只能使用经验法则:临界值表,只能使用经验法则:若若 5 则存在严重多重共线性。也则存在严重多重共线性。也有人建议用有人建议用VIF

35、10作为存在严重多重共线作为存在严重多重共线性的标准,特别是解释变量多的情形应当如性的标准,特别是解释变量多的情形应当如此。此。需要指出的是,所有需要指出的是,所有VIF值都低,并不能排值都低,并不能排除严重多重共线性的存在。除严重多重共线性的存在。47end4通过条件指数检验通过条件指数检验 条件指数条件指数(Condition index)是)是X X矩阵矩阵的最大和最小的最大和最小特征根特征根之比的之比的平方根平方根,条件指条件指数高,表明存在多重共线性数高,表明存在多重共线性。至于什么程度。至于什么程度算高,也没有一个绝对的标准。通常认为大算高,也没有一个绝对的标准。通常认为大于于10

36、即存在多重共线性,大于即存在多重共线性,大于30表明存在严表明存在严重多重共线性。大多数统计软件提供此检验重多重共线性。大多数统计软件提供此检验值。值。48end四四 解决多重共线性的方法解决多重共线性的方法思路:加入额外信息。思路:加入额外信息。具体方法有以下几种具体方法有以下几种 1增加数据增加数据 多多重重共共线线性性实实质质上上是是数数据据问问题题,因因此此,增增加加数数据据就就有有可可能能消消除除或或减减缓缓多多重重共共线线性性,具具体体方方法法包包括括增增加加观观测测值值、利利用用不不同同的的数数据据集或采用新的样本集或采用新的样本。49end例例5.1需求函数需求函数Yt=1+2

37、Xt+3Pt+ut 在在时间序列时间序列数据中,收入数据中,收入X和价格和价格P往往往往高度相关,会产生多重共线性。高度相关,会产生多重共线性。但在但在横截面数据横截面数据中,则不存在这个问题,中,则不存在这个问题,因为某个特定时点因为某个特定时点P为常数。如果取一横截面为常数。如果取一横截面样本(如从样本(如从5000个家庭取得的数据),则可用个家庭取得的数据),则可用来估计模型来估计模型Yi=1+2Xi+ui 然后将得到的估计值然后将得到的估计值 作为一个约束条作为一个约束条件(件(2=)施加于时间序列数据的回归计)施加于时间序列数据的回归计算中,即估计算中,即估计Yt-Xt =1+3Pt

38、+ut,得到,得到 ,。50end 2对模型施加某些约束条件对模型施加某些约束条件 在存在多重共线性的模型中,依据在存在多重共线性的模型中,依据经济理论施加某些约束条件,将减小系经济理论施加某些约束条件,将减小系数估计量的方差。数估计量的方差。如在如在CobbDouglas生产函数中加生产函数中加进规模效益不变的约束,可解决资本和进规模效益不变的约束,可解决资本和劳动的高度相关而引起的多重共线性问劳动的高度相关而引起的多重共线性问题。题。51end 3删除一个或几个共线变量删除一个或几个共线变量 这样做,实际上就是利用给定数据估这样做,实际上就是利用给定数据估计较少的参数,从而降低对观测信息的

39、需计较少的参数,从而降低对观测信息的需求,以解决多重共线性问题。删除哪些变求,以解决多重共线性问题。删除哪些变量,可根据量,可根据假设检验假设检验的结果确定。的结果确定。应注意的是,这种做法可能会使得到应注意的是,这种做法可能会使得到的的系数估计量产生偏倚系数估计量产生偏倚,因而需要权衡利,因而需要权衡利弊。弊。52end4将模型适当变形将模型适当变形例例5.2某商品的需求函数为:某商品的需求函数为:其中:其中:Q Q=需求量,需求量,X=收入,收入,P=该商品的该商品的价格,价格,P*=替代商品的价格,在实际数据中,替代商品的价格,在实际数据中,P和和P*往往呈同方向变动,高度相关,模型存往

40、往呈同方向变动,高度相关,模型存在多重共线性。在多重共线性。如果仅要求在知道两种商品的如果仅要求在知道两种商品的相对价格相对价格变动变动时,时,对需求量进行预测对需求量进行预测,则可将需求函数变,则可将需求函数变为:为:就可以解决多重共线性问题。就可以解决多重共线性问题。53end例例5.3有有滞后变量滞后变量的情形的情形 Yt=1+2Xt+3 Xt-1+ut 一般而言,一般而言,Xt和和Xt 1往往往往高度相关高度相关,将,将模型变换为:模型变换为:Yt=1+2(Xt-Xt 1)+3 Xt-1+ut 其中其中3=3+2 经验表明:经验表明:Xt和和Xt 1的相关程度要远的相关程度要远远小于和

41、远小于和Xt和和Xt 1的相关程度,因而这种变的相关程度,因而这种变换有可能消除或减缓多重共线性。换有可能消除或减缓多重共线性。54end 5主成分法主成分法 可将可将共线变量共线变量组合在一起形成一个组合在一起形成一个综合综合变量变量,用它来代表这组变量。,用它来代表这组变量。构造综合变量构造综合变量的最常用方法是主成分法,的最常用方法是主成分法,作法是对全部解释变量运用作法是对全部解释变量运用主成分分析主成分分析以得到以得到主成分,主成分,每个主成分每个主成分是全部解释变量的线性组是全部解释变量的线性组合,合,如如C1=1X1+2X2+kXk 55end 各主成分之间互不相关各主成分之间互

42、不相关,用很少几个主,用很少几个主成分就可以解释全部成分就可以解释全部X变量的绝大部分方差,变量的绝大部分方差,因而在出现多重共线性时,可以用因而在出现多重共线性时,可以用主成分主成分替替代代原有解释变量原有解释变量进行回归计算,然后再将所进行回归计算,然后再将所得到的系数还原成原模型中的参数估计值。得到的系数还原成原模型中的参数估计值。56end 五五.处理多重共线性问题的原则处理多重共线性问题的原则 1.多多重重共共线线性性是是普普遍遍存存在在的的,轻轻微微的的多多重共线性问题可不采取措施重共线性问题可不采取措施。2.严严重重的的多多重重共共线线性性问问题题,一一般般可可根根据据经经验验或

43、或通通过过分分析析回回归归结结果果发发现现。如如影影响响系系数数的的符符号号,重重要要的的解解释释变变量量t值值很很低低。要要根根据据不不同情况采取必要措施。同情况采取必要措施。3.如果如果模型仅用于预测模型仅用于预测,则,则只要拟合程只要拟合程度好,可不处理多重共线性问题度好,可不处理多重共线性问题,存在多重,存在多重共线性的模型用于预测时,往往不影响预测共线性的模型用于预测时,往往不影响预测结果。结果。57end第三节第三节 异方差性异方差性 上上面面讨讨论论了了误误设设定定和和多多重重共共线线性性问问题题。回回顾顾应应用用OLS法法所所需需假假设设条条件件,其其中中大大部部分分是有关是有

44、关扰动项扰动项的统计假设,它们是:的统计假设,它们是:(1)E(ut)=0,t=1,2,n.扰动项均值为扰动项均值为0(2)Cov(ui,uj)=0,ij.扰动项相互独立扰动项相互独立(3)Var(ut)=2,t=1,2,n.常数方差常数方差(4)ut N(0,2).).正态性正态性58end 对于对于(1),可论证其合理性。,可论证其合理性。而而第第(4)条条,也也没没有有多多大大问问题题。大大样样本即可假定扰动项服从正态分布。本即可假定扰动项服从正态分布。而而对对于于(2),(3)两两条条,则则无无法法论论证证其其合理性。合理性。实实际际问问题题中中,这这两两条条不不成成立立的的情情况况比

45、比比比皆皆是是。下下面面将将讨讨论论异异方方差差性性和和自自相相关关的的情形。情形。59end 一、一、异方差性及其后果异方差性及其后果 1 1定义定义 若若Var(ut)=2=常数的假设不成立,即常数的假设不成立,即 Var(ut)=t2常常数数,则则称称扰扰动动项项具具有有异异方方差性差性。2可能产生异方差的场合可能产生异方差的场合 解释变量取值解释变量取值变动幅度大时变动幅度大时。异异方方差差主主要要发发生生在在横横截截面面数数据据的的情情况况,时时间间序序列列中中一一般般不不会会发发生生,除除非非时时间间跨跨度度过过大。大。60end 例例5.4Yi=+Xi+ui 其其中中:Y为为指指

46、定定规规模模和和组组成成的的家家庭庭每每月月消消费费支支出出,X为为这这样样的的家家庭庭的的每每月月可可支配收入支配收入.在在X的的N个个观观测测值值横横截截面面样样本本中中,某某些些家家庭庭接接近近于于勉勉强强维维持持生生存存的的水水平平,另另一些家庭则有很高的收入。一些家庭则有很高的收入。61end 低低收收入入家家庭庭的的消消费费支支出出不不大大可可能能离离开开他他们们的的均均值值E(Y)过过远远,太太高高无无法法支支持持,太太低低则则消消费费将将处处于于维维持持生生存存的的水平之下。水平之下。因因此此,低低收收入入家家庭庭消消费费支支出出额额的的波波动动应应当当较较小小,因因而而扰扰动

47、动项项具具有有较较小小的的方方差差。而而高高收收入入家家庭庭则则没没有有这这种种限限制,其扰动项可能有较大的方差。制,其扰动项可能有较大的方差。这就意味着异方差性。这就意味着异方差性。62end 3异方差性的后果异方差性的后果 (1)参数)参数OLS估计量估计量不再具有最小方不再具有最小方差差.异方差性不破坏异方差性不破坏OLS估计量的无偏性,估计量的无偏性,但不再是有效的,也不具有但不再是有效的,也不具有渐近有效性渐近有效性。(2)系数的显著性检验失去意义系数的显著性检验失去意义在异方差性情况下,矩阵在异方差性情况下,矩阵 主对角主对角元素不再是元素不再是OLSOLS估计量真实方差估计量真实

48、方差的的无偏估计无偏估计量量,从而导致,从而导致系数的置信区间和假设检验系数的置信区间和假设检验结果不可信赖。结果不可信赖。63end二、二、异方差性的检验异方差性的检验 常用的检验方法有:常用的检验方法有:斯斯皮皮尔尔曼曼等等级级相相关关检检验验法法(Spearman Rank Relation test)戈戈德德弗弗尔尔德德匡匡特特检检验验法法(Goldfeld Quandt test)格里瑟格里瑟检验法(检验法(Glesjer test)帕克帕克检验法(检验法(Park test)怀特怀特检验法检验法 (Whites General Heteroscedasticity test)64e

49、nd 1 1斯皮尔曼等级相关斯皮尔曼等级相关检验法检验法 思思路路:对对异异方方差差性性的的研研究究转转化化为为对对u ut t与与X Xt t的相关程度的相关程度的研究。的研究。由由于于扰扰动动项项无无法法观观测测,因因而而用用残残差差代代替替之之,转转化化为为对对e et t与与X Xt t的的相相关关程程度度的的研研究究,若若e et t与与X Xt t高度相关高度相关,则可推断异方差性存在。,则可推断异方差性存在。65end在在此此无无法法用用相相关关系系数数来来检检验验,因因为为e et t与与X Xt t的的相关系数恒等于相关系数恒等于0 0:因而改用因而改用X Xt t和和e e

50、t t的的等级相关系数等级相关系数检验检验e et t和和X Xt t的相关程度。的相关程度。66end等级相关系数的计算步骤等级相关系数的计算步骤(1 1)将两变量的)将两变量的相应观测值相应观测值分别按升序分别按升序(或降序)排序,所得到的(或降序)排序,所得到的序号序号即为等级。即为等级。(2 2)计计算算两两变变量量各各对对观观测测值值相相应应的的等等级级之之差差d dt.(3 3)计算等级相关系数)计算等级相关系数67end例例5.5等级相关系数的计算等级相关系数的计算 假设有假设有Xt和和et如下:如下:Xt:25,40,52,58,65 et:1.6,-2.9,-10.7,14.

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 教案示例

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com