计量经济学的各种检验.ppt

上传人:wuy****n92 文档编号:69721391 上传时间:2023-01-08 格式:PPT 页数:60 大小:233.50KB
返回 下载 相关 举报
计量经济学的各种检验.ppt_第1页
第1页 / 共60页
计量经济学的各种检验.ppt_第2页
第2页 / 共60页
点击查看更多>>
资源描述

《计量经济学的各种检验.ppt》由会员分享,可在线阅读,更多相关《计量经济学的各种检验.ppt(60页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、经济计量学的几种检验多重共线性n.Multicollinearityarisesbecausewehaveputintoomanyvariablesthatmeasurethesamething.nAsthedegreeofmulticollinearityincreases,theregressionmodelestimatesofthecoefficientsbecomeunstableandthestandarderrorsforthecoefficientscangetwildlyinflated.nMeasure:vif,tol=1/vif,conditionindex;etc.多重

2、共线性的后果n1.存在完全多重共线性时,参数的估计值无法确定,而且估计值的方差变为无穷大.n2.存在不完全多重共线性时,可以估计参数值,但是数值不稳定,而且方差很大.n3.多重共线性会降低预测的精度,甚至失效,增大零假设接受的可能性(t值变小).多重共线性的检测方法(1)样本可决系数法n如果样本的可决系数R-square比较大,且回归系数几乎没有统计上的显著性,则可认为存在多重共线性。nTheil提出了一个指标:多重共线性效应系数TheiltestresultsnSas结果:n结果表明有多重共线性。多重共线性检测方法(2)辅助回归检验法n若存在多重共线性,则至少有一个解释变量可精确或近似地表示

3、为其余皆是变量的线性组合。n相应的检验统计量为:辅助回归检验结果nSas结果:nKlein经验法则:若存在一个i,使得nR(i)-squareR-square,则认为多重共线性严重;本例中x1,x3有多重共线性。多重共线性检验方法(3)样本相关系数检验法FGtestresultsnfg=20.488013401 p=0.0001344625;n拒绝零假设,认为存在多重共线性。n具体那些变量之间存在多重共线性,除了上面提到的辅助回归的方法外,还有以下提到的条件数检验和方差膨胀因子法。多重共线性检验方法:(4)特征值分析法所用的检验统计指标n ;为第k各自变量和其余自变量回归的可决系数.VIF10

4、,有多重共线性;TOL=1/VIF;n条件指数:n条件数条件数:;C20,共线性严重.多重共线性的检验和补救n例一:进口总额和三个自变量之间回归;nSas 结果如下:Pearson Correlation Coefficients,N=11 Prob|r|under H0:Rho=0n x1 x2 x3nx1 1.00000 0.02585 0.997260.99726nGDP 0.9399 .0001.0001nx2 0.02585 1.00000 0.03567n存蓄量 0.9399 0.9171nx3 0.997260.99726 0.03567 1.00000n总消费.0001|t|I

5、nflationInflationnIntercept1-10.127991.21216-8.36.00010nx11-0.051400.07028-0.730.4883185.99747185.99747nx210.586950.094626.200.00041.01891nx310.286850.102212.810.0263186.11002186.11002n发现x1的系数为负,和现实经济意义不符,出现原因就是x1和x3之间的线性相关.补救措施n增加样本;岭回归或主分量回归;n至少去掉一个具有多重共线性的变量;对具有多重共线性的变量进行变换.n对所有变量做滞后差分变换(一般是一阶差分)

6、,问题是损失观测值,可能有自相关.n采用人均形式的变量(例如在生产函数估计中)n在缺乏有效信息时,对系数关系进行限制,变为有约束回归(Klein,Goldberger,1955),可以降低样本方差和估计系数的标准差,但不一定是无偏的(除非这种限制是正确的).n对具有多重共线性的变量,设法找出其因果关系,并建立模型和原方程构成联立方程组.岭回归n岭回归估计:nK=0,b(k)=b即为OLSE;nK的选取:n即使b(k)的均方误差比b的均方误差小.岭迹图岭回归结果Obs_MODEL_TYPE_DEPVAR_RIDGE_k_PCOMIT_RMSE_RMSE_Interceptx1x2x3y1MODE

7、L1PARMSy0.48887-10.1280-0.0510.586950.287-12MODEL1RIDGEVIFy0.00方差膨胀因子方差膨胀因子185.997185.9971.01891186.11011.01891186.11013MODEL1RIDGEy0.000.48887-10.1280-0.0510.586950.28714MODEL1RIDGEVIFy0.018.5990.981928.604-18.5990.981928.604-15MODEL1RIDGEy0.010.55323-9.18050.0460.598860.14416MODEL1RIDGEVIFy0.022.8

8、580.962192.859-12.8580.962192.859-17MODEL1RIDGEy0.020.57016-8.92777MODEL1RIDGEy0.020.57016-8.92770.0570.595420.127-10.0570.595420.127-18MODEL1RIDGEVIFy0.031.5020.943451.502-19MODEL1RIDGEy0.030.57959-8.73370.0610.590800.120-110MODEL1RIDGEVIFy0.040.9790.925320.979-111MODEL1RIDGEy0.040.58745-8.55830.06

9、40.585910.116-1主分量回归n主分量回归是将具有多重相关的变量集综合得出少数几个互不相关的主分量.n两步:(1)找出自变量集的主分量,建立y与互不相关的前几个主分量的回归式.(2)将回归式还原为原自变量结果.n详见,方开泰;主分量回归结果Obs_MODEL_TYPE_DEPVAR_PCOMIT_RMSE_Interceptx1x2x3y1MODEL1PARMSy0.488870.48887-10.1280-0.051400.586950.2868512MODEL1IPCVIFy10.250831.000850.2503810.250831.000850.2503813MODEL1I

10、PCy1MODEL1IPCy10.550010.55001-9.13010.072780.609220.1062619.13010.072780.609220.1062614MODEL1IPCVIFy20.249560.000950.24971-15MODEL1IPCy21.052061.05206-7.74580.073810.082690.10735-1主分量回归结果n由输出结果看到在删去第三个主分量(pcomit=1)后的主分量回归方程:nY=-9.1301+0.07278x1+0.60922x2+0.10626x3;n该方程的系数都有意义,且回归系数的方差膨胀因子均小于1.1;主分量回

11、归方程的均方根误差(_RMSE=0.55)比普通OLS方程的均方根误差(_RMSE=0.48887)有所增大但不多。Sas程序ndata ex01;ninput x1 x2 x3 y;nlabel x1=国内生产总值;nlabel x2=存储量;nlabel x3=消费量;nlabel y=进口总额;ncards;n149.3 4.2 108.1 15.9n161.2 4.1 114.8 16.4n171.5 3.1 123.2 19.0n175.5 3.1 126.9 19.1n180.8 1.1 132.1 18.8n190.7 2.2 137.7 20.4n202.1 2.1 146 2

12、2.7n212.4 5.6 154.1 26.5n226.1 5.0 162.3 28.1n231.9 5.1 164.3 27.6 n239.0 0.7 167.6 26.3n;nrun;nproc corr data=ex01;nvar x1-x3;nrun;n*岭回归*;nproc reg data=ex01 outest=ex012 graphics outvif;nmodel y=x1-x3/ridge=0.0 to 0.1 by 0.01;nplot/ridgeplot;nrun;nproc print data=ex012;run;n*主分量回归法*;nproc reg data

13、=ex01 outest=ex103;nmodel y=x1-x3/pcomit=1,2 outvif;*pcomit表示删去最后面的1或2个主分量,用前面m-1或 m-2各主分量进行回归*;nrun;nproc print data=ex103;run;Sas程序n/*theil test*/;nproc reg data=ex01;nequation3:model y=x1 x2;nequation2:model y=x1 x3;nequation1:model y=x2 x3;nrun;/*r-.9473;r3s=0.9828*/;ndata theil;nrsq=0.9919;r1s=

14、0.9913;r2s=0.9473;r3s=0.9828;ntheil=rsq-(3*rsq-(r1s+r2s+r3s);put theil=;nrun;n/*辅助回归检验法*/;nproc reg data=ex01;nequation3:model x3=x1 x2;nequation2:model x2=x1 x3;nequation1:model x1=x2 x3;nrun;n/*FG test*/;nproc corr data=ex01 outp=corr nosimple;var x1-x3;run;nproc print data=corr;run;ntitle 计算相关矩阵的

15、行列式;nproc iml;nR=1.000 0.026 0.997,0.026 1 0.036,0.9152 0.6306 1;nd=det(R);nprint d;nrun;/*d=0.081371*/;ntitle 计算检验统计量及其p值;ndata fg;nn=11;p=3;d=0.081371;nfg=-(n-1-1/6*(2*p+5)*log(d);df=p(p-1)/2;np=1-probchi(fg,df);nput fg=p=;nrun;/*fg=20.488013401 p=0.0001344625,拒绝零假设*/;异方差的检验和补救nnOLSEunbiased,ineff

16、icient;t,Ftestinvalid;forecastaccuracydecreased.nIfthemodeliswell-fitted,thereshouldbenopatterntotheresidualsplottedagainstthefittedvalues.Ifthevarianceoftheresidualsisnon-constant,thentheresidualvarianceissaidtobeheteroscedastic.异方差的检测nTherearegraphicalandnon-graphicalmethodsfordetectingheterosceda

17、sticity.Acommonlyusedgraphicalmethodistoplottheresidualsversusfitted(predicted)values.nExample:grade:educatedyears;potexp:workingyears;exp2=potexp2;union:dummyvariable.收入方程回归的结果nDependentVariable:LNWAGEnAnalysisofVariancenSumofMeannSourceDFSquaresSquareFValuePrFnModel412.422363.1055914.06|t|nInterce

18、pt10.595110.283492.100.0384nGRADE10.083540.020094.16FnModel121.188810.099070.880.5731nError879.830780.11300nCorrectedTotal9911.01958nRootMSE0.33615R-SquareR-Square0.10790.1079nDependentMean0.20989AdjR-Sq-0.0152nCoeffVar160.15281nParameterStandardnVariableDFEstimateErrortValuePr|t|nIntercept1-0.07767

19、0.98580-0.080.9374nGRADE1-0.012200.12502-0.100.9225nPOTEXP10.077840.071881.080.2819nEXP21-0.003990.00409-0.970.3325nUNION10.648790.861600.750.4535ngrade210.002200.004250.520.6065nexp41-3.34378E-70.00000151-0.220.8256nexp310.000061700.000141920.430.6648ngx210.000116830.000111021.050.2955ngp1-0.003750

20、.00494-0.760.4498ngu1-0.051370.04430-1.160.2494npu10.001930.060610.030.9746neu1-0.000221850.00126-0.180.8605n残差项平方对所有一阶,二阶及交叉项回归.n1.由左边的结果可知:n故同方差的假设未被拒绝.n2.Procregdata=aa;nModely=x/spec;nRun;n可得到相同的结果。布罗施-帕甘/戈弗雷检验怀特检验的特例(1)OLS残差额et和一个估计的干扰误差n(2)用OLS将对选中的解释变量进行回归,并计算解释平方和(ESS);n(3)在零假设下,有n(4)一个更简单且渐

21、进等价的做法是直接利用残差平方对选中的解释变量进行回归.在零假设(同方差)下,Dependent Variable:rsqn Sum of MeanSource DF Squares Square F Value PrFModel 12 1.18881 0.09907 0.88 0.5731Error 87 9.83078 0.11300Corrected Total 99 11.01958 Root MSE 0.33615 R-Square 0.1079Dependent MeanDependent Mean 0.209890.20989 Adj R-Sq -0.0152BPGtestres

22、ults(1)BPGtestresults(2)nDependent Variable:rsqadjustnAnalysis of Variancen Sum of Meann Source DF Squares Square F Value Pr FnModel 3 10.7041510.70415 3.56805 1.43 0.2386nError 96 239.41116 2.49387 Corrected Total 99 250.11531 Root MSE 1.57920 R-Square 0.0428 Dependent Mean 0.99997 Adj R-Sq 0.0129n

23、Coeff Var 157.92443nESS=10.70415ESS=10.70415BPGtestresults(3)n*ESS=5.35 FnModel 3 0.47160 0.15720 1.43 0.2386nError 96 10.5479810.54798 0.10987nRoot MSE 0.33147 R-Square 0.0428R-Square 0.0428戈德菲尔德-匡特(Goldfeld-Quandt)检验n按potexp的值将数据从小到大进行排列.n取前后个35个观测值分别回归.c=30;n回归的主要结果:nRSS1=6.39573;RSS2=7.2517;RSS2

24、/RSS1=1.13;而;该比值不显著,不能拒绝同方差的原假设;n去掉的中间观测值的个数要适中,否则会降低功效,一般取观测值个数的1/3.补救措施-已知方差的形式n1.广义最小二乘法(GLS);n请参考讲义中的例子;n2.模型变换法,适用于函数型异方差;已知方差的函数形式;n3.加权最小二乘法(WLS);实质上是一种模型变换法;具体参见讲义中的例子;n采用面板数据,增加信息量.未知方差的形式nFurnival(1961)提出了一种拟合指数进行不断的修正,最后找出最佳的权重(使得该指数值最小).处理盲点-robustregressionn1.迭代加权最小二乘法(IRLS),Neter提出了2中加

25、权函数,HuberandBisquare,但是不易操作.SASv8中常使用ProcNLIN迭代.n2.非参数回归.ProcLoess.n3.SASv9.0中有一个过程ProcrobustregnStata中有一个比较好的命令:rreg直接进行鲁棒回归(robust),采用迭代过程.序列相关性(serialcorrelation)nnOLSEunbiased,butinefficientanditsstandarderrorestimatorsareinvalid;nBLUEoftheGauss-MarkovTheoremnolongerholds.nThevarianceformulasfor

26、theleastsquaresestimatorsareincorrect.nAR,MA,orARMAformsofserialcorrelation.nTaketheAR(1)forinstance:Dw检验需要注意的地方n假定了残差是服从正态分布,而且是同方差;自变量是外生的,如果包含了内生滞后变量,就需要用修正的dh检验(procautoreg).n只适用于一阶自相关,对高阶或非线性自相关不适用.n样本容量至少为15.自相关检验的标准n德宾和沃森根据显著水平,n,k,确定了二个临界值du(上界),dl(下界);然后进行比较;n(1)ddu,不拒绝零假设;n(3)dlddu,无结论;n直观

27、:;d2,负自相关;d=2,无自相关;Eg:Icecreamdemand(Hildreth,Lu(1960)nCons:consumptionoficecreamperhead(pints);nIncome:averagefamilyincomeperweek($);nPrice:priceoficecream(perpint);nTemp:averagetemperature(inFahrenheit);nData:30four-weeklyobsfromMarch1951to11July1953;残差的散点图回归结果n Parameter Estimatesn Parameter Stan

28、dardnVariable DF Estimate Error t Value Pr|t|nIntercept 1 0.19732 0.27022 0.73 0.4718nprice 1 -1.04441 0.83436 -1.25 0.2218nincome 1 0.00331 0.00117 2.82 0.0090ntemp 1 0.00346 0.00044555 7.76 .0001n Durbin-Watson D 1.021Durbin-Watson D 1.021n Number of Observations 30n 1st Order Autocorrelation 0.33

29、01.DWtestn查表可得:在0.05的显著水平上,dl=1.21(N=30,k=3);du=1.65;n直接在回归的语句中加上一个dw选项;nDw=1.021;n因此拒绝零假设,认为有自相关;且显著一阶正相关;n Parameter Estimatesn Parameter StandardnVariable DF Estimate Error t Value Pr|t|nresid 1 0.384540.38454 0.17029 2.26 0.03190.0319补救方法n1.已知rho时,采用广义差分变换.n2.未知rho时,先求相关系数,然后进行广义差分.n求相关系数的方法有:n(

30、1)Cochrane-Orcutt迭代方法;n(2)Hildreth-Lu.n(3)Durbin2step.对严格外生回归元的序列相关的校正AR(1)模型-可行的广义最小二乘法(FGLS)n采用估计的相关系数值n回归方程:nFGLS步骤:n1.yt对做xt1,xt2,xtk回归,得到残差t.n2.t=t-1+et,求出相关系数的估计值n3.对上面的方程进行回归.常见的标准误,t统计量和F统计量都是渐进正确的.采用相关系数估计值的代价是FGLS有限样本性质较差,可能不是无偏的(数据弱相关时),但仍然是一致的.n尽管FGLS不是无偏的,不是BLUE,但是当序列相关的AR(1)模型成立时,比OLS更

31、渐进有效区分科克伦-奥克特(Cochrane-Orcutt)和普莱斯-温斯登(Paris-Winsten)估计nCo估计省略了第一次的观测值,使用的是t=t-1+et滞后项系数估计值,而Pw估计方法使用了第一次的观测值,见上面的回归式.n大体来说是否使用第一次的估计值并不会带来很大的差别,但是时间序列的样本很小,实际中还是有很大差别.n注意下面的估计结果中没有还原到原方程,还原时要写正确.n高阶序列相关的校正,类似于一阶的修正,广义的差分方法.Sas程序ndata ice;ninput cons income price temp time;ncards;.;nproc reg data=ic

32、e;nmodel cons=price income temp/dw;noutput out=ice1 p=consp r=resid;nrun;nsymbol1 i=none v=dot c=blue h=.5;nproc gplot data=ice1;nplot resid*time=1/vref=0;nrun;n/*BG test*/ndata tt1;nset ice1;nresid1=lag(resid);nrun;nproc reg data=tt1;nmodel resid=resid1/noint;nrun;/*rh0=0.40063,R-square=0.1541*/;nd

33、ata bgt;nbg=29*0.1541;nchisq=cinv(0.95,1);nif bgchisq then t=1;else t=0;nput t=;nrun;/*t=0*/;Sas程序n高阶的BG检验:n/*高阶BG test p=3*/;ndata tt2;nset ice1;nresid1=lag(resid);nresid2=lag(resid1);nresid3=lag(resid2);nrun;nproc reg data=tt2;nmodel resid=resid1 resid2 resid3/noint;nrun;/*R-square=0.1792*/;ndata

34、bgt2;nbg=(29-3)*0.1792;nchisq=cinv(0.95,3);nif bgchisq then t=1;else t=0;nput t=chisq=bg=;nrun;/*t=0,无高阶自相关*/;Sas程序n/*yule-walker estimates*/;nproc autoreg data=ice;nmodel cons=price income temp/nlag=1 method=yw;nrun;n*COCHRANE-ORCUTT;nproc reg data=ice;nmodel cons=price income temp/dw;noutput out=t

35、t p=chat r=res;nrun;nproc print data=tt;run;ndata tt;nset tt;nrelag=Lag(res);nrun;nproc print data=tt;run;nproc reg data=tt outest=b1;nmodel res=relag/noint;nrun;/*可算出rh0=0.40063*/;ndata pp;nset tt;nc1=lag(cons);nt1=lag(temp);ni1=lag(income);np1=lag(price);nrun;nproc print data=pp;run;ndata pp1;nset

36、 pp;nif _n_=1 then delete;nc2=cons-0.40063*c1;nt2=temp-0.40063*t1;ni2=income-0.40063*i1;np2=price-0.40063*p1;nrun;nproc print data=pp1;run;nproc reg data=pp1;nMODEL c2=t2 i2 p2/dw;nrun;n/*dw=1.541.65,因此不拒绝平稳性假设*/;Sas程序n上页的科克伦-奥科特迭代只用了1次;n对小样本情况,迭代多次的仍然很难收敛,我做了三次迭代发现仍然不收敛;所以说多次迭代效果和一次的效果相差不大.从理论上来说两者

37、的渐进性一样.n大样本情况只需几步就可收敛;n/*下面采用fgls进行估计校正*/;ndata fgls;nset tt1;nif _n_=1 then int=sqrt(1-0.40063*0.40063);else int=1-0.40063;nif _n_=1 then cons1=cons*sqrt(1-0.40063*0.40063);else cons1=cons-0.40063*cons;nif _n_=1 then price1=price*sqrt(1-0.40063*0.40063);else price1=price-0.40063*price;nif _n_=1 the

38、n income1=income*sqrt(1-0.40063*0.40063);else income1=income-0.40063*income;nif _n_=1 then temp1=temp*sqrt(1-0.40063*0.40063);else temp1=temp-0.40063*temp;nrun;nproc reg data=fgls;nmodel cons1=int price1 income1 temp1/noint;nrun;Sas程序nproc autoreg data=ice;nmodel cons=price income temp/nlag=1 dwprob

39、 archtest;nrun;n估计方法缺省为yule-walker估计;又称为两步完全变换法;已知自回归参数下的GLS估计;n其他方法:在model/method=ML;ULS;ITYW;n分别为极大似然估计,无条件最小二乘估计,以及迭代yule-walker估计;自回归参数较大时ml方法uls(又称NLS)方法较好.n详见SAS/ETS中的autoreg过程.Yuler-walkerestimatenTheAUTOREGProcedureDependentVariableconsnOrdinaryLeastSquaresEstimatesnSSE0.03527284DFE26nMSE0.0

40、0136RootMSE0.03683nSBC-103.63408AIC-109.23887nRegressR-Square0.7190TotalR-Square0.7190nDurbin-Watson1.0212PrDW0.9997nNOTE:PrDWisthep-valueforntestingnegativeautocorrelationnStandardApproxnVariableDFEstimateErrortValuePr|t|nIntercept10.19730.27020.730.4718nprice1-1.04440.8344-1.250.2218nincome10.0033

41、080.0011712.820.0090ntemp10.0034580.0004467.76FnModel30.047070.0156915.41|t|nIntercept10.094090.173580.540.5926nt210.003560.000554546.42FnModel41.440320.36008836.01|t|nint10.034110.262990.130.8978nprice11-0.669010.78886-0.850.4044nincome110.003880.001133.430.0021ntemp110.003650.000426868.56QLMPrLMPr

42、LMn10.44250.50590.17970.6716n20.83220.65961.24460.5367n31.27250.73571.63460.6516n43.52920.47354.39740.3549n53.72470.58974.42290.4903n63.93200.68594.48930.6108n74.22880.75314.50930.7196n85.83440.66589.45420.3054n96.74410.663710.32720.3246n107.75610.652610.59570.3899n117.84430.727210.91310.4506n127.93220.790412.49100.4071n从上面的p-value可以看出不存在条件异方差;其他有关时间序列的过程n分布滞后模型ProcPdlreg.n向量自回归Procvarmax;n时间序列建模ProcAriman时间序列预测Procforecast.nStata中的命令rreg(鲁棒回归);reg,robust给出来稳健的t值;newey和newey2给出来不同条件下的(包括面板数据,内生变量等)异方差自相关稳健估计(HAC)。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com