回归分析实验中学实验_-中学实验.pdf

上传人:c****4 文档编号:95771109 上传时间:2023-08-30 格式:PDF 页数:15 大小:827.26KB
返回 下载 相关 举报
回归分析实验中学实验_-中学实验.pdf_第1页
第1页 / 共15页
回归分析实验中学实验_-中学实验.pdf_第2页
第2页 / 共15页
点击查看更多>>
资源描述

《回归分析实验中学实验_-中学实验.pdf》由会员分享,可在线阅读,更多相关《回归分析实验中学实验_-中学实验.pdf(15页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、 第 1 章 回归分析实验 目次 1.1 线性回归模型 1.2 非线性回归模型 1.3 线性回归分析实验示范 1.3.1 背景资料 1.3.2 实验步骤分解 1.4 非线性回归分析实验示范 1.4.1 背景资料 1.4.2 回归报告 1.4.3 结果解释 1.5 回归分析实验练习 注记 1 参考文献 附表 1 1.1 线性回归模型 考虑线性计量经济模型 Yi=a0+b1X1i+bmXmi+ui (1-1)其中:a0 为截距,b1,bm 为回归系数,X 1i,X mi 为解释变量,它们是非随 机变量,u i 为随机扰动项。当 m 1 时,模型 1-1 称为一元线性回归模型或单变量 线性模型;当

2、时,模型 1-1 称为多元线性回归模型。m 1 模型 1-1 的应用效果取决于模型的系数是否被有效确定,即与其估计系数 的 t 检验和模型的 F 检验是否显著有关,而这些检验则必须满足一定的前提条 件才行。在应用普通最小二乘法(OLS)做回归分析时,如果模型 1-1 满足以 下假设:假设 1-1 解释变量和随机扰动项线性无关:cov(ui,X ji)0,j 1,2,m 假设 1-2 随机扰动项的期望为 0:E(ui)0 假设 1-3 随机扰动项服从同方差分布:var(ui)2 1,2,i 假设 1-4 随机扰动项没有自相关关系:cov(ui,u j)0,i j 假设 1-5 随机扰动项服从正态

3、分布:ui 2 N(0,)假设 1-6 解释变量之间没有共线性关系,即任一个解释变量均不能被其余 解释变量线性表示得到。那么,模型 1-1 的 OLS 估计量就是最优线性无偏估计量,估计系数的 t 检验 和模型的 F 检验就是有效的。只要其中的任意一个假设没有得到满足,模型系数 的 OLS 估计量就变成无效或不是最优线性无偏估计的了。OLS 是线性回归模型系数估计的常用方法之一,其实,最大似然估计法(ML)也是常用方法之一。在满足六个假设前提下,除了 ML 方法估计残差项可能会导 致渐进有偏估计以及低估值外,OLS 和 ML 在系数的估计上是一致的,即均是无 偏估计。模型 1-1 的回归检验,

4、要做以下几个指标的估计和检验。2 回归方程的拟合优度主要是由多元判定系数 R2 和校正的多元判定系数 R 来衡量。在一元回归模型中,曾指出判定系数解释了回归方程对样本的拟合能力 或拟合的程度。R2 表示回归平方和(SSR)与总离差平方和(SST)之比,即:析实验示范背景资料回归报告结果解释回归分析实验练习注记参考文献附表线性回归模型考虑线性计量经济模型其中为截距为回归系数为解释变量它们是非随机变量为随机扰动项当时模型称为一元线性回归模型或单变量线性模型当检验是否显著有关而这些检验则必须满足一定的前提条件才行在应用普通最小二乘法做回归分析时如果模型满足以下假设假设解释变量和随机扰动项线性无关假设

5、随机扰动项的期望为假设随机扰动项服从同方差分布假设随机扰动项检验模型系数解释变量线性表示得到那么模型的估计量就是最线性无偏估计量估计系数的和模型的检验就是有效的只要其中的任意一个假设没有得到满足的估计量就变成无效或不是最线性无偏估计的了是线性回归模型系数估计的常 R2 SSR SST 校正的判定系数:SSE SSE n 1 2 n m 1 R 1 SST 1 m 1 SST n n 1 1 (1 R2)n 1 n m 1 SSE=SST-SSR 系数估计量的 t 检验,有以下 t 统计量:a a t sec(a)b1 b1 t sec(b1)t(n m 1)bm bm t sec(bm)模型

6、1-1 的 F 统计量检验。判定系数 R2 和 F 有某种特定的关系,即:SSR R2 n m 1 R2 F m m SSE 1 R2 m 1 R2 n m 1 n m 1 模型 1-1 的结构稳定性检验。Chow 检验的目的是判断多元回归方程的结构 稳定性问题。依统计学意义,对不同的局部时间序列数据的回归模型是否存在显 著的差异?如果这种差异存在,就称 关于整体时间序列数据的回归模型不是结构 稳定的,否则就称为 结构稳定的。假设模型 1-1 的随机扰动项 ui N(0,2)且 为随机扰动项的总体方差。现在把时间序列数据分成两个部分,其容量分别为 和 n2,假设已经建立起了以下两个回归模型:2

7、 n1 Yi a b1 X1i bm X mi ui,(1-2)Yi a b1 X1i bm X mi ui,(1-3)析实验示范背景资料回归报告结果解释回归分析实验练习注记参考文献附表线性回归模型考虑线性计量经济模型其中为截距为回归系数为解释变量它们是非随机变量为随机扰动项当时模型称为一元线性回归模型或单变量线性模型当检验是否显著有关而这些检验则必须满足一定的前提条件才行在应用普通最小二乘法做回归分析时如果模型满足以下假设假设解释变量和随机扰动项线性无关假设随机扰动项的期望为假设随机扰动项服从同方差分布假设随机扰动项检验模型系数解释变量线性表示得到那么模型的估计量就是最线性无偏估计量估计系数

8、的和模型的检验就是有效的只要其中的任意一个假设没有得到满足的估计量就变成无效或不是最线性无偏估计的了是线性回归模型系数估计的常 并且 ui N(0,2)、ui N(0,2)和 ui,ui 相互独立。为了检验模型 1-2 和模型 1-3 是否相容,下面我们需要做 Chow 检验。Chow 检验的基本假设:ui N(0,2)、ui N(0,2)和 ui,ui 相互独立。第一步:求模型 1-1 的自由度为 n1 n2 m 1 的残差平方和 SSE;第二步:求模型 1-2 的自由度为 n1 m 1 的残差平方和 1 SSE;第三步:求模型 1-3 的自由度为 n2 m 1 的残差平方和 SSE2;第四

9、步:考虑到 ui,ui 相互独立,置(Chow 的 F 统计量)SSE SSE1 SSE2 F m 1 (1-4)SSE1 SSE2 n1 n2 2m 2 则:F F(m 1,n1 n2 2m 2)第五步:给定显著性水平 ,如果 F F(,m 1,n1 n2 2 m 2),或 F F(1,m 1,n1 n2 2m 2),则说明回归模型存在结构不稳定;否则的话,不能否认回归模型的结构稳定性。Chow 检验只能判明回归方程关于样本的回归分析是否存在结构不稳定的问 题。如果 Chow 检验证实了回归方程关于样本的回归分析存在结构不稳定,那么是什么原因造成的呢?Chow 检验不能给出任何具体答案。对于

10、线性回归模型,结构稳定性问题来自于样本的结构不稳定性。如果存在 两个点,至少有一个不是样本的端点,线性回归模型关于由这两个点所界定的样本的回归分析不存在结构稳定性问题,但是,当扩充样本使得新的样本包含其中一个点或全部两个点时,线性回归模型关于新样本的回归分析就存在结构稳定性 问题,则称这个点或两个点为 Chow 节点。Chow 节点的存在说明回归模型关于 样本的回归分析存在结构不稳定问题。任意把样本分成两部分(注意每部分的样 本容量至少应该保证该样本的回归分析能正常进行为准),求 F 统计量如式(1-4)所示,如果 F 检验不是显著的,则可断定不存在结构稳定性问题,否则说明结构稳定性问题是存在

11、的。在作回归分析时,始终假设随机扰动项服从正态分布。实际情况是否如此,需要作进一步的检验。正态性的检验方法有许多,比如残差直方图、半对数图、JB 检验等。析实验示范背景资料回归报告结果解释回归分析实验练习注记参考文献附表线性回归模型考虑线性计量经济模型其中为截距为回归系数为解释变量它们是非随机变量为随机扰动项当时模型称为一元线性回归模型或单变量线性模型当检验是否显著有关而这些检验则必须满足一定的前提条件才行在应用普通最小二乘法做回归分析时如果模型满足以下假设假设解释变量和随机扰动项线性无关假设随机扰动项的期望为假设随机扰动项服从同方差分布假设随机扰动项检验模型系数解释变量线性表示得到那么模型的

12、估计量就是最线性无偏估计量估计系数的和模型的检验就是有效的只要其中的任意一个假设没有得到满足的估计量就变成无效或不是最线性无偏估计的了是线性回归模型系数估计的常 1.2 非线性回归模型 线性回归模型的“线性”有其特殊含义。一方面,模型的线性是指模型关于变量是线性的,另一方面,模型的线性是指模型关于每一项的系数或参数,是线性的。这里的非线性回归模型是指被解释变量关于解释变量是非线性的。通常见 到的非线性模型有 Cobb Douglas 生产函数、Philips 双曲模型、Engel 消费函数等。1.3 线性回归分析实验示范 1.3.1 背景资料 我国重工业增加值可能受到钢材进口、钢材产量和钢材出

13、口的影响,其详细 数据见附表 1-1。假设 Z 表示我国重工业当月工业增加值(亿元),X 表示钢材进口月均价格(美元/吨),Y 表示当月钢材产量(万吨),W 表示钢材出口(美元/吨)。如果它们之间存在以下计量关系:Zt a bX t cYt dWt t (1-5)其中:a,b,c,d 分别为截距和系数,为随机扰动项。问题:给出模型 1-5 的回归报告、随机扰动项的正态性检验和回归模型结构稳定性检验。1.3.2 实验步骤分解 步骤 1:回归报告如表 1-1 所示 表 1-1 回归报告列表 变 量 系数估计 标准误差 t 统 计 量 概 率 a-2 751.96 517.035 2-5.322 5

14、9 0*X-1.173 99 0.410 233-2.861 76 0.007 9 析实验示范背景资料回归报告结果解释回归分析实验练习注记参考文献附表线性回归模型考虑线性计量经济模型其中为截距为回归系数为解释变量它们是非随机变量为随机扰动项当时模型称为一元线性回归模型或单变量线性模型当检验是否显著有关而这些检验则必须满足一定的前提条件才行在应用普通最小二乘法做回归分析时如果模型满足以下假设假设解释变量和随机扰动项线性无关假设随机扰动项的期望为假设随机扰动项服从同方差分布假设随机扰动项检验模型系数解释变量线性表示得到那么模型的估计量就是最线性无偏估计量估计系数的和模型的检验就是有效的只要其中的任

15、意一个假设没有得到满足的估计量就变成无效或不是最线性无偏估计的了是线性回归模型系数估计的常 续表 变 量 系数估计 标准误差 t 统 计 量 概 率 Y 1.623 856 0.104 471 15.543 6 0*W 4.549 055 0.976 462 4.658 711 0.000 1 R2=0.968 882 2 F 统计量=290.601 3 Prob(F 统计量)=0*R=0.965 548 注:“0*”表示小于万分之一。资料来源:表中数据是模型 1-5 应用于数据附表 1-1 得出的。步骤 2:随机扰动项的正态性检验 正态性检验的方法,这里采用残差图法和 JB 统计量检验法,如

16、图 1-1 所示。ei 400 300 200 100 0 -100 -200 i 0 5 10 15 20 25 30 35 图 1-1 正态性检验的残差图法 图 1-1 直观显示:随机扰动项是服从正态分布的。下面通过 JB 统计量进一 步验证。JB 统计量的定义为 JB n S2(K 3)2 6 24 其中:n 为样本容量,S 为样本概率分布的偏度,K 为样本概率分布的峰度。由此得到残差的频数柱状图及其数据指标,如图 1-2 所示。析实验示范背景资料回归报告结果解释回归分析实验练习注记参考文献附表线性回归模型考虑线性计量经济模型其中为截距为回归系数为解释变量它们是非随机变量为随机扰动项当时

17、模型称为一元线性回归模型或单变量线性模型当检验是否显著有关而这些检验则必须满足一定的前提条件才行在应用普通最小二乘法做回归分析时如果模型满足以下假设假设解释变量和随机扰动项线性无关假设随机扰动项的期望为假设随机扰动项服从同方差分布假设随机扰动项检验模型系数解释变量线性表示得到那么模型的估计量就是最线性无偏估计量估计系数的和模型的检验就是有效的只要其中的任意一个假设没有得到满足的估计量就变成无效或不是最线性无偏估计的了是线性回归模型系数估计的常 8 Series:ei Sample 132 Observations 32 6 Mean-0.002 950 Median-34.338 90 4 M

18、aximum 360.624 1 Minimum-202.379 6 Std.Dev.145.979 9 Skewness 0.408 199 2 Kurtosis 2 218 336 Jarque-Bera 1.703 341 Probability 0.426 701 0-100 0 -200 100 200 300 400 图 1-2 残差概率分布图及其数据特征 JB 统计量为 1.703 341,由于 JB 统计量的检验服从自由度为 2 的 2 检验,而在 5%显著水平下,x2(2)等于 5.99,由此说明零假设:JB=0 不是统计显著的。因此,残差图和 JB 统计量检验均表明随机扰动

19、项是服从正态分布的。步骤 3:模型回归分析的结构稳定性检验 Chow 检验是模型结构稳定性检验的常用方法之一。按照前面的 Chow 检验 步骤,计算出 Chow 的 F 统计量,即 F=0.702。但是 F=(0.05,15,17)=2.308。由此 断定模型的结构是稳定的。步骤 4:实验结果解释 回归报告显示:钢材的进出口和钢材的产量对我国的重工业增加值有着显著的影响力,钢材的产量和出口越多,重工业产值的增加就越多,钢材的进口越多,重工业增加值受到的抑制就越明显。钢材进出口和产量对重工业增加值的影响不仅是正规的,而且其结构也是稳定的。这就说明,钢材在我国重工业中占有重要的地位。这个例子说明一

20、个事实:钢材的进口、出口和产量联合起来对我国重工业产业才会体现出各自的重要性。因为,如果把钢材的出口从模型中剔除出去,钢材的进口在我国重工业增加值中所扮演的角色则并不明显,如表 1-2 所示。析实验示范背景资料回归报告结果解释回归分析实验练习注记参考文献附表线性回归模型考虑线性计量经济模型其中为截距为回归系数为解释变量它们是非随机变量为随机扰动项当时模型称为一元线性回归模型或单变量线性模型当检验是否显著有关而这些检验则必须满足一定的前提条件才行在应用普通最小二乘法做回归分析时如果模型满足以下假设假设解释变量和随机扰动项线性无关假设随机扰动项的期望为假设随机扰动项服从同方差分布假设随机扰动项检验

21、模型系数解释变量线性表示得到那么模型的估计量就是最线性无偏估计量估计系数的和模型的检验就是有效的只要其中的任意一个假设没有得到满足的估计量就变成无效或不是最线性无偏估计的了是线性回归模型系数估计的常 表 1-2 二元回归报告列表 变 量 系数估计 标准误差 t 统计量 概 率 a-445.933 2 195.531 6-2.280 62 0.030 1 X 0.266 814 0.352 85 0.756 168 0.455 6 Y 1.338 973 0.110 892 12.074 57 0*R2=0.944 762 2 F 统计量=247.999 3 Prob(F 统计量)=0*R=0.

22、940 952 注:“0*”表示小于万分之一。资料来源:表中数据是根据附表 1-1 的数据计算得出的。根据表 1-2,从统计学角度看,钢材进口对我国重工业产值并没有产生大的 影响。在计量经济学的应用中,剔除变量法较为普遍。剔除变量法是指在多元回归 分析中,如果某一解释变量的系数统计量的 t 检验不显著,则把它从模型中剔除 出去,此时的模型就变成了元数少一的多元回归模型。这种方法也叫做数据挖掘。然而,Lovell 于 1983 年证明了这种方法是不合理的,因为剔除变量法会导致余 下变量在做 t 检验时会收窄置信区间,影响零假设的理性判断。从实证上看,也 没有实际意义。n 元回归模型和 n-1 元

23、回归模型的解读能力是不可相提并论的,表 1-2 和表 1-1 显示钢材进口的解读能力简直有南辕北辙之别!由此提示:剔除 变量法是不可取的,但是增加变量法如表 1-2 到表 1-1 的变化所示是可行的。1.4 非线性回归分析实验示范 1.4.1 背景资料 钢材在国民经济建设中扮演着重要的角色。我国除了增强钢材生产的能力外,从国外进口一定量的钢材来弥补我国在钢材生产能力方面的某些不足是正常 的。那么,钢材生产和钢材进口之间存在什么样的关系呢?假设 Y 表示钢材进口月均价(美元/吨),X 表示我国钢材月均产量(万吨),它们的月数据如附 表 1-1 所示。一般情况下,钢材产量和钢材进口之间不是某种线性

24、关系,假设它们之间的关系由以下模型描述:Yt a0 a1 X t a2 Xt2 a3 X t3 t(1-6)问题:试估计出模型 1-6,并给出其回归分析。析实验示范背景资料回归报告结果解释回归分析实验练习注记参考文献附表线性回归模型考虑线性计量经济模型其中为截距为回归系数为解释变量它们是非随机变量为随机扰动项当时模型称为一元线性回归模型或单变量线性模型当检验是否显著有关而这些检验则必须满足一定的前提条件才行在应用普通最小二乘法做回归分析时如果模型满足以下假设假设解释变量和随机扰动项线性无关假设随机扰动项的期望为假设随机扰动项服从同方差分布假设随机扰动项检验模型系数解释变量线性表示得到那么模型的

25、估计量就是最线性无偏估计量估计系数的和模型的检验就是有效的只要其中的任意一个假设没有得到满足的估计量就变成无效或不是最线性无偏估计的了是线性回归模型系数估计的常 1.4.2 回归报告 步骤 1:给出回归模型 1-6 的估计式 Yt 30 906.717 21+135.556 19X t 0.181 51Xt2+8.04E 05X t3 步骤 2:回归报告(表 1-3)表 1-3 三次多项式模型的回归报告 变 量 系数估计 标准误差 t 统计量 概 率 a0-30 906.7 10 434.05-2.962 1 0.006 17 X 135.556 2 41.825 77 3.240 97 0.

26、003 07 X 2-0.181 51 0.054 99-3.300 81 0.002 63 X 3 8.04E-05 2.37E-05 3.395 22 0.002 07 R2 0.778 R 2 F 32.75(ProbF)0.0001 0.754 资料来源:表中数据是根据附表 1-1 的数据计算得出的。步骤 3:正态性检验 应用 JB 统计量,类似前面,可判知随机扰动项是服从正态分布的,如图 1-3 所示。10 Series:ei Sample 132 8 Observations 32 Mean-1 106 451 6 Median-975 653.3 Maximum-205 462.

27、9 4 Minimum-3 068 204 Std.Dev.811 357.9 Skewness-0.989 652 2 Kurtosis 2.916 107 Jarque-Bera 5.232 915 0-100 000 0 Probability 0.073 081-3000 000 0 -200 000 0 0 图 1-3 三次多项式回归模型残差项的正态性检验 析实验示范背景资料回归报告结果解释回归分析实验练习注记参考文献附表线性回归模型考虑线性计量经济模型其中为截距为回归系数为解释变量它们是非随机变量为随机扰动项当时模型称为一元线性回归模型或单变量线性模型当检验是否显著有关而这些检验则

28、必须满足一定的前提条件才行在应用普通最小二乘法做回归分析时如果模型满足以下假设假设解释变量和随机扰动项线性无关假设随机扰动项的期望为假设随机扰动项服从同方差分布假设随机扰动项检验模型系数解释变量线性表示得到那么模型的估计量就是最线性无偏估计量估计系数的和模型的检验就是有效的只要其中的任意一个假设没有得到满足的估计量就变成无效或不是最线性无偏估计的了是线性回归模型系数估计的常 1.4.3 结果解释 钢材进口与钢材产量之间的关系是复杂的,一般的线性模型是没有办法很好 地拟合它们之间的关系。如何寻找合适的模型去模拟它们之间的关系,则是一个 有待研究的问题。不过,这里给出的三次多项式模型对它们之间关系

29、的拟合是非 常理想的。这一点从回归报告以及正态性检验中就可看出。其实,直观上,它们 的关系被拟合得非常好,可以作为它们之间关系的度量尺度,如图 1-4 所示。Y 4 500 4 000 3 600 3 000 2 500 2 000 X 500 600 700 800 900 1 000 1 100 图 1-4 钢材进口与钢材产量之间的关系 1.5 回归分析实验练习 1 背景资料:我国轻工业增加值可能受到钢材进口、钢材产量和钢材出口 的影响,其详细数据如附表 1-2 所示。假设 Q 表示我国轻工业当月工业增加值 (亿元),X 表示钢材进口月均价(美元/吨),Y 表示当月钢材产量(万吨),W 表

30、示当月钢材出口(美元/吨)。如果它们之间存在以下计量关系:Qt a bX t cYt dWtt(1-7)析实验示范背景资料回归报告结果解释回归分析实验练习注记参考文献附表线性回归模型考虑线性计量经济模型其中为截距为回归系数为解释变量它们是非随机变量为随机扰动项当时模型称为一元线性回归模型或单变量线性模型当检验是否显著有关而这些检验则必须满足一定的前提条件才行在应用普通最小二乘法做回归分析时如果模型满足以下假设假设解释变量和随机扰动项线性无关假设随机扰动项的期望为假设随机扰动项服从同方差分布假设随机扰动项检验模型系数解释变量线性表示得到那么模型的估计量就是最线性无偏估计量估计系数的和模型的检验就

31、是有效的只要其中的任意一个假设没有得到满足的估计量就变成无效或不是最线性无偏估计的了是线性回归模型系数估计的常 其中:a,b,c,d 分别为截距和回归系数,为随机扰动项。问题:给出模型 1-7 的回归报告、随机扰动项的正态性检验和回归模型结构稳定性检验。2 背景资料:我国汽车工业可能受到钢材进口、钢材产量和钢材出口的影 响,其详细数据如附表 1-3 所示。假设 Z 表示我国汽车和汽车底盘出口月均价(美 元/辆),X 表示钢材进口月均价(美元/吨),Y 表示当月钢材产量(万吨),W 表示当月钢材出口(美元/吨)。如果它们之间存在以下计量关系:Zt a bX t cYt dWtt(1-8)其中:a

32、,b,c,d 分别为截距和回归系数,为随机扰动项。问题:给出模型 1-8 的回归报告和随机扰动项的正态性检验。3 背景资料:考虑钢材进口与钢材出口之间的关系。假设 Y 表示钢材进口 月均价(美元 /吨),X 表示我国钢材月均出口均价(美元/吨),它们的月数据 如附表 1-1 所示。假设它们之间的关系由以下模型描述:Yt a0 a1 X t a2 X t2 t(1-9)其中:a 为系数,为随机扰动项。问题:试估计出模型 1-9,并给出其回归报告。4 背景资料:考虑钢材生产与钢材进口之间的关系。假设 Y 表示钢材月产 量(万/吨),X 表示我国钢材进口月均价(美元/吨),它们的月数据如附表 1-1

33、 所示。假设它们之间的关系由以下模型描述:Y eat X b ec(ln X t)2(1-10)t t 其中:a,b,c 为系数,为随机扰动项。问题:试估计出模型 1-10,并给出其回归报告。注记 1 在做多元回归分析时,司空见惯的错误做法就是剔除变量法。在回归结 果中,如果某个解释变量的系数估计的 t 检验不显著,那么就直接去除该变量,然后考虑剩余的变量做回归分析,直到回归结果中不存在任一解释变量的系数估 计的 t 检验不显著为止。这种做法是不合理的。其主要的问题就是导致最终确定 模型的假设检验出现虚假现象或伪检验,因为 t 检验的置信区间实际上已经收缩 了,但是表面上看不到这种现象的发生。

34、随着剔除变量数的增加,系数估计量的 t 检验的实际置信区间的收缩就越明显,极大地削弱了区间判别法的实际功效。析实验示范背景资料回归报告结果解释回归分析实验练习注记参考文献附表线性回归模型考虑线性计量经济模型其中为截距为回归系数为解释变量它们是非随机变量为随机扰动项当时模型称为一元线性回归模型或单变量线性模型当检验是否显著有关而这些检验则必须满足一定的前提条件才行在应用普通最小二乘法做回归分析时如果模型满足以下假设假设解释变量和随机扰动项线性无关假设随机扰动项的期望为假设随机扰动项服从同方差分布假设随机扰动项检验模型系数解释变量线性表示得到那么模型的估计量就是最线性无偏估计量估计系数的和模型的检

35、验就是有效的只要其中的任意一个假设没有得到满足的估计量就变成无效或不是最线性无偏估计的了是线性回归模型系数估计的常 这种错误的变量剔除法应该避免。随机变量的正态性检验和模型的结构稳定性检验是多元回归模型在做回 归分析时应该要进行的工作,因为,计量模型对数据结构的敏感性是非常显著的,不容忽视的。只考虑模型的回归结果是否达到了系数估计量的 t 检验和模型的检验的显著性要求还是不够。当多元回归模型回归结果的所有检验:t 检验、F F 检 验,正态性检验和结构稳定性检验均得到满足后,模型的解读能力和应用效果才 有可能得到保证。在样本结构比较复杂的情况下,模型的回归分析也可能比较显著,但是模型的最终解读

36、能力可能未必可靠,原因可能是计量模型对样本的结构波动比较敏感。为了确保模型的最终解读能力,模型的结构稳定性以及随机扰动 项的正态性检验是必须要作的。只有当模型的 t 检验和 检验、正态性检验和模 F 型的结构稳定性检验均达到要求时,模型对样本的最终解读能力才能得到 保证。多元回归模型在应用上出现不同的解读效果,除了模型的设置可能不尽 合理外,模型对样本的结构敏感性是不容忽略的。对于一个设置合理的多元回归模型,其对各种样本的解读能力是否可比较,则取决于这些样本的结构稳定性的检验是否存在显著的差别。当样本的结构保持相对稳定,同一设置合理模型应用于这些样本的结果是可以作出令人信服的比较的。从计量经济

37、学的应用角度出发,模型的设置应该随着样本的结构变化而变化,切勿拿模型去要求样本。本章关于非线性回归模型的回归分析,所采用的软件就是 Origin 软件。如果应用其他软件,如没有固化的模块存在,则可通过编程的办法加以解决。统计数据之间可能存在非常复杂的非线性结构,如果是这样,光采取线性模型来反应它们之间的关系是不科学的。如何发现数据之间的非线性结构,当数据容量足够大时,得依赖于相关软件的开发或应用;当数据个数比较少时,可利用简单的散点图加以识别。数据波动的非线性结构是时常见得到的,模型的非线性设置也应随之调整。现在比较常见的“教条”就是拿模型当作“令箭”,要求一切样本 适合它。这样的一种不合理观

38、念还是很有“市场”,这无疑造成了模型应用的 “教条”化。非线性问题可以线性化,然后直接对线性化的模型进行回归分析。这种方法应用起来的效率可能会低一些,但是,这也是一种解决非线性问题的基本思路。理论上讲,非线性问题的线性化与直接对非线性问题进行回归分析,其结果应该是一样的。但是,由于软件设计本身的非一致性,其分析结果可能会带来某些差异。这些现象是正常的,因为即使是对同样的数据,如果使用的软件不同,析实验示范背景资料回归报告结果解释回归分析实验练习注记参考文献附表线性回归模型考虑线性计量经济模型其中为截距为回归系数为解释变量它们是非随机变量为随机扰动项当时模型称为一元线性回归模型或单变量线性模型当

39、检验是否显著有关而这些检验则必须满足一定的前提条件才行在应用普通最小二乘法做回归分析时如果模型满足以下假设假设解释变量和随机扰动项线性无关假设随机扰动项的期望为假设随机扰动项服从同方差分布假设随机扰动项检验模型系数解释变量线性表示得到那么模型的估计量就是最线性无偏估计量估计系数的和模型的检验就是有效的只要其中的任意一个假设没有得到满足的估计量就变成无效或不是最线性无偏估计的了是线性回归模型系数估计的常 其计算结果也可能会出现不一致。因此,为了避免计算结果的差异性所导致的判断混乱,最好在计算结果后面注明数据计算所适用的软件名称。Chow 检验的缺陷是无法找到多元回归模型结构稳定性问题的根结。对此

40、,一般的处理方法就是引入虚拟变量加以控制,构造出结构稳定的模型。当样本的结构非常紊乱时,虚拟变量引入模型也无法解决模型结构不稳定性的问题。模型与样本的关系就像是“鞋”与“脚”的关系。为了对样本所蕴含的 信息深入揭示,需要对模型做适当的设置。如果拿模型来要求样本,就像拿“鞋”来要求“脚”一样很不合理。只有能对样本作出很好解读的模型,才能说是选择 了合适的模型,就好像只有做出合“脚”的“鞋”才能叫做好鞋。时常听到人们议论说“模型水土不服”的观点是不科学的。模型设置的目的就是希望通过样本来解读总体的状况,而不是只给出模型的回归报告就可以。从计量经济学理论研究的角度出发,找出合适的样本来验证模型设置的

41、客观性是可以接受的。本章的基础知识主要来自于王升(2006)的内容,同时还参考了本章文 献 1 和文献 2 的相关知识。这部分内容不是本章的主要内容,只是为了方便读者而特意设置的。参考文献 1 Lovell,M.Data mining,Review of Economics and Statistics,1983,65,1 12 2(美)古扎拉蒂计量经济学(中译本)林少宫译北京:中国人民大学出版社,2004 3 王升计量经济学导论北京:清华大学出版社,2006 附表 1 附表 1-1 线性回归分析实验示范 重工业月 钢材进 钢材当 钢材出口 重工业月 钢材进口 钢材当 钢材出 口月均 口月均

42、均增加值 月产量 月均价(美 均增加值 月均价(美 月产量 价(美 价(美(亿元)(万吨)元/吨)(亿元)元/吨)(万吨)元/吨)元/吨)2 226.8 546.36 2 118.34 478.4 3 970.75 983.16 3 110.63 630.9 2 488.26 553.37 2 262.55 502.6 4 265.97 978.83 3 036.59 632.1 2 899.68 567.59 2 389.95 521.1 4 034.82 977.17 3 136.12 638.6 析实验示范背景资料回归报告结果解释回归分析实验练习注记参考文献附表线性回归模型考虑线性计量经

43、济模型其中为截距为回归系数为解释变量它们是非随机变量为随机扰动项当时模型称为一元线性回归模型或单变量线性模型当检验是否显著有关而这些检验则必须满足一定的前提条件才行在应用普通最小二乘法做回归分析时如果模型满足以下假设假设解释变量和随机扰动项线性无关假设随机扰动项的期望为假设随机扰动项服从同方差分布假设随机扰动项检验模型系数解释变量线性表示得到那么模型的估计量就是最线性无偏估计量估计系数的和模型的检验就是有效的只要其中的任意一个假设没有得到满足的估计量就变成无效或不是最线性无偏估计的了是线性回归模型系数估计的常 续表 重工业月 钢材进 钢材当 钢材出口月 重工业 钢材进口 钢材当 钢材出 口月均

44、 月均增 口月均 均增加值 月产量 均价(美元/月均价(美 月产量 价(美 加值(亿 价(美(亿元)(万吨)吨)元/吨)(万吨)元/吨)元)元/吨)2 945.13 585.6 2 301.54 542.3 4 139.96 971.37 3 269.49 643.1 2 907.15 602.76 2 281.26 555.9 4 310.95 961.46 3 225.18 644 3 088.06 618.95 2 357.49 568.6 4 350.67 955.42 3 310.45 643.8 2 974.15 635.63 2 432.05 572.4 4 532.03 951

45、.55 3 305.77 641.9 3 075.39 650.97 2 542.2 572.7 4 609.74 953.08 3 372.72 637.4 3 232.21 666.17 2 641.12 574.7 3 820.3 984.12 3 246.67 572.8 3 299.09 678.05 2 675.68 578.9 3 844.26 990.25 3 182.21 575 3 439.98 693.35 2 789.03 582.5 4 701.53 985.87 3 800.37 561.6 3 722.11 709.46 2 763.96 585.8 4 747.

46、87 995.19 3 831.14 557.5 3 322.3 956.49 2 611.01 633.5 4 942.75 1001.29 4 023.3 552.6 2 944.48 971.21 2 536.77 632.4 5 441.49 1011.69 4 119.97 554.5 3 724.2 984.29 3 065.48 625.6 5 053.75 1020.82 3 865.98 564.8 3 913 983.78 2 953.09 627.2 5 157.81 1033.59 3 896.48 577.9 资料来源:Wind 资讯。数据取自 2004-01 200

47、6-08。附表 1-2 回归分析实验练习之一 轻工业月 钢材进 钢材当 钢材出口 轻工业月 钢材进口 钢材当 钢材出 口月均 口月均 均增加值 月产量 月均价(美 均增加值 月均价(美 月产量 价(美 价(美(亿元)(万吨)元/吨)(亿元)元/吨)(万吨)元/吨)元/吨)1 117.35 546.36 2 118.34 478.4 1 730.83 983.16 3 110.63 630.9 1 221.03 553.37 2 262.55 502.6 1 925.41 978.83 3 036.59 632.1 1 365.14 567.59 2 389.95 521.1 1 776.13

48、977.17 3 136.12 638.6 1 425.38 585.6 2 301.54 542.3 1 827.55 971.37 3 269.49 643.1 1 402.47 602.76 2 281.26 555.9 1 964.3 961.46 3 225.18 644 1 519.88 618.95 2 357.49 568.6 1 969.26 955.42 3 310.45 643.8 1 434.83 635.63 2 432.05 572.4 2 058.13 951.55 3 305.77 641.9 1 469.07 650.97 2 542.2 572.7 2 10

49、2.68 953.08 3 372.72 637.4 1 580.15 666.17 2 641.12 574.7 1 819.32 984.12 3 246.67 572.8 1 586.16 678.05 2 675.68 578.9 1 628.82 990.25 3 182.21 575 1 643.91 693.35 2 789.03 582.5 1 978.19 985.87 3 800.37 561.6 析实验示范背景资料回归报告结果解释回归分析实验练习注记参考文献附表线性回归模型考虑线性计量经济模型其中为截距为回归系数为解释变量它们是非随机变量为随机扰动项当时模型称为一元线性回

50、归模型或单变量线性模型当检验是否显著有关而这些检验则必须满足一定的前提条件才行在应用普通最小二乘法做回归分析时如果模型满足以下假设假设解释变量和随机扰动项线性无关假设随机扰动项的期望为假设随机扰动项服从同方差分布假设随机扰动项检验模型系数解释变量线性表示得到那么模型的估计量就是最线性无偏估计量估计系数的和模型的检验就是有效的只要其中的任意一个假设没有得到满足的估计量就变成无效或不是最线性无偏估计的了是线性回归模型系数估计的常 续表 轻工业月 钢材进 钢材当 钢材出口 轻工业月 钢材进口 钢材当 钢材出 口月均 口月均 均增加值 月产量 月均价(美 均增加值 月均价(美 月产量 价(美 价(美(

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > PPT文档

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com