计量经济学-2一元线性回归模型(1)复习过程.ppt

上传人:豆**** 文档编号:63663569 上传时间:2022-11-25 格式:PPT 页数:51 大小:412KB
返回 下载 相关 举报
计量经济学-2一元线性回归模型(1)复习过程.ppt_第1页
第1页 / 共51页
计量经济学-2一元线性回归模型(1)复习过程.ppt_第2页
第2页 / 共51页
点击查看更多>>
资源描述

《计量经济学-2一元线性回归模型(1)复习过程.ppt》由会员分享,可在线阅读,更多相关《计量经济学-2一元线性回归模型(1)复习过程.ppt(51页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、计量经济学-2一元线性回归模型(1)例如,例如,函数关系:函数关系:统计依赖关系统计依赖关系/统计相关关系:统计相关关系:对变量间对变量间统计依赖关系统计依赖关系的考察主要是通过的考察主要是通过相关分析相关分析(correlation analysis)或或回归分析回归分析(regression analysis)来完成的:来完成的:相关系数:相关系数:统计依赖关系统计依赖关系 回归分析回归分析正相关正相关相关分析相关分析 不相关不相关负相关负相关正相关正相关线性相关线性相关不相关不相关负相关负相关有因果关系有因果关系无因果关系无因果关系非线性相关非线性相关 不线性相关并不意味着不相关;有相关

2、关系并不意味着一定有因果关系;回归分析回归分析/相关分析相关分析研究一个变量对另一个(些)变量的统计依赖关系,但它们并不意味着一定有因果关系。相关分析相关分析对称地对待任何(两个)变量,两个变量都被看作是随机的。回归分析回归分析对变量的处理方法存在不对称性,即区分应变量(被解释变量)和自变量(解释变量):前者是随机变量,后者不是。注意:注意:分析被解释变量与解释变量之间的统计依赖关系,目的在分析被解释变量与解释变量之间的统计依赖关系,目的在于通过后者的已知或设定值去估计或预测前者的均值。于通过后者的已知或设定值去估计或预测前者的均值。例,假定一个地区的所有家庭的收入(例,假定一个地区的所有家庭

3、的收入(X)和消费支出)和消费支出(Y)统计如下,希望知道家庭消费支出与家庭收入之间的)统计如下,希望知道家庭消费支出与家庭收入之间的关系:关系:Y=F(X)。)。XY8010012014016018020022024026055657980102110120135137150607084931071151361371451526574909511012014014015517570809410311613014415216517875859810811813514515717518088113125140160189185115162191户数户数5657665767总支出总支出325462

4、44570767875068510439661211平均平均支出支出657789101113125137149161173YX55120 160200 24080 根据每个家庭的收入和支根据每个家庭的收入和支出绘出散点图,大致可看出二出绘出散点图,大致可看出二者间的关系:在统计意义上,者间的关系:在统计意义上,二者成正比。二者成正比。由对全体居民的收入和支出的调查结果,我们知道处于不同收入阶层由对全体居民的收入和支出的调查结果,我们知道处于不同收入阶层的居民有一个平均的支出水平,这一支出水平与收入大致呈线性关系。的居民有一个平均的支出水平,这一支出水平与收入大致呈线性关系。图中的这条通过各收入

5、阶图中的这条通过各收入阶层平均支出额的直线,描述了层平均支出额的直线,描述了这一依赖关系。我们把这条线这一依赖关系。我们把这条线称为回归直线。称为回归直线。二、回归模型二、回归模型 总体回归模型:总体回归模型:样本回归模型:样本回归模型:总体回归模型总体回归模型YX55120 160200 24080样本回归模型样本回归模型1、几个概念、几个概念条件分布条件分布(Conditional distribution):以以X取定值为条件的取定值为条件的Y的条件分布。的条件分布。条件概率条件概率(Conditional probability):给定给定X的的Y的概率,记为的概率,记为P(Y|X)。

6、例如,例如,P(Y=55|X=80)=1/5;P(Y=150|X=260)=1/7。条件期望(条件期望(conditional Expectation):给定):给定X的的Y的期望值,记为的期望值,记为E(Y|X)。例如,例如,E(Y|X=80)=551/5601/5651/5701/5751/565总体回归曲线(总体回归曲线(Popular Regression Curve)(总体回归曲线的几何意义)(总体回归曲线的几何意义):当解释变量给定值时因变量的条件期望值的轨迹。:当解释变量给定值时因变量的条件期望值的轨迹。2、总体回归函数(、总体回归函数(Popular Regression Fu

7、nction,PRF)E(Y|Xi)=f(Xi)当当PRF的函数形式为线性函数,则有,的函数形式为线性函数,则有,E(Y|Xi)=0+1Xi其中其中 0和和 1为未知而固定的参数,称为回归系数。为未知而固定的参数,称为回归系数。0和和 1也分别称为截也分别称为截距和斜率系数。上述方程也称为线性总体回归函数。距和斜率系数。上述方程也称为线性总体回归函数。3、“线性线性”的含义的含义“线性线性”可作两种解释:对变量为线性,对参数为线性。一般可作两种解释:对变量为线性,对参数为线性。一般“线性回线性回归归”一词总是指对参数一词总是指对参数 为线性的一种回归(即参数只以它的为线性的一种回归(即参数只以

8、它的1次方出现)。次方出现)。4、PRF的随机设定的随机设定 将个别的将个别的Yi围绕其期望值的离差围绕其期望值的离差(Deviation)表述如下:表述如下:ui=Yi-E(Y|Xi)或或 Yi=E(Y|Xi)+ui其中其中ui为随机误差项(为随机误差项(Stochastic error)或随机干扰项()或随机干扰项(Stochastic disturbance)。线性总体回归函数:)。线性总体回归函数:PRF:Yi=0 0+1 1Xi+ui=E(Y|Xi)+ui5、随机扰动项的意义、随机扰动项的意义 随机扰动项是从模型中省略下来的而又集体地影响着随机扰动项是从模型中省略下来的而又集体地影响

9、着Y的全部变量的替的全部变量的替代物。显然的问题是:为什么不把这些变量明显地引进到模型中来,而以代物。显然的问题是:为什么不把这些变量明显地引进到模型中来,而以随即扰动项来替代?理由是多方面的:随即扰动项来替代?理由是多方面的:(1)理论的含糊性:理论不能完全说明影响因变量的所有影响因素。)理论的含糊性:理论不能完全说明影响因变量的所有影响因素。(2)数据的欠缺:无法获得有关数据。)数据的欠缺:无法获得有关数据。(3)主要变量与次要变量:希望能找到与有较大影响的核心变量的关系。)主要变量与次要变量:希望能找到与有较大影响的核心变量的关系。(4)内在随机性:因变量具有内在的随机性。)内在随机性:

10、因变量具有内在的随机性。(5)替代变量差异:替代变量和被替代变量之间总是存在一定的差异。)替代变量差异:替代变量和被替代变量之间总是存在一定的差异。(6)简化原则:研究中尽可能使回归式简单。)简化原则:研究中尽可能使回归式简单。6、样本回归函数(、样本回归函数(SRF,Sample RegressionFunction)由于在大多数情况下,我们不可能得到由于在大多数情况下,我们不可能得到X、Y的所有可能的数值,只的所有可能的数值,只能用抽样的方法,取得能用抽样的方法,取得X、Y的样本观测值,用样本回归方程的样本观测值,用样本回归方程SRF去拟合去拟合总体回归方程总体回归方程PRF。X(收入)(

11、收入)80100120140160180200220240260Y(支出)(支出)55657980102110120135137150样本样本1 X(收入)(收入)80100120140160180200220240260Y(支出)(支出)708094103116130144152165178样本样本2样本回归函数样本回归函数SRF:在回归分析中,我们用在回归分析中,我们用SRF估计估计PRF。(一)基本假定(一)基本假定1、零均值。随机扰动项、零均值。随机扰动项ui的均值为零。即,的均值为零。即,E(ui|Xi)=02、同方差。随机扰动项、同方差。随机扰动项ui的方差相等。即的方差相等。即

12、Var(ui|Xi)=E(ui-E(ui)|Xi2 =E(ui2|Xi2=23、无自相关。各个扰动项无自相关。即:、无自相关。各个扰动项无自相关。即:三、参数的最小二乘估计三、参数的最小二乘估计(Least Squares Estimation,LSE)考虑回归模型:考虑回归模型:其中其中ui是除了是除了X以外的其它若干因素。以外的其它若干因素。4、随机扰动项、随机扰动项ui解释变量解释变量Xi不相关。即不相关。即Cov(ui,Xi)=Eui-EuiXi-EXi=0 i=1,2,n(二)普通最小二乘估计(二)普通最小二乘估计(Ordinary Least Squares,OLS)基本思路:用样

13、本回归函数估计总体回归函数。以基本思路:用样本回归函数估计总体回归函数。以估计估计估计出的参数估计出的参数使残差的平方和最小使残差的平方和最小。真实值真实值5、ui服从正态分布,即服从正态分布,即uiN(0,2),),i=1,2,n求解这一最小化问题,根据最大化的一阶条件:求解这一最小化问题,根据最大化的一阶条件:例例1,已知某商品的需求量,已知某商品的需求量Y(万吨)随价格(万吨)随价格X(元)变化的统计资料如下,(元)变化的统计资料如下,求需求量求需求量Y随价格随价格X变化的回归方程。变化的回归方程。年份年份 1981 1982 1983 1984 1985 1986 1987 1988

14、1989 1990 需求量需求量 100 75 80 70 50 65 90 100 110 65价格价格 5 7 6 6 8 7 5 4 3 9几个常用结果:几个常用结果:(三)最小二乘估计(三)最小二乘估计OLS的性质(高斯的性质(高斯-马尔柯夫定理)马尔柯夫定理)在所有线性无偏估计量中,在所有线性无偏估计量中,OLS估计量有最小方差,即估计量有最小方差,即OLS是是BLUE(Best Linear Unbiased Estimator)。)。(1)线性性)线性性:为为Yi的线性函数的线性函数(2)无偏性)无偏性:最小二乘估计:最小二乘估计 的数学期望值分别等于总体回的数学期望值分别等于总

15、体回归系数的值归系数的值(3)最小方差性:)最小方差性:在所有线性无偏估计量中,具有最小方差。即在所有线性无偏估计量中,具有最小方差。即OLS估计量估计量(四)最小二乘估计的方差(四)最小二乘估计的方差四、模型检验四、模型检验 (一)经济意义检验(一)经济意义检验 检验所建的模型的是否符合经济理论,主要是检验模型参数的符号和检验所建的模型的是否符合经济理论,主要是检验模型参数的符号和大小是否与经济理论以及人们的经验一致。大小是否与经济理论以及人们的经验一致。(二)统计检验(二)统计检验 1、拟合优度检验(判定系数检验)、拟合优度检验(判定系数检验)拟合优度检验是指对样本回归线与样本观测值之间拟

16、合程度的检验。拟合优度检验是指对样本回归线与样本观测值之间拟合程度的检验。度量拟合程度的指标是判定系数度量拟合程度的指标是判定系数R2。基本思路:因变量基本思路:因变量Y的总变异,能够被的总变异,能够被X的变异解释的比例越大,的变异解释的比例越大,则说明则说明OLS回归线对总体的解释程度越好,反之就越差。回归线对总体的解释程度越好,反之就越差。总的离差平方和的分解:总的离差平方和的分解:总平方和(总平方和(TSS):说明实际的):说明实际的Y值围绕其均值的总变异值围绕其均值的总变异PRF Xi X SRFY估计的估计的Y值围绕其均值的总变异值围绕其均值的总变异 未被解释的未被解释的Y值围绕回归

17、线的值围绕回归线的Y值的变异值的变异 R2 测度了在测度了在Y的总变异中,由回归模型解释的部分所占的比例。的总变异中,由回归模型解释的部分所占的比例。R2 越越高,回归模型拟合的程度就越好。高,回归模型拟合的程度就越好。R2 的性质:的性质:(1)非负。()非负。(2)0R2 1其它表达方式:其它表达方式:定义拟合优度定义拟合优度R2:例例2:对例:对例1进行拟合优度检验,并说明其意义。进行拟合优度检验,并说明其意义。2、相关系数检验、相关系数检验 相关系数:表示两个随机变量之间的相关程度。定义为:相关系数:表示两个随机变量之间的相关程度。定义为:以样本方差和样本协方差估计以样本方差和样本协方

18、差估计X、Y的方差和协方差,样本相关系数为的方差和协方差,样本相关系数为:样本相关系数的平方与拟合优度相等,但二者的意义不同。样本相关系数的平方与拟合优度相等,但二者的意义不同。(拟合优度是回归分析中提出的,而相关系数是相关分析中提出的。)(拟合优度是回归分析中提出的,而相关系数是相关分析中提出的。)相关系数检验的步骤:相关系数检验的步骤:例例3,对例,对例1进行相关系数检验。进行相关系数检验。3、F检验(总体回归方程显著性检验)检验(总体回归方程显著性检验)三大分布:三大分布:t:标准正态除以卡方开方的分布(注意自由度)标准正态除以卡方开方的分布(注意自由度)F:两个独立的卡方变量之商的分布

19、(注意自由度)两个独立的卡方变量之商的分布(注意自由度):若干个独立的标准正态平方和的分布:若干个独立的标准正态平方和的分布F检验的步骤:检验的步骤:离差平方和平方和SS自由度DF均方差MS F值 F临界值 显著性ESS1ESS/1 */RSSn-2RSS/n-2TSSn-1方差分析(方差分析(analysis of variance,ANOVA)表表思路:若思路:若ESS/RSS 比较大,则比较大,则X对对Y的解释程度就比较高,的解释程度就比较高,可以推测总体存在线性关系。可以推测总体存在线性关系。拟合优度拟合优度R2与与F检验具有一致性:检验具有一致性:例例4,对例,对例1进行进行F检验检

20、验解:解:TSS=3272.5 ESS=2707.5 RSS=565 F*=(2707.58)/565=38.33 38.33F0.05(1,8)=5.32 因此因此,回归方程显著成立回归方程显著成立.方差分析表方差分析表:Analysis of VarianceAnalysis of Variance SOURCE DF SS MS F p SOURCE DF SS MS F p Regression 1 2707.5 2707.5 38.34 0.000 Regression 1 2707.5 2707.5 38.34 0.000 Error 8 565.0 70.6 Error 8 56

21、5.0 70.6 Total 9 3272.5 Total 9 3272.5四、四、t检验(参数显著性检验)检验(参数显著性检验)T检验的步骤:检验的步骤:例例5,对例,对例1进行进行t检验。检验。五、预测(五、预测(Prediction Forecast)(一)点预测(一)点预测点预测的两种解释:点预测的两种解释:YX12区间估计:为了判断点估计与真值的接近程度,可以通过构造以估计值为区间估计:为了判断点估计与真值的接近程度,可以通过构造以估计值为中心的一个区间(随机的),以该区间包括了真值的概率来确定估计值接中心的一个区间(随机的),以该区间包括了真值的概率来确定估计值接近真值的把握程度:

22、近真值的把握程度:(二)区间预测(二)区间预测(Interval Estimation)1、总体均值、总体均值E(Y0|X0)的区间预测)的区间预测2、总体个别值、总体个别值Y0的区间预测的区间预测-t/2t/2o/2/2例例6,在例,在例1中,若中,若X0=10,求,求Y0及及E(Y0|X0)的预测值和)的预测值和预测区间预测区间 六、案例分析六、案例分析小结:一元线性回归分析的主要步骤小结:一元线性回归分析的主要步骤1、建立回归模型、建立回归模型 研究某一经济现象,先根据经济理论,选择具有因果关系的两个变量研究某一经济现象,先根据经济理论,选择具有因果关系的两个变量(Y,X),建立线性回归

23、模型,确定解释变量和被解释变量。,建立线性回归模型,确定解释变量和被解释变量。如果不明确如果不明确两个变量是否为线性关系,也可以根据散点图来分析。两个变量是否为线性关系,也可以根据散点图来分析。建立回归模型可以是根据经济理论,也可以根据相同或相似经济现象建立回归模型可以是根据经济理论,也可以根据相同或相似经济现象的历史分析经验来建立回归模型。的历史分析经验来建立回归模型。建立模型时,不仅要考虑理论或经验的依据,同时也要考虑数据的可建立模型时,不仅要考虑理论或经验的依据,同时也要考虑数据的可利用程度。利用程度。2、收集数据,并经过适当的加工整理,得到适于回归分析的样本数据集。、收集数据,并经过适

24、当的加工整理,得到适于回归分析的样本数据集。3、估计模型参数。利用样本数据,以、估计模型参数。利用样本数据,以OLS得到模型参数的估计值。得到模型参数的估计值。4、对回归模型和参数估计值进行检验。、对回归模型和参数估计值进行检验。检验回归结果是否正确反映经济现象,是否与理论相符。包括理论检检验回归结果是否正确反映经济现象,是否与理论相符。包括理论检验和统计检验。验和统计检验。经济理论检验:参数的符号,大小是否与理论和实际相符。若不符,经济理论检验:参数的符号,大小是否与理论和实际相符。若不符,寻找原因(数据?模型设定?理论错误?)寻找原因(数据?模型设定?理论错误?)统计检验:拟和优度检验,估

25、计量、回归方程的显著性检验。统计检验:拟和优度检验,估计量、回归方程的显著性检验。5、预测、预测 对于解释变量的特定值,带入回归方程得到因变量的预测值;在给定对于解释变量的特定值,带入回归方程得到因变量的预测值;在给定的置信水平上,得到因变量预测值的置信区间。的置信水平上,得到因变量预测值的置信区间。6、回归结果的表述:、回归结果的表述:并说明参数的显著水平(并说明参数的显著水平()。)。以回归分析为工具的实证分析文章的结构以回归分析为工具的实证分析文章的结构一、研究的来源和基础一、研究的来源和基础 对研究的经济现象的描述;研究该现象的意义;相同或相似的代对研究的经济现象的描述;研究该现象的意

26、义;相同或相似的代表性研究的方法、结论,并作总结评价;本研究的出发点;文章的结表性研究的方法、结论,并作总结评价;本研究的出发点;文章的结构介绍。构介绍。二、理论分析二、理论分析 选择合适的经济理论,利用理论对要研究的经济想象做定性分析,选择合适的经济理论,利用理论对要研究的经济想象做定性分析,得到大致的结果;建立理论模型。得到大致的结果;建立理论模型。三、建立回归模型三、建立回归模型 根据理论模型,建立合理、可分析的回归模型。回归模型的形式、根据理论模型,建立合理、可分析的回归模型。回归模型的形式、解释变量的个数和选择,不一定与数理模型完全相同。解释变量的个数和选择,不一定与数理模型完全相同。四、对所使用的数据做出说明四、对所使用的数据做出说明 数据的来源;数据加工的原因和处理方式;替代数据的说明等。数据的来源;数据加工的原因和处理方式;替代数据的说明等。五、回归结果及对结果的分析五、回归结果及对结果的分析 列出回归的结果(包括参数的估计值和统计检验结果);结合理列出回归的结果(包括参数的估计值和统计检验结果);结合理论分析回归结果论分析回归结果六、结论六、结论/总结总结/应用应用此课件下载可自行编辑修改,仅供参考!此课件下载可自行编辑修改,仅供参考!感谢您的支持,我们努力做得更好!谢谢感谢您的支持,我们努力做得更好!谢谢

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 教案示例

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com