第二十二章 回归分析.ppt

上传人:qwe****56 文档编号:80587269 上传时间:2023-03-23 格式:PPT 页数:28 大小:493.50KB
返回 下载 相关 举报
第二十二章 回归分析.ppt_第1页
第1页 / 共28页
第二十二章 回归分析.ppt_第2页
第2页 / 共28页
点击查看更多>>
资源描述

《第二十二章 回归分析.ppt》由会员分享,可在线阅读,更多相关《第二十二章 回归分析.ppt(28页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、第二十二章第二十二章 回归分析回归分析 回归分析回归分析通过一个变量或一些变量的变化通过一个变量或一些变量的变化解释另一变量的变化,变量之间的关系是因果关系。解释另一变量的变化,变量之间的关系是因果关系。回归分析的主要步骤:回归分析的主要步骤:(1 1)根据理论和对问题的分析判断,将变量分)根据理论和对问题的分析判断,将变量分为自变量和因变量。为自变量和因变量。(2 2)模拟回归模型,描述变量间的关系)模拟回归模型,描述变量间的关系 (3 3)对回归模型进行统计检验)对回归模型进行统计检验 (4 4)利用回归模型去估计、预测因变量。)利用回归模型去估计、预测因变量。第一节 一元线性回归一、相关

2、与回归的区别与联系一、相关与回归的区别与联系二、一元线性回归模型二、一元线性回归模型三、回归系数与相关系数三、回归系数与相关系数四、回归估计标准差四、回归估计标准差五、回归方程的显著性检验五、回归方程的显著性检验一、相关分析与回归分析的区别与联系一、相关分析与回归分析的区别与联系联系联系相关分析是回归分析的基础和前提,回归分析则是相关分析的相关分析是回归分析的基础和前提,回归分析则是相关分析的深入和继续。深入和继续。区别区别 (1 1)在相关分析中不划分自变量和因变量(没有因果关系),变)在相关分析中不划分自变量和因变量(没有因果关系),变量之间的关系是对等的;在回归分析中,则必须根据研究对象

3、的性质量之间的关系是对等的;在回归分析中,则必须根据研究对象的性质和研究分析的目的,对变量进行自变量和因变量的划分(有因果关系)和研究分析的目的,对变量进行自变量和因变量的划分(有因果关系),变量之间的关系是不对等的。,变量之间的关系是不对等的。(2 2)在相关分析中所有的变量都是随机变量;在回归分析中,自)在相关分析中所有的变量都是随机变量;在回归分析中,自变量是给定的,因变量是随机的。变量是给定的,因变量是随机的。(3 3)相关分析变量之间是对等的,相关系数是惟一的。回归分析)相关分析变量之间是对等的,相关系数是惟一的。回归分析中,对于互为因果的两个变量中,对于互为因果的两个变量 (如人的

4、身高与体重,商品的价格与需如人的身高与体重,商品的价格与需求量求量),则有可能存在多个回归方程。,则有可能存在多个回归方程。二、一元线性回归(二、一元线性回归(Simple Linear RegressionSimple Linear Regression)模型)模型回归直线方程又称一元线性回归方程,其表达形式为:回归直线方程又称一元线性回归方程,其表达形式为:参数参数a a,b b的值用最小二乘法求得:的值用最小二乘法求得:【例例22-122-1】某地区某地区1010个同类企业生产性固定资产价值与工业增加个同类企业生产性固定资产价值与工业增加值资料如表值资料如表22-122-1,求工业增加值

5、关于固定资产价值的回归方程。,求工业增加值关于固定资产价值的回归方程。表表221221 直线回归分析计算表 企业企业 x x y yx x2 2xyxy1 12 23 34 45 56 67 78 89 910103 33 35 56 66 67 78 89 99 910 10 15151717252528283030363637374242404045 45 9 99 92525363636364949646481818181100 100 45455151125125168168180180252252296296378378360360450 450 合计合计66663153154904

6、9023052305计算过程在计算过程在EXCEL工作表上完成。计算结果见书工作表上完成。计算结果见书247页页三、回归系数与相关系数的关系三、回归系数与相关系数的关系 回归系数与相关系数两者可互相推算回归系数与相关系数两者可互相推算【例例22-222-2】见书见书247247页、页、248248页(页(计算过程在计算过程在EXCELEXCEL工作表上完成)工作表上完成)四、回归估计标准误差四、回归估计标准误差 回归方程的计算值回归方程的计算值ycyc与实际值与实际值y y存在着差距,这差距存在着差距,这差距用估计标准误差(用表示)来表示。用估计标准误差(用表示)来表示。估计标准误差是衡量回归

7、直线代表性大小的统计分估计标准误差是衡量回归直线代表性大小的统计分析指标,它说明观察值围绕着回归直线的变化程度或分散析指标,它说明观察值围绕着回归直线的变化程度或分散程度。程度。(一)估计标准误差的计算 估计标准误差计算原理与标准差基本相。估计标准误差计算原理与标准差基本相。定义公式:定义公式:为自由度为自由度【例例22-222-2】仍仍用用例例22-22-估估计计的的回回归归方方程程,计计算算其其估估计计平平均均误差。误差。解:利用表解:利用表22-22-的最后一行,的最后一行,计计算:算:结结果表明估果表明估计标计标准差是准差是140140万元。万元。(二)估计标准误差与相关系数的关系(二

8、)估计标准误差与相关系数的关系估计标准误差与相关系数在数量上也存在着换算关系:估计标准误差与相关系数在数量上也存在着换算关系:五、回归方程的显著性检验五、回归方程的显著性检验(一)判定系数(一)判定系数 回归分析表明,因变量回归分析表明,因变量y y的实际值(观察值)有大有的实际值(观察值)有大有小、上下波动,对每一个观察值来说,波动的大小可用总小、上下波动,对每一个观察值来说,波动的大小可用总离差离差()()来表示。总离差产生的原因有两个方面:一是来表示。总离差产生的原因有两个方面:一是受自变量受自变量x x变动的影响;二是受其它因素的影响(包括观变动的影响;二是受其它因素的影响(包括观察或

9、实验中产生的误差的影响)。察或实验中产生的误差的影响)。n n个观察值总的波动大个观察值总的波动大小用总离差平方和小用总离差平方和 表示。表示。或或 判定系数 是一个回归直线与样本观测值拟合优度判定的指标。的值总在0和1之间。一个线性回归模型如果充分利用了x的信息,则 越大,拟合优度就越好;反之,如 不大,说明模型中给出的x对y的信息还不够充分,应进行修改,使x对y的信息得到充分利用。(二)T检验 在回归分析中,我们最关心的是因变量在回归分析中,我们最关心的是因变量y y和自变量和自变量x x之间到底有无之间到底有无真正的关系,即需对总体参数真正的关系,即需对总体参数b b作出某种假设,以便利

10、用样本估计量作出某种假设,以便利用样本估计量 来来判断这种假设能否接受。其步骤如下:判断这种假设能否接受。其步骤如下:(1 1)提出零假设、备择假设:)提出零假设、备择假设:H H0 0:b b=0 H=0 H1 1:b b00当当x x与与y y有线性关系时有线性关系时b b00,当,当x x与与y y没没有线性关系时有线性关系时b b=0=0。(2 2)构造统计量并计算)构造统计量并计算 (3 3)确定显著性水平,并查)确定显著性水平,并查 统计表,确定拒绝域。统计表,确定拒绝域。取取 ,查,查(4 4)判定:计算结果表明)判定:计算结果表明 ,则拒绝原假设,即,则拒绝原假设,即X X作为

11、作为Y Y的解释的解释变量作用是显著的。变量作用是显著的。第二节第二节 多元线性回归多元线性回归一、二元线性回归一、二元线性回归二、多元线性回归二、多元线性回归三、多元线性回归的检验三、多元线性回归的检验 设因变量 受自变量 的影响,则因变量Y 倚自变量 的二元线性回归方程的基本形式为:式中:是 的回归估计值,是对应于的回归系数,是常数项。求解二元线性回归方程的方法仍然是最小二乘法。令:一、二元线性回归模型的建立一、二元线性回归模型的建立 按最小平方法的基本要求,通过对每个回归系按最小平方法的基本要求,通过对每个回归系数求偏导数,并令其等于数求偏导数,并令其等于0 0,便可得下列正规方程组:,

12、便可得下列正规方程组:二、多元回归方程的建立二、多元回归方程的建立设因变量设因变量 受受 等等k k个自变量的影响,则因变量倚各个自变量的影响,则因变量倚各个自变量的多元线性回归方程的基本形式为:个自变量的多元线性回归方程的基本形式为:式中:式中:是的是的 回归估计值,回归估计值,是对应于各个变量是对应于各个变量 的回归系数,的回归系数,是常数项。是常数项。求解多元线性回归方程的常用求解多元线性回归方程的常用方法仍然是最小平方法。按最小平方法的基本要求,通过方法仍然是最小平方法。按最小平方法的基本要求,通过对每个回归系数求偏导数,并令其等于对每个回归系数求偏导数,并令其等于0 0,便可得下列,

13、便可得下列k+1k+1个正规方程组成的方程组:个正规方程组成的方程组:三、多元线性回归模型的检验三、多元线性回归模型的检验1 1、拟合程度的评价、拟合程度的评价 在多元线性回归分析中,总平方和的分解公式依然成在多元线性回归分析中,总平方和的分解公式依然成立。立。为了判断一般线性模型(非一元线性模型)与数据为了判断一般线性模型(非一元线性模型)与数据的拟合程度,需要计算一个与的拟合程度,需要计算一个与 R R2 2等价的多重决定系数等价的多重决定系数R R2 2。用自由度去修正多重决定系数。用自由度去修正多重决定系数。2、t检验 一旦拟合了多元回归模型,就希望知道模型中的各个自变量的重一旦拟合了

14、多元回归模型,就希望知道模型中的各个自变量的重要性,其方法就是对与自变量密切联系的参数作要性,其方法就是对与自变量密切联系的参数作t t检验。检验。假设假设 ,统计量统计量 服从服从t t分布,故称分布,故称t t检验。检验。在显著水平在显著水平下,当下,当 (临界值)时,(临界值)时,拒绝原假设,即相应自变量对因变量影响显著。拒绝原假设,即相应自变量对因变量影响显著。如果不能拒绝原假设,可能自变量与因变量之间没有关系,也可如果不能拒绝原假设,可能自变量与因变量之间没有关系,也可能它们之间有关系但不是线性关系而是曲线关系,所以这时我们只能能它们之间有关系但不是线性关系而是曲线关系,所以这时我们

15、只能说没有充分证据认为它们之间存在线性关系。说没有充分证据认为它们之间存在线性关系。为第为第i个参数估计值的标准差。个参数估计值的标准差。3 3、F F检验检验 对回归系数进行整体检验4 4、估计、估计 如果进行点估计,可直接利用求多元回归方程的估计值,如果进行点估计,可直接利用求多元回归方程的估计值,计算所有自变量值都给定的估计值或的预测值。计算所有自变量值都给定的估计值或的预测值。如果是区间估计,需要了解抽样分布的标准差如果是区间估计,需要了解抽样分布的标准差.用样本的标准差去估计总体的标准差的计算公式为用样本的标准差去估计总体的标准差的计算公式为 例例22-422-4中,中,第三节第三节

16、 可线性化的曲线回归可线性化的曲线回归【例22-7】某商店商品销售额和流通费率的数据资料如表227所示。试分析销售额与流通费率的关系,并建立流通费率对销售额的回归方程。表表22-7 某商店1996-2006年商品销售额与流通率统计资料年份 商店销售额x(万元)流通费率y(%)1996 10.5 6.51997 12.5 5.01998 14.5 4.21999 16.5 3.52000 18.5 3.02001 19.5 2.52002 22.5 2.42003 24.5 2.32004 25.5 2.22005 26.5 2.12006 28.5 2.0 解:作散点图其数学模型为:可变型为:第一步,计算 第二步,计算 和 :第三步,计算:第四步,计算:第五步,计算a和b的值:流通费率(%)024680102030销售额(万元)非线性判定系数由表227资料列表计 =0.9776。计算结果表明,销售额与流通费率之间存在高度双曲线相关。对同一个问题进行模型的确定,在实际应用中,如果变化趋势不是非常明显可采用不同的模型分别进行拟合,然后比较模型各自的残差平方和,残差平方和越小,回归模型越好,另外再结合判定系数的比较。四、自回归四、自回归 在时间序列中,与 呈线性相关,与 可建立一元线性自回归模型 (又称简单自回归模型)。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 财经金融

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com