回归分析与相关分析 讲稿.ppt

上传人:石*** 文档编号:39340213 上传时间:2022-09-07 格式:PPT 页数:61 大小:2.98MB
返回 下载 相关 举报
回归分析与相关分析 讲稿.ppt_第1页
第1页 / 共61页
回归分析与相关分析 讲稿.ppt_第2页
第2页 / 共61页
点击查看更多>>
资源描述

《回归分析与相关分析 讲稿.ppt》由会员分享,可在线阅读,更多相关《回归分析与相关分析 讲稿.ppt(61页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、回归分析与相关分析 第一页,讲稿共六十一页哦 相关和回归分析是研究事物的相互相关和回归分析是研究事物的相互关系、测定它们联系的紧密程度、关系、测定它们联系的紧密程度、揭示其变化的具体形式和规律性的揭示其变化的具体形式和规律性的统计方法,是构造各种经济模型、统计方法,是构造各种经济模型、进行结构分析、政策评价、预测和进行结构分析、政策评价、预测和控制的重要工具。控制的重要工具。第二页,讲稿共六十一页哦一、相关分析与回归分析的内涵一、相关分析与回归分析的内涵二、相关关系的种类及回归方程的几种类型二、相关关系的种类及回归方程的几种类型三、相关与回归分析的主要内容三、相关与回归分析的主要内容四、应用回

2、归分析与相关分析必须注意的问题四、应用回归分析与相关分析必须注意的问题相关分析与回归分析概述相关分析与回归分析概述第三页,讲稿共六十一页哦 一、相关分析与回归分析的内涵一、相关分析与回归分析的内涵第四页,讲稿共六十一页哦 出租汽车费用与行驶里程:出租汽车费用与行驶里程:总费用总费用=行驶里程行驶里程 每公里单价每公里单价PKG 家庭收入与恩格尔系数:家庭收入与恩格尔系数:家庭收入高,则恩格尔系数低家庭收入高,则恩格尔系数低。相关关系相关关系第五页,讲稿共六十一页哦第六页,讲稿共六十一页哦回归分析回归分析指根据相关关系的数量表达指根据相关关系的数量表达式(回归方程式)与给定的式(回归方程式)与给

3、定的自变量自变量x x,揭示,揭示因变量因变量y y在数量在数量上的平均变化和求得因变量的上的平均变化和求得因变量的预测值的统计分析方法预测值的统计分析方法回归:退回回归:退回regression第七页,讲稿共六十一页哦q理论和方法具有一致性;理论和方法具有一致性;q无相关就无回归,相关程度越高,回归越无相关就无回归,相关程度越高,回归越好;好;q 相关系数和回归系数方向一致,可以互相相关系数和回归系数方向一致,可以互相推算。推算。第八页,讲稿共六十一页哦q相关分析中相关分析中x与与y对等,回归分析中对等,回归分析中x与与y要确要确定自变量和因变量;定自变量和因变量;q相关分析中相关分析中x、

4、y均为随机变量,回归分析中只均为随机变量,回归分析中只有有y为随机变量;为随机变量;q相关分析测定相关程度和方向,回归分析用相关分析测定相关程度和方向,回归分析用回归模型进行预测和控制。回归模型进行预测和控制。第九页,讲稿共六十一页哦注意注意 我们不能把回归分析看作是在变量我们不能把回归分析看作是在变量间建立一个因果关系的过程。回归分间建立一个因果关系的过程。回归分析只能表明,变量是如何或者是以怎析只能表明,变量是如何或者是以怎样的程度彼此联系在一起的。有关因样的程度彼此联系在一起的。有关因果关系的任何结论,必须建立在理论果关系的任何结论,必须建立在理论分析的基础之上。分析的基础之上。第十页,

5、讲稿共六十一页哦 二、相关关系的种类及回归方程二、相关关系的种类及回归方程的几种类型的几种类型第十一页,讲稿共六十一页哦按影响因素的多少分为按影响因素的多少分为按照表现形式不同分为按照表现形式不同分为按照变化方向不同分为按照变化方向不同分为 4.按相关程度不同分为按相关程度不同分为单相关单相关偏相关、复相关偏相关、复相关线性相关线性相关非线性相关非线性相关负相关负相关正相关正相关不完全相关和不相关不完全相关和不相关完全相关完全相关第十二页,讲稿共六十一页哦一一 元元线线性性回回归归Simple Linear regression第十三页,讲稿共六十一页哦 三、相关分析和回归分析的主要内容三、相

6、关分析和回归分析的主要内容第十四页,讲稿共六十一页哦(1)通过相关分析,观察变量之间是否有一定的依存关系,用统计指标说明变量之间关系的密切程度。如存在密切关系,选择合适的数学模式对变量之间存在的关系给以近似的描述。(2)根据样本资料求得的现象之间的关系形式和密切程度,并对样本相关稀释进行检验,以此推断总体中现象之间的关系形式和米琴成。第十五页,讲稿共六十一页哦(3)借助有关统计指标评价回归方程的拟合优度,并对回归方程中的参数进行检验。(4)根据自变量的数值,预测或控制因变量的数值,并应用统计推断方法,估计预测数的可靠程度。第十六页,讲稿共六十一页哦 四、应用回归分析与相关分析必须注意的问题四、

7、应用回归分析与相关分析必须注意的问题(1)对相关关系的分析,必须以定性分析为基础。(2)在判断相关关系和使用回归分析时,要注意相关关系发生作用的范围(3)在应用回归方程进行估计时,不能一概地认为自变量与因变量之间存在着因果关系,并据此作出结论。(4)在应用回归和相关分析方法时,还应注意社会经济现象复杂多变的问题。第十七页,讲稿共六十一页哦一元线性相关与一元线性回归一元线性相关与一元线性回归 一、相关表和相关图 二、一元线性回归测定 三、一元线性相关 四、回归系数和相关系数的关系第十八页,讲稿共六十一页哦 一、相关表和相关图第十九页,讲稿共六十一页哦定性分析定性分析定量分析定量分析第二十页,讲稿

8、共六十一页哦第二十一页,讲稿共六十一页哦正正 相相 关关负负 相相 关关曲线相关曲线相关不不 相相 关关xyxyxyxy又称又称,用直角坐标系的,用直角坐标系的x轴代表自变量,轴代表自变量,y轴代表因变量,将两个变量间相对应的变量值用轴代表因变量,将两个变量间相对应的变量值用坐标点的形式描绘出来,用以表明相关点分布状坐标点的形式描绘出来,用以表明相关点分布状况的图形。况的图形。第二十二页,讲稿共六十一页哦 二、一元线性回归测定第二十三页,讲稿共六十一页哦XY为随机误差项为模型参数,与式中:XYEY第二十四页,讲稿共六十一页哦)(YEXXY截距截距斜率斜率一元线性回归方程的可能形态一元线性回归方

9、程的可能形态 为正为正 为负为负 为为0第二十五页,讲稿共六十一页哦XYEYbxay以样本统计量估计总体参数以样本统计量估计总体参数斜率(回归系数斜率(回归系数)截距截距截距截距a 表示在没有自变量表示在没有自变量x的影响时,其它各种的影响时,其它各种因素对因变量因素对因变量y的平均影响;的平均影响;回归系数回归系数b 表明自表明自变量变量x每变动一个单位,因变量每变动一个单位,因变量y平均变动平均变动b个单位个单位。第二十六页,讲稿共六十一页哦()iiiiyabxxyyyabxy是理论模型,表明 与 变量之间的平均变动关系,而变量 的实际值应为第二十七页,讲稿共六十一页哦10名学生的身高与体

10、重散点图10名学生的身高与体重散点图40404545505055556060656570707575158158163163168168173173178178身高(X)身高(X)体重(Y)体重(Y)bxaybxay残差残差(Residual):eyy第二十八页,讲稿共六十一页哦xy0 x1xx 2xx 3xx xyE)()(yfxy0)(E0),(jiCov2)()(iiyVarVar0),(iixCov)(iyE)(iyf第二十九页,讲稿共六十一页哦bxay最小平方法最小平方法基本数学要求基本数学要求:2()minyy02012min,min)(22xbxaybxaybabxayyy,有求

11、偏导数,并令其为零、分别对函数中,有由第三十页,讲稿共六十一页哦xbynxbnyaxxnyxxynb22)(2ynab xxya xb x 第三十一页,讲稿共六十一页哦9520.0,9757.02rr,55086,37887,625,916,162xxyyxn由计算表知bxay第三十二页,讲稿共六十一页哦5142.6169167961.0166257961.091655086166259163788716222 xbyaxxnyxxynbxy7961.05142.6第三十三页,讲稿共六十一页哦q残差之和为零残差之和为零q所拟合直线通过样本散点图的重心所拟合直线通过样本散点图的重心q误差项与解释

12、变量不相关误差项与解释变量不相关qa a与与b b分别是总体回归系数的无偏估计量分别是总体回归系数的无偏估计量qa a与与b b均为服从正态分布的随机变量均为服从正态分布的随机变量)(,()(,(22222xxNbxxxNa0e),(yx0)(xxee)()(bEaE第三十四页,讲稿共六十一页哦是因变量各实际值与其估计值之间的是因变量各实际值与其估计值之间的平均差异程度,表明其估计值对各实平均差异程度,表明其估计值对各实际值代表性的强弱;其值越小,回归际值代表性的强弱;其值越小,回归方程的代表性越强,用回归方程估计方程的代表性越强,用回归方程估计或预测的结果越准确。或预测的结果越准确。22)(

13、22nxybyaynyySe第三十五页,讲稿共六十一页哦亿元,且知解:已知457.227961.0,5142.626175,37887,625,1622nxybyaySbayxyynenxybyaynyySe22)(第三十六页,讲稿共六十一页哦10名学生的身高与体重散点图10名学生的身高与体重散点图40404545505055556060656570707575158158 160160 162162 164164 166166 168168 170170 172172 174174 176176 178178身高(X)身高(X)体重(Y)体重(Y)yy yy yyyy2)(yySST2)(y

14、ySSE2)(yySSR剩余离差平方和剩余离差平方和回归离差回归离差平方和平方和总离差平方和总离差平方和第三十七页,讲稿共六十一页哦22)(yynLSSTyy 222)()(xxnyxxynUSSR 2)(bxayQSSELyy=U+Q第三十八页,讲稿共六十一页哦2221()1()yyyyUrLQLyyyy 第三十九页,讲稿共六十一页哦 三、一元线性相关三、一元线性相关 相关系数:描述两个变量线性关系线性关系的密切程度的数量分析指标。其计算方法有积差法积差法和方差法方差法两种。第四十页,讲稿共六十一页哦在在的条件下,用以反映的条件下,用以反映两变量两变量间间密切程度的统计指标,用密切程度的统计

15、指标,用r表示表示2222222)(yynxxnyxxynnyynxxnyyxxSSSryxxy第四十一页,讲稿共六十一页哦相关系数相关系数r r的取值范围:的取值范围:r0 为正相关,为正相关,r 0 为负相关;为负相关;|r|=0 表示不存在表示不存在关系;关系;|r|1 表示完全表示完全相关;相关;|r|0.4 为低度线性相关;为低度线性相关;0.4|r|0.7为显著性线性相关;为显著性线性相关;0.7|r|1.0为高度显著性线性相关。为高度显著性线性相关。第四十二页,讲稿共六十一页哦SSTSSEyyyyyyyyyySSTSSRr1222222SSTSSEr1221yySr第四十三页,讲

16、稿共六十一页哦是相关系数的平方,用是相关系数的平方,用 表示表示;用来衡量回归方程对;用来衡量回归方程对y y的解释的解释程度。程度。2r102 r判定系数取值范围:判定系数取值范围:2r 越接近于越接近于1 1,表明,表明x x与与y y之间之间的相关性越强;的相关性越强;越接近于越接近于0 0,表明两个变量之间几乎没有直线表明两个变量之间几乎没有直线相关关系相关关系.2r第四十四页,讲稿共六十一页哦2222)()(yynxxnyxxynr判定系数与相关系数的关系判定系数与相关系数的关系2)(rbr的符号)()()(222222yynxxnyxxynr第四十五页,讲稿共六十一页哦q判定系数无

17、方向性,相关系数则有方向,判定系数无方向性,相关系数则有方向,其方向与样本回归系数其方向与样本回归系数 b 相同;相同;q判定系数说明变量值的总离差平方和中可判定系数说明变量值的总离差平方和中可以用回归线来解释的比例,相关系数只说以用回归线来解释的比例,相关系数只说明两变量间关联程度及方向;明两变量间关联程度及方向;q相关系数有夸大变量间相关程度的倾向,因相关系数有夸大变量间相关程度的倾向,因而判定系数是更好的度量值。而判定系数是更好的度量值。第四十六页,讲稿共六十一页哦 四、回归系数和相关系数的关系四、回归系数和相关系数的关系yxbrxyrb第四十七页,讲稿共六十一页哦 r0 r0 r=0b

18、0 b0 b=0 xyyxSSrbSSbr;第四十八页,讲稿共六十一页哦估计的前提:估计的前提:回归方程经过检验,证明回归方程经过检验,证明 X 和和 Y 的关系在统计上是显著相关的。的关系在统计上是显著相关的。对于给定的对于给定的 X X 值,求出值,求出 Y Y 平均值的一个估平均值的一个估计值或计值或 Y Y 的一个个别值的预测值。的一个个别值的预测值。对于给定的对于给定的 X X 值,求出值,求出 Y Y 的平均值的的平均值的置信区间置信区间或或 Y Y 的一个个别值的的一个个别值的预测区间预测区间。第四十九页,讲稿共六十一页哦0 xbxayyxxy7961.05142.6对于若若 x

19、=80(十万吨),则:(十万吨),则:亿元1738.57807961.05142.6y第五十页,讲稿共六十一页哦ybxayx0 x对于给定的对于给定的 x=x0,Y 的的1-置信区间为:置信区间为:yty20自由度为自由度为n-2的的 t 分布分布的的 水平双侧分位数水平双侧分位数第五十一页,讲稿共六十一页哦nxxxxnty222020)()(1122nxybyaySe222020nxybyayZySZye第五十二页,讲稿共六十一页哦第五十三页,讲稿共六十一页哦第五十四页,讲稿共六十一页哦 一、多元线性回归的概念 二、多元线性回归的参数估计 三、负相关系数和偏相关系数 四、多元线性回归的估计标

20、准误差 五、多元线性回归分析应用实例第五十五页,讲稿共六十一页哦 一、多元线性回归的概念一、多元线性回归的概念 多元线性回归的概念:在线性相关条件下,两个以上自变量对一个因变量的一般数量关系,称之为多元线性回归。表示这种关系的数学式,为多元线性回归方程。kkxbxbxbay2211第五十六页,讲稿共六十一页哦 二、多元线性回归的参数估计二、多元线性回归的参数估计 最小二乘法:对残差平方和求各个参数的偏导数,组成正规方程组;最后解该方程组得到回归方程的各个参数。第五十七页,讲稿共六十一页哦三、复相关系数和偏相关系数三、复相关系数和偏相关系数(一)复相关系数:衡量的是y对x1 x2 xk相关的密切程度。(二)偏相关系数:在保持其他变量不变的情况下,任何两个变量之间的相关关系。第五十八页,讲稿共六十一页哦四、多元线性回归的估计标准误差四、多元线性回归的估计标准误差 其标准误差也是根据因变量的实际值和估计值的平均离差来计算的。计算公式如下:knyySny212第五十九页,讲稿共六十一页哦(五)多元线性回归分析应用实例 见教材P213。第六十页,讲稿共六十一页哦本章结束!本章结束!第六十一页,讲稿共六十一页哦

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com