第七章相关与回归精选文档.ppt

上传人:石*** 文档编号:45887581 上传时间:2022-09-25 格式:PPT 页数:57 大小:3.06MB
返回 下载 相关 举报
第七章相关与回归精选文档.ppt_第1页
第1页 / 共57页
第七章相关与回归精选文档.ppt_第2页
第2页 / 共57页
点击查看更多>>
资源描述

《第七章相关与回归精选文档.ppt》由会员分享,可在线阅读,更多相关《第七章相关与回归精选文档.ppt(57页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、第七章相关与回归本讲稿第一页,共五十七页一、相关分析概述一、相关分析概述二、相关关系的测定二、相关关系的测定11.111.1相关分析相关分析本讲稿第二页,共五十七页 出租汽车费用与行驶里程:出租汽车费用与行驶里程:总费用总费用=行驶里程行驶里程 每公里单价每公里单价 家庭收入与恩格尔系数:家庭收入与恩格尔系数:家庭收入高,则恩格尔系数低。家庭收入高,则恩格尔系数低。函数关系函数关系(确定性关系)(确定性关系)相关关系相关关系(非确定性关系)(非确定性关系)比较下面两种现象间的依存关系比较下面两种现象间的依存关系本讲稿第三页,共五十七页现象间的依存关系大致可以分成两种类型:现象间的依存关系大致可

2、以分成两种类型:函数关系函数关系指现象间所具有的严格的确定性的依指现象间所具有的严格的确定性的依存关系存关系相关关系相关关系指客观现象间确实存在,但数量上指客观现象间确实存在,但数量上不是严格对应的依存关系不是严格对应的依存关系函数关系与相关关系之间并无严格的界限:函数关系与相关关系之间并无严格的界限:函数关系与相关关系之间并无严格的界限:函数关系与相关关系之间并无严格的界限:有函数关系的有函数关系的有函数关系的有函数关系的变量间,由于有测量误差及各种随机因素的干扰,可表变量间,由于有测量误差及各种随机因素的干扰,可表变量间,由于有测量误差及各种随机因素的干扰,可表变量间,由于有测量误差及各种

3、随机因素的干扰,可表现为相关关系;对具有相关关系的变量有深刻了解之后,现为相关关系;对具有相关关系的变量有深刻了解之后,现为相关关系;对具有相关关系的变量有深刻了解之后,现为相关关系;对具有相关关系的变量有深刻了解之后,相关关系有可能转化为或借助函数关系来描述。相关关系有可能转化为或借助函数关系来描述。相关关系有可能转化为或借助函数关系来描述。相关关系有可能转化为或借助函数关系来描述。本讲稿第四页,共五十七页按涉及变量的多少分为按涉及变量的多少分为相相关关关关系系的的种种类类按照表现形式不同分为按照表现形式不同分为按照变化方向不同分为按照变化方向不同分为一元相关一元相关多元相关多元相关直线相关

4、直线相关曲线相关曲线相关负相关负相关正相关正相关相关分析的种类相关分析的种类本讲稿第五页,共五十七页一、相关分析概述一、相关分析概述二、相关关系的测定二、相关关系的测定11.111.1相关分析相关分析本讲稿第六页,共五十七页定性分析定性分析是依据研究者的理论知识和实践经验,是依据研究者的理论知识和实践经验,对客观现象之间是否存在相关关系,对客观现象之间是否存在相关关系,以及何种关系作出判断以及何种关系作出判断定量分析定量分析在定性分析的基础上,通过编制在定性分析的基础上,通过编制相关相关表表、绘制、绘制相关图相关图、计算、计算相关系数相关系数与与判判定系数定系数等方法,来判断现象之间相关的等方

5、法,来判断现象之间相关的方向、形态及密切程度方向、形态及密切程度相关关系的测定相关关系的测定本讲稿第七页,共五十七页简单简单相关表相关表适用于所观察的样本单位数适用于所观察的样本单位数较少,不需要分组的情况较少,不需要分组的情况分组分组相关表相关表适用于所观察的样本单位数适用于所观察的样本单位数较多标志变异又较复杂,需较多标志变异又较复杂,需要分组的情况要分组的情况将现象之间的相互关系,用将现象之间的相互关系,用表格的形式来反映。表格的形式来反映。相关表相关表本讲稿第八页,共五十七页正正 相相 关关负负 相相 关关曲线相关曲线相关不不 相相 关关xyxyxyxy又称又称散点图散点图,用直角坐标

6、系的,用直角坐标系的x轴代表自变量,轴代表自变量,y轴代表因变量,将两个变量间相对应的变量值用轴代表因变量,将两个变量间相对应的变量值用坐标点的形式描绘出来,用以表明相关点分布状坐标点的形式描绘出来,用以表明相关点分布状况的图形。况的图形。相关图相关图本讲稿第九页,共五十七页在在直线相关直线相关的条件下,用以反映的条件下,用以反映两变量两变量间间线性线性相关相关密切程度的统计指标,用密切程度的统计指标,用r表示表示相关系数相关系数本讲稿第十页,共五十七页相关系数相关系数r r的取值范围:的取值范围:-1r1-1r1r0 为为正相关正相关,r 0 为为负相关负相关;|r|=0 表示不存在表示不存

7、在线性线性关系;关系;|r|1 表示表示完全完全线性线性相关相关;0|r|1表示存在表示存在不同程度线性相关不同程度线性相关:|r|0.4 为低度线性相关;为低度线性相关;0.4|r|0.7为显著性线性相关;为显著性线性相关;0.7|r|1.0为为高度高度显著性线性相关。显著性线性相关。本讲稿第十一页,共五十七页是相关系数的平方,用是相关系数的平方,用 表表示;用来衡量回归方程对示;用来衡量回归方程对y y的的解释程度。解释程度。判定系数取值范围:判定系数取值范围:越接近于越接近于1 1,表明,表明x x与与y y之间之间的相关性越强;的相关性越强;越接近于越接近于0 0,表明两个变量之间几乎

8、没有直,表明两个变量之间几乎没有直线相关关系线相关关系.判定系数判定系数本讲稿第十二页,共五十七页结论:结论:工业总产值与能源消耗量之间存在工业总产值与能源消耗量之间存在高度的正相关关系,能源消耗量高度的正相关关系,能源消耗量x的变化能的变化能够解释工业总产值够解释工业总产值y变化的变化的95.2。【例例】计算工业总产值与能源消耗量之间的相计算工业总产值与能源消耗量之间的相关系数及判定系数关系数及判定系数 资料资料本讲稿第十三页,共五十七页第十一章第十一章 回归分析与相关分析回归分析与相关分析11.111.1相关分析相关分析11.211.2一元线性回归分析一元线性回归分析本讲稿第十四页,共五十

9、七页一、回归分析概述一、回归分析概述二、一元线性回归模型二、一元线性回归模型三、回归估计标准差三、回归估计标准差四、线性相关的显著性检验四、线性相关的显著性检验五、回归估计与预测五、回归估计与预测11.211.2一元线性回归分析一元线性回归分析本讲稿第十五页,共五十七页回归分析回归分析指根据相关关系的数量表达指根据相关关系的数量表达式(回归方程式)与给定的式(回归方程式)与给定的自自变量变量x x,揭示,揭示因变量因变量y y在数量上在数量上的平均变化和求得因变量的预的平均变化和求得因变量的预测值的统计分析方法测值的统计分析方法回归:退回回归:退回regression本讲稿第十六页,共五十七页

10、回归分析与相关分析回归分析与相关分析q理论和方法具有一致性;理论和方法具有一致性;q无相关就无回归,相关程度越高,回归越无相关就无回归,相关程度越高,回归越好;好;q 相关系数和回归系数方向一致,可以互相关系数和回归系数方向一致,可以互相推算。相推算。联系:联系:本讲稿第十七页,共五十七页q相关分析中相关分析中x与与y对等,回归分析中对等,回归分析中x与与y要确要确定自变量和因变量;定自变量和因变量;q相关分析中相关分析中x、y均为随机变量,回归分析中均为随机变量,回归分析中只有只有y为随机变量;为随机变量;q相关分析测定相关程度和方向,回归分析用回相关分析测定相关程度和方向,回归分析用回归模

11、型进行预测和控制。归模型进行预测和控制。回归分析与相关分析回归分析与相关分析区别:区别:本讲稿第十八页,共五十七页注意注意 我们不能把回归分析看作是在变我们不能把回归分析看作是在变量间建立一个因果关系的过程。量间建立一个因果关系的过程。回归分析只能表明,变量是如何回归分析只能表明,变量是如何或者是以怎样的程度彼此联系在或者是以怎样的程度彼此联系在一起的。有关因果关系的任何结一起的。有关因果关系的任何结论,必须建立在理论分析的基础论,必须建立在理论分析的基础之上。之上。本讲稿第十九页,共五十七页回归分析的种类回归分析的种类一元回归一元回归(简单回归)(简单回归)多元回归多元回归(复回归复回归)线

12、性回归线性回归非线性回归非线性回归一一 元元线线性性回回归归Simple Linear regression按自变量的按自变量的 个数分个数分按回归曲线按回归曲线的形态分的形态分本讲稿第二十页,共五十七页一、回归分析概述一、回归分析概述二、一元线性回归模型二、一元线性回归模型三、回归估计标准差三、回归估计标准差四、线性相关的显著性检验四、线性相关的显著性检验五、回归估计与预测五、回归估计与预测11.211.2一元线性回归分析一元线性回归分析本讲稿第二十一页,共五十七页一元线性回归模型一元线性回归模型对于经判断具有线性关系的两个变量对于经判断具有线性关系的两个变量y y与与x x,构造一元线性回

13、归模型为:,构造一元线性回归模型为:假定假定E()=0,有总体一元线性回归方程,有总体一元线性回归方程:本讲稿第二十二页,共五十七页一元线性回归方程的几何意义一元线性回归方程的几何意义截距截距斜率斜率一元线性回归方程的可能形态一元线性回归方程的可能形态 为正为正 为负为负 为为0本讲稿第二十三页,共五十七页总体一元线性总体一元线性回归方程回归方程:样本一元线性回归方程:样本一元线性回归方程:以样本统计量估计总体参数以样本统计量估计总体参数斜率(回归系数)斜率(回归系数)截距截距截距截距a 表示在没有自变量表示在没有自变量x的影响时,其它各种的影响时,其它各种因素对因变量因素对因变量y的平均影响

14、;的平均影响;回归系数回归系数b 表明自变表明自变量量x每变动一个单位,因变量每变动一个单位,因变量y平均变动平均变动b个单位。个单位。(估计的回归方程估计的回归方程)(一元线性回归方程)(一元线性回归方程)本讲稿第二十四页,共五十七页随机干扰:随机干扰:各种偶然各种偶然因素、观察误差和其因素、观察误差和其他被忽视因素的影响他被忽视因素的影响X对对y的线性影响而形成的线性影响而形成的系统部分,反映两变的系统部分,反映两变量的平均变动关系,即量的平均变动关系,即本质特征。本质特征。本讲稿第二十五页,共五十七页残差残差(Residual):本讲稿第二十六页,共五十七页一元线性回归方程一元线性回归方

15、程中参数中参数a、b的确定:的确定:最小平方法最小平方法基本数学要求:基本数学要求:本讲稿第二十七页,共五十七页整理得到由两个关于整理得到由两个关于a、b的二元一次方的二元一次方程组成的方程组:程组成的方程组:进一步整理,有:进一步整理,有:本讲稿第二十八页,共五十七页【分析分析】因为工业总产值与能源消耗量之间存因为工业总产值与能源消耗量之间存在高度正相关关系(在高度正相关关系(),),所以可以拟合工业总产值对能源消耗量的线性所以可以拟合工业总产值对能源消耗量的线性回归方程。回归方程。【例例】建立工业总产值对能源消耗量的线建立工业总产值对能源消耗量的线性回归方程性回归方程 资料资料解:设解:设

16、线性回归方程为线性回归方程为本讲稿第二十九页,共五十七页即即线性回归方程为:线性回归方程为:线性回归方程为:线性回归方程为:计算结果表明,在其他条件不变时,能源消耗量每增计算结果表明,在其他条件不变时,能源消耗量每增加一个单位(十万吨),工业总产值将增加加一个单位(十万吨),工业总产值将增加0.79610.7961个个单位(亿元)。单位(亿元)。本讲稿第三十页,共五十七页最小二乘法估计的优良性质最小二乘法估计的优良性质q残差之和为零残差之和为零q所拟合直线通过样本散点图的重心所拟合直线通过样本散点图的重心q误差项与解释变量不相关误差项与解释变量不相关qa a与与b b分别是总体回归系数的无偏估

17、计量分别是总体回归系数的无偏估计量qa a与与b b均为服从正态分布的随机变量均为服从正态分布的随机变量本讲稿第三十一页,共五十七页一元线性回归模型的假一元线性回归模型的假定定本讲稿第三十二页,共五十七页b与与r的关系:的关系:r0 r0 r=0b0 b0 b=0本讲稿第三十三页,共五十七页判定系数与相关系数的关系判定系数与相关系数的关系本讲稿第三十四页,共五十七页判定系数与相关系数的区别:判定系数与相关系数的区别:q判定系数无方向性,相关系数则有方向,其判定系数无方向性,相关系数则有方向,其方向与样本回归系数方向与样本回归系数 b 相同;相同;q判定系数说明变量值的总离差平方和中可判定系数说

18、明变量值的总离差平方和中可以用回归线来解释的比例,相关系数只说明以用回归线来解释的比例,相关系数只说明两变量间关联程度及方向;两变量间关联程度及方向;q相关系数有夸大变量间相关程度的倾向,相关系数有夸大变量间相关程度的倾向,因而判定系数是更好的度量值。因而判定系数是更好的度量值。本讲稿第三十五页,共五十七页一、回归分析概述一、回归分析概述二、一元线性回归模型二、一元线性回归模型三、回归估计标准差三、回归估计标准差四、线性相关的显著性检验四、线性相关的显著性检验五、回归估计与预测五、回归估计与预测11.211.2一元线性回归分析一元线性回归分析本讲稿第三十六页,共五十七页回归估计标准差回归估计标

19、准差是因变量各实际值与其估计值之间的平均是因变量各实际值与其估计值之间的平均差异程度,表明其估计值对各实际值代表差异程度,表明其估计值对各实际值代表性的强弱;其值越小,回归方程的代表性性的强弱;其值越小,回归方程的代表性越强,用回归方程估计或预测的结果越准越强,用回归方程估计或预测的结果越准确。确。本讲稿第三十七页,共五十七页在大样本条件下,可用公式计算:在大样本条件下,可用公式计算:【例例】计算前面拟合的工业总产值对能源消耗量回计算前面拟合的工业总产值对能源消耗量回归方程的回归标准差归方程的回归标准差 资料资料本讲稿第三十八页,共五十七页剩余离差平方和剩余离差平方和回归离差回归离差平方和平方

20、和总离差平方和总离差平方和本讲稿第三十九页,共五十七页Lyy=U+Q总离差平方和总离差平方和回归离差平方和回归离差平方和剩余离差平方和剩余离差平方和本讲稿第四十页,共五十七页估计标准差越小,则变量间相关程度估计标准差越小,则变量间相关程度越高,回归线对越高,回归线对Y的解释程度越高。的解释程度越高。判定系数与估计标准差的关系:判定系数与估计标准差的关系:本讲稿第四十一页,共五十七页一、回归分析概述一、回归分析概述二、一元线性回归模型二、一元线性回归模型三、回归估计标准差三、回归估计标准差四、线性相关的显著性检验四、线性相关的显著性检验五、回归估计与预测五、回归估计与预测11.211.2一元线性

21、回归分析一元线性回归分析本讲稿第四十二页,共五十七页样本相关系数样本相关系数r r的显著性检验(的显著性检验(t t检验法)检验法)提出假设:提出假设:目的目的检验检验总体总体两变量间线性相关性是否显著两变量间线性相关性是否显著步步骤骤构造检验统计量:构造检验统计量:本讲稿第四十三页,共五十七页相关系数的显著性检验(相关系数的显著性检验(t t检验法)检验法)根据给定的显著性水平根据给定的显著性水平,确定临确定临界值界值 ;计算检验统计量并做出决策。计算检验统计量并做出决策。确定原假设的拒绝规则确定原假设的拒绝规则:若若 ,则接受,则接受H H0 0,表示总体两表示总体两变量间线性相关性不显著

22、变量间线性相关性不显著;若若 ,则拒绝,则拒绝H H0 0,表示总体两表示总体两变量间线性相关性显著变量间线性相关性显著步步骤骤本讲稿第四十四页,共五十七页【例例】检验工业总产值与能源消耗量之间检验工业总产值与能源消耗量之间的线性相关性是否显著的线性相关性是否显著 资料资料当当 成立时,则统计量成立时,则统计量本讲稿第四十五页,共五十七页一、回归分析概述一、回归分析概述二、一元线性回归模型二、一元线性回归模型三、回归估计标准差三、回归估计标准差四、线性相关的显著性检验四、线性相关的显著性检验五、回归估计与预测五、回归估计与预测11.211.2一元线性回归分析一元线性回归分析本讲稿第四十六页,共

23、五十七页回归方程的估计与预测回归方程的估计与预测估计的前提:估计的前提:回归方程经过检验,证明回归方程经过检验,证明 X 和和 Y 的关系在统计上是显著相关的。的关系在统计上是显著相关的。对于给定的对于给定的 X X 值,求出值,求出 Y Y 平均值的一个平均值的一个估计值或估计值或 Y Y 的一个个别值的预测值。的一个个别值的预测值。对于给定的对于给定的 X X 值,求出值,求出 Y Y 的平均值的的平均值的置信区间置信区间或或 Y Y 的一个个别值的的一个个别值的预测区间预测区间。点估计点估计区间估计区间估计本讲稿第四十七页,共五十七页点估计点估计若若 x=80(十万吨),则:(十万吨),

24、则:本讲稿第四十八页,共五十七页区间估计区间估计对于给定的对于给定的 x=x0,Y 的的1-置信区间为:置信区间为:自由度为自由度为n-2的的 t 分布分布的的 水平双侧分位数水平双侧分位数本讲稿第四十九页,共五十七页即:即:在大样本条件下,近似有:在大样本条件下,近似有:本讲稿第五十页,共五十七页SPSS输出结果(一)输出结果(一)本讲稿第五十一页,共五十七页方差分析表方差分析表SPSS输出结果(二)输出结果(二)本讲稿第五十二页,共五十七页SPSS输出结果(三)输出结果(三)本讲稿第五十三页,共五十七页35.0024.0021.34872-1.6755718.7158823.9815738

25、.0025.0023.73710-1.4496521.3653926.1088140.0024.0025.32935-1.2990423.1250927.5336042.0028.0026.92160-1.1484224.8779628.9652349.0032.0032.49447-.6212830.9293234.0596252.0031.0034.88284-.3953633.4599736.3057254.0037.0036.47509-.2447535.1163737.8338259.0040.0040.45572.1317939.1262841.7851662.0041.0042.

26、84409.3577141.4397844.2484164.0040.0044.43634.5083242.9485545.9241365.0047.0045.23247.5836343.6943746.7705668.0050.0047.62084.8095545.9037849.3379169.0049.0048.41697.8848546.6324550.2014871.0051.0050.009221.0354748.0805351.9379072.0048.0050.805341.1107748.8006052.8100876.0058.0053.989841.4120051.660

27、5556.31912非标准预测值非标准预测值标准预测值标准预测值下限下限上限上限本讲稿第五十四页,共五十七页企业编号企业编号月产量(千吨)月产量(千吨)X生产费用(万元)生产费用(万元)Y123456781.22.03.13.85.06.17.28.0628680110115132135160八个同类工业企业的月产量与生产费用八个同类工业企业的月产量与生产费用简单相关表简单相关表本讲稿第五十五页,共五十七页平均每昼平均每昼夜产量夜产量 固定资产原值固定资产原值35404045455050555560606565706006501 15506001235005502134505001517400

28、450224350400030035022223543120(百万元)(百万元)(吨)(吨)20个同类工业企业固定资产原值与平均每昼夜产量个同类工业企业固定资产原值与平均每昼夜产量分组相关表分组相关表本讲稿第五十六页,共五十七页序号序号能源消耗量能源消耗量(十万吨)(十万吨)x工业总产值工业总产值(亿元)(亿元)yx2y2xy1234567891011121314151635384042495254596264656869717276242524283231374041404750495148581225144416001764240127042916348138444096422546244761504151845776576625576784102496113691600168116002209250024012601230433648409509601176156816121998236025422560305534003381362134564408合计合计916625550862617537887本讲稿第五十七页,共五十七页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com