回归讲稿年讲稿.ppt

上传人:石*** 文档编号:84150524 上传时间:2023-04-02 格式:PPT 页数:54 大小:2.21MB
返回 下载 相关 举报
回归讲稿年讲稿.ppt_第1页
第1页 / 共54页
回归讲稿年讲稿.ppt_第2页
第2页 / 共54页
点击查看更多>>
资源描述

《回归讲稿年讲稿.ppt》由会员分享,可在线阅读,更多相关《回归讲稿年讲稿.ppt(54页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、回归讲稿年回归讲稿年1第一页,讲稿共五十四页哦前言前言1 1 1 1 回回归归分分析析是是数数理理统统计计应应用用最最广广泛泛的的分分支支之之一一,它它不不仅仅是是统统计计专专业业本本科科生生和和研研究究生生的的必必修修课课,而而且且也也是是生生物物、医医学学、经经济济、管管理理、商商业业、金金融融、工工程程技技术术以以及及社社会会科科学学等等学学科科的的本本科科生生和和研研究究生生统统计计课课程程的的重重要内容。要内容。2第二页,讲稿共五十四页哦前言前言2 2 2 2本教材的特点本教材的特点:在不失严谨的前提下,在不失严谨的前提下,突出了实际案例的应用和统计思想的渗透突出了实际案例的应用和统

2、计思想的渗透;结合统计软件较全面地系统介绍了回归分析的实用方法。结合统计软件较全面地系统介绍了回归分析的实用方法。在系统介绍回归分析的基本理论和方法的同时在系统介绍回归分析的基本理论和方法的同时v尽尽力力结结合合中中国国社社会会、经经济济、自自然然科科学学等等领领域域的的研研究究实实例例;在每章后附有思考题与练习题在每章后附有思考题与练习题v把回归分析方法与实际应用结合起来把回归分析方法与实际应用结合起来;v注意定性分析与定量分析的紧密结合注意定性分析与定量分析的紧密结合;v努力把实践中应用回归分析的经验和体会融入教材努力把实践中应用回归分析的经验和体会融入教材v几几乎乎每每种种方方法法都都强

3、强调调它它的的优优缺缺点点和和实实际际应应用用中中应应注注意意的的问问题题对每章的内容给予综述性的评注。对每章的内容给予综述性的评注。在每章后附有思考题与练习题在每章后附有思考题与练习题3第三页,讲稿共五十四页哦前言前言3 3 3 3 回回归归分分析析的的应应用用离离不不开开计计算算机机,本本书书的的案案例例主主要要运运用用在在我我国国已已很很流流行行的的SPSS软软件件实实现现,部部分分内内容容用用Excel和和SAS软软件件完完成成。该该教教材材的的一一个个显显著著特特点点是是在在每每种种方方法法之之后后结结合合实实例介绍例介绍SPSS或或Excel、SAS的实际操作过程。的实际操作过程。

4、我我们们将将在在实实验验中中使使用用相相关关软软件件。并并要要求求掌握相关软件编程和应用软件。掌握相关软件编程和应用软件。4第四页,讲稿共五十四页哦前言前言4 4 4 4 我我们们作作为为数数学学学学院院统统计计专专业业的的学学生生,在在理理论论上上应应比比本本教教材材有有更更深深入入的的了了解,相关内容将在授课时补充。解,相关内容将在授课时补充。参考教材参考教材l 周纪芗,回归分析,华东师范大学出版社,周纪芗,回归分析,华东师范大学出版社,1993l 王王松松桂桂等等人人,线线性性统统计计模模型型,线线性性统统计计模模型型 线线性性回回归归与与方方差差分分析析,高高等等教教育育出出版版社,社

5、,1999l 张启锐,张启锐,应用回归分析,地质出版社,应用回归分析,地质出版社,1988l G.A.F.塞伯塞伯 线性回归分析,科学出版社,线性回归分析,科学出版社,1987l David G.Kleinbaum等等 Applied Regression Analysis and Other Multivariable Method(Third Edition)(应应用用回回归归分分析析和和其其它它多多元元方方法法)机机械械工工业出版社业出版社 2003l S.韦韦斯斯伯伯特特格格(S.Weisberg)应应用用线线性性回回归归(第第2版版)(Applied Linear Regressio

6、n)中国统计出版社中国统计出版社 1998(有第有第3版原文照相版版原文照相版)相关要求相关要求l 每周一交作业每周一交作业,每次上机实验都要交作业每次上机实验都要交作业,计算成绩计算成绩考试形式考试形式l大考大考70%,中考中考20%,平时平时20%(实验实验10%)5第五页,讲稿共五十四页哦第第1章章 回归分析概述回归分析概述1 1 为为了了在在系系统统学学习习回回归归分分析析之之前前对对该该课课程程的的思思想想方方法法、主主要要内内容容、发发展展现现状状等等有有一一个个概概括括的的了了解解,本本章章将将由由变变量量间间的的统统计计关关系系,引引申申出出自自然然科科学学与与社社会会经经济济

7、等等现现象象中中的的相相关关与与回回归归问问题题,并并扼扼要要介介绍绍“回回归归”名名称称的的由由来来及及近近代代回回归归分分析析的的发发展展、回回归归分分析析研研究究的的主主要要内内容容,以以及及建建立立回回归归模模型型的的步步骤骤与与建建模过程中应注意的问题。模过程中应注意的问题。6第六页,讲稿共五十四页哦1.1 变量间的统计关系变量间的统计关系1 1 1 1 自自然然科科学学与与社社会会经经济济等等现现象象之之间间的的相相互互联联系系和和制制约约是是一个普遍规律。一个普遍规律。例例如如,社社会会经经济济的的发发展展总总是是与与一一定定的的经经济济变变量量的的数数量量变变化化紧紧密密联联系

8、系的的。社社会会经经济济现现象象不不仅仅同同和和它它有有关关的的现现象象构构成成一一个个普普遍遍联联系系的的整整体体,而而且且在在它它的的内内部部也也存存在在着着许许多多彼彼此此关关联联的的因因素素,在在一一定定的的社社会会环环境境、地地理理条条件件、政政府府决决策策影影响响下下,一一些些因因素素推推动动或或制制约约另另外外一一些些与与之之联联系系的的因因素素发发生生变变化化。这这种种状状况况表表明明,在在经经济济现现象象的的内内部部和和外外部部联联系系中中存存在在着着一一定定的的相相关关性性,人人们们往往往往利利用用这这种种相相关关关关系系来来制制订订有有关关的的经经济济政政策策,以以指指导

9、导、控控制制社社会会经经济济活活动动的的发发展展。要要认认识识和和掌掌握握客客观观经经济济规规律律就就必必须须探探求求经经济济现现象象间间经经济济变变量量的的变变化化规规律律,变变量量间间的的统统计计关关系系是是经经济济变变量量变变化化规规律律的的重重要特征。要特征。7第七页,讲稿共五十四页哦1.1 变量间的统计关系变量间的统计关系2 2 2 2 互互有有联联系系的的经经济济现现象象及及经经济济变变量量关关系系的的紧紧密密程程度度各各不不一一样样。一一种种极极端端的的情情况况下下是是一一个个变变量量的的变变化化能能完完全全决决定定另另一一个个变量的变化变量的变化。l 例如,一个保险公司承保汽车

10、例如,一个保险公司承保汽车5万辆,每辆保费收入为万辆,每辆保费收入为1000元,则元,则该保险公司汽车承保总收入为该保险公司汽车承保总收入为5000 万元。如果把承保收入记为万元。如果把承保收入记为 y,承,承保汽车辆数记为保汽车辆数记为x,则则 y=1000 xx与与 y 两个变量间完全表现为一种确两个变量间完全表现为一种确定性关系定性关系,即函数关系即函数关系,如图如图1.1所示。所示。l 又如,银行的一年期存款利率是又如,银行的一年期存款利率是年息年息 1.98%,存入本金用,存入本金用 x 表示,表示,到期本息用到期本息用 y表示,则表示,则 y=x+1.98%x这里这里 y 与与 x

11、 仍表现为一种线性函数关系。对于任意两个变量间的函数关系,仍表现为一种线性函数关系。对于任意两个变量间的函数关系,我们可以表述为下面的数学形式我们可以表述为下面的数学形式 y=f(x)y(万万元元)图图1.1 函数关系图函数关系图y=1000 x8第八页,讲稿共五十四页哦1.1 变量间的统计关系变量间的统计关系3 3 3 3 再如,工业企业的原材料消耗总额用再如,工业企业的原材料消耗总额用 y 表示,生产量用表示,生产量用 x1表示,单位产量消耗用表示,单位产量消耗用 x2表示,原材料价格用表示,原材料价格用 x3表示,则表示,则y=x1 x2 x3这里这里 y 与与 x1,x2,x3 仍是一

12、种确定性的函数关系,但它们显然仍是一种确定性的函数关系,但它们显然不是线性函数关系了。我们可以将变量不是线性函数关系了。我们可以将变量 y 与与 p 个变量个变量 x1,x2,xp之间存在着的某种函数关系用下面的形式表示之间存在着的某种函数关系用下面的形式表示 y=f(x1,x2,xp)经济数学中还有很多函数关系的例子。物理中的自由落经济数学中还有很多函数关系的例子。物理中的自由落体距离公式、初等数学中许多计算公式等体距离公式、初等数学中许多计算公式等都是变量间的函数都是变量间的函数关系关系。9第九页,讲稿共五十四页哦1.1 变量间的统计关系变量间的统计关系4 4 4 4 然然而而,现现实实世

13、世界界中中还还有有不不少少情情况况是是两两事事物物之之间间有有着着密密切切的的联联系系,但但它它们们密密切切的的程程度度并并没没有有到到由由一一个个可可以以完完全全确确定定另另一一个个的程度的程度。下面举几个例子。下面举几个例子。1.某种高档消费品的销售量与城镇居民的收入密切相关。居民收入高了,某种高档消费品的销售量与城镇居民的收入密切相关。居民收入高了,这种消费品的销售这种消费品的销售量就大。但是由居民收入量就大。但是由居民收入 x 并不能完全确定某种高并不能完全确定某种高档消费品的销售量档消费品的销售量 y,因,因为这种高档消费品的销售为这种高档消费品的销售量还受着人们的消费习惯、量还受着

14、人们的消费习惯、心理因素、其它商品的吸心理因素、其它商品的吸引程度及价格的高低等诸引程度及价格的高低等诸因素的影响。这样变量因素的影响。这样变量 y 与变量与变量 x 就是一种就是一种非确定非确定的关系的关系,见图,见图1.2。图图1.2 y 与与 x 非确定性关系图非确定性关系图10第十页,讲稿共五十四页哦1.1 变量间的统计关系变量间的统计关系5 5 5 5 2.粮粮食食产产量量 y 与与施施肥肥量量 x 之之间间有有着着密密切切的的关关系系。在在一一定定范范围围内内,施施肥肥量量越越多多,粮粮食食产产量量就就越越高高。但但是是,施施肥肥量量并并不不能能完完全全确确定定粮粮食食产产量量,因

15、因为为粮粮食食产产量量还还与与其其它它因因素素有有关关,如如降降雨雨量量、田田间间管管理理水水平平等等。因因此此粮粮食食产产量量 y 与与施施肥肥量量 x 之之间间不不存在确切的函数关系存在确切的函数关系。3.储储蓄蓄额额与与居居民民的的收收入入密密切切相相关关,但但是是由由居居民民收收入入并并不不能能完完全全确确定定储储蓄蓄额额,因因为为影影响响储储蓄蓄额额的的因因素素很很多多,如如通通货货膨膨胀胀、股股票票价价格格指指数数、利利率率、消消费费观观念念、投投资资意意识识等等。因因此此尽尽管管储储蓄蓄额额与与居居民民的的收收入入有有密密切切的的关关系系,但但它它们们之之间间并并不不存存在在一一

16、种种确定性关系确定性关系。再再如如:广广告告费费支支出出与与商商品品销销售售额额、保保险险利利润润与与保保费费收收入入、工业产值与用电量等。这方面的例子不胜枚举。工业产值与用电量等。这方面的例子不胜枚举。11第十一页,讲稿共五十四页哦1.1 变量间的统计关系变量间的统计关系6 6 6 6 以以上上变变量量关关系系的的一一个个共共同同特特征征是是它它们们之之间间有有密密切切关关系系,但但它它们们是是一一种种非非确确定定性性关关系系。由由于于经经济济问问题题的的复复杂杂性性,有有许许多多因因素素因因为为我我们们的的认认识识以以及及其其它它客客观观原原因因的的局局限限,并并没没有有包包含含在在内内。

17、或或者者由由于于试试验验误误差差、测测量量误误差差以以及及其其它它种种种种偶偶然然因因素素的的影影响响,使使得得另另外外一一个个或或一一些些变变量量的的取取值值带带有有一一定定的的随随机机性性。因因而而当当一一个个或或一一些些变变量量取取定定值值后后,不不能能以以确确定定值值与与之之对对应。应。从从图图1.1看看到到确确定定性性的的函函数数关关系系(线线性性关关系系),各各对对应应点点完完全全落落在在一一条条直直线线上上,而而由由图图1.2看看到到,各各对对应应点点并并不不完完全全落落在在一一条条直直线线上上,即即有有的的点点在在直直线线上上,有有的的点点在在直直线线的的两两侧侧。对对于于这这

18、种种对对应应点点不不能能分分布布在在一一条条直直线线上上的的变变量量间间的的关关系系,也也就就是是变变量量 x 与与 y 之之间间有有一一定定关关系系,但但是是又又没没有有密密切切到到可可以以通通过过 x 惟惟一一确确定定 y 的的程程度度,这这种种关关系系正正是是统统计计学学中中研研究究的的重重要要内容内容。12第十二页,讲稿共五十四页哦1.1 变量间的统计关系变量间的统计关系7 7 7 7 在在统统计计推推断断中中,我我们们把把上上述述变变量量间间具具有有密密切切关关联联而而又又不不能能由由某某一一个个或或某某一一些些变变量量惟惟一一确确定定另另外外一一个个变变量量的的关关系系,称称为为变

19、变量量间间的的统统计计关关系系或或相相关关关关系系。这这种种统统计计关关系系规规律律性性的的研研究究是是统统计计学学中中研研究究的的主主要要对对象象,现现代代统统计计学学中中关关于于统统计计关关系系的的研研究究已已形形成成两个重要的分支两个重要的分支,分别称为,分别称为相关分析相关分析和和回归分析回归分析。回回归归分分析析和和相相关关分分析析都都是是研研究究变变量量间间关关系系的的统统计计学学课课题题。在在应应用用中中,两两种种分分析析方方法法经经常常相相互互结结合合和和渗渗透透,但但它它们们研研究究的的侧侧重重点点和和应应用用面面不不同同。它它们们的的差差别别主主要有以下几点:要有以下几点:

20、l 在在回回归归分分析析中中,变变量量 y 称称为为因因变变量量,处处在在被被解解释释的的特特殊殊地地位位;在在相相关关分分析析中中,变变量量 y 与与变变量量 x 处处 于于 平平 等等 的的 地地 位位,即即 研研 究究 变变 量量 y 与与 变变 量量 x 的的 密密 切切 程程 度度 与与 研研 究究 变变 量量 x 与变量与变量 y 的密切程度是一回事。的密切程度是一回事。l 相相关关分分析析中中所所涉涉及及变变量量 y 与与 x 全全是是随随机机变变量量;而而在在回回归归分分析析中中,因因变变量量y是是随随机机变变量量,自自变变量量x可可以是随机变量,也可以是非随机的确定变量。通常

21、的回归模型中,我们总是假定以是随机变量,也可以是非随机的确定变量。通常的回归模型中,我们总是假定x是非随机的确定变量。是非随机的确定变量。l 相相关关分分析析的的研研究究主主要要是是为为了了刻刻画画两两类类变变量量间间线线性性相相关关的的密密切切程程度度;而而回回归归分分析析不不仅仅可可以以揭示变量揭示变量x对变量对变量y的影响大小,还可以由回归方程进行预测和控制。的影响大小,还可以由回归方程进行预测和控制。13第十三页,讲稿共五十四页哦1.1 变量间的统计关系变量间的统计关系8 8 8 8 由由于于回回归归分分析析与与相相关关分分析析的的研研究究侧侧重重点点不不同同,使使得得它它们们的的研研

22、究究方方法法也也大大不不相相同同。回回归归分分析析已已成成为为现现代代统统计计学学中应用最广泛、研究最活跃的一个独立分支中应用最广泛、研究最活跃的一个独立分支。14第十四页,讲稿共五十四页哦1.2 回归方程与回归名称的由来回归方程与回归名称的由来1 1 1 1 回归分析是处理变量回归分析是处理变量 x 与与 y 之间的关系的一种统计方之间的关系的一种统计方法和技术。这里所研究的变量之间的关系就是上述的统计法和技术。这里所研究的变量之间的关系就是上述的统计关系。即当给定关系。即当给定x的值,的值,y 的值不能确定,只能通过一定的值不能确定,只能通过一定的概率分析来描述。于是,我们称给定的概率分析

23、来描述。于是,我们称给定 x 时时 y 的条件数的条件数学期望学期望 f(x)=E(y|x)(1.1)为随机变量为随机变量 y 对对 x 的的回归函数回归函数,或称为随机变量,或称为随机变量 y 对对 x 的均值回归函数。的均值回归函数。(1.1)式从平均意义上刻画了变量式从平均意义上刻画了变量 x 与与 y 之间的之间的统计规律统计规律。15第十五页,讲稿共五十四页哦1.2 回归方程与回归名称的由来回归方程与回归名称的由来2 2 2 2 在实际问题中,我们把在实际问题中,我们把 x 称为自变量,称为自变量,y 称为因变量。如称为因变量。如果要由果要由 x 预测预测 y,就是要利用,就是要利用

24、 x,y 的观察值,即样本观测值的观察值,即样本观测值 (x1,y1),(x2,y2),(xn,yn)(1.2)来创建一个公式,当给定来创建一个公式,当给定x值后,就代入此公式算出一个值后,就代入此公式算出一个 y值,值,这个值就称为这个值就称为y的预测值。而要建立公式,就要从样本观测值的预测值。而要建立公式,就要从样本观测值(xi,yi)出发,观察出发,观察(xi,yi)在平面直角坐标系上的分布情况,在平面直角坐标系上的分布情况,图图1.2就是居民收入与商品销售额的散点图。由这个图可看出就是居民收入与商品销售额的散点图。由这个图可看出样本点基本上分布在一条直线的周围,因而要确定商品的样本点基

25、本上分布在一条直线的周围,因而要确定商品的销销售额售额 y 与居民收入与居民收入 x 的关系,可考虑用一个线性函数来描述。的关系,可考虑用一个线性函数来描述。图图1.2中的直线即为线性方程中的直线即为线性方程 E(y|x)=+x(1.3)方程方程(1.3)式中的参数式中的参数 ,尚不知道,这就需要由样本数据尚不知道,这就需要由样本数据(1.2)去进行估计。具体如何去估计参数去进行估计。具体如何去估计参数 ,,将在第二章中,将在第二章中详细介绍。详细介绍。16第十六页,讲稿共五十四页哦 当我们由样本数据当我们由样本数据(1.2)式估计出参数式估计出参数 ,的值后,以估计值的值后,以估计值 ,分分

26、析代替析代替(1.3)式中的式中的 ,,得方程,得方程(1.4)方程方程(1.4)式就称为式就称为回归方程回归方程。这里因为因变量。这里因为因变量 y 与自变量与自变量 x 的关系呈线性的关系呈线性关系,故我们称关系,故我们称(1.4)式为式为 y 对对 x 的的线性回归方程线性回归方程。又因。又因(1.4)式的建立依式的建立依赖于观察或试验积累的数据赖于观察或试验积累的数据(1.2)式,所以又称式,所以又称(1.4)式为式为经验回归方程经验回归方程。相对这种叫法,我们把相对这种叫法,我们把(1.3)式称为式称为理论回归方程理论回归方程。理论回归方程是。理论回归方程是设想把所研究问题的总体中每

27、一个体的设想把所研究问题的总体中每一个体的(x,y)值都测量了,利用其全部结果值都测量了,利用其全部结果建立的回归方程,这在实际中是做不到的。建立的回归方程,这在实际中是做不到的。理论回归方程中的理论回归方程中的 是方程是方程(1.3)式所画出的直线在式所画出的直线在 y 轴上的截距,轴上的截距,为直线的斜率,它们分别称为为直线的斜率,它们分别称为回归常数回归常数和和回归系数回归系数。而方程。而方程(1.4)式中的式中的参数参数 ,称为称为经验回归常数经验回归常数和和经验回归系数经验回归系数。1.2 回归方程与回归名称的由来回归方程与回归名称的由来3 3 3 317第十七页,讲稿共五十四页哦1

28、.2 回归方程与回归名称的由来回归方程与回归名称的由来4 4 4 4 回归分析的基本思想和方法以及回归分析的基本思想和方法以及“回归回归(regression)”名称名称的由来归功于英国统计学家的由来归功于英国统计学家F.高尔顿高尔顿(Francis Galton:18221911)。高尔顿和他的学生、现代统计学的奠基者之一。高尔顿和他的学生、现代统计学的奠基者之一K.皮尔皮尔逊逊(Karl Pearson:18571936)在研究父母的身高与其子女在研究父母的身高与其子女身高的遗传问题时,观察了身高的遗传问题时,观察了1078对夫妇,以每对夫妇的平均身对夫妇,以每对夫妇的平均身高作为高作为

29、x,而取他们的一,而取他们的一个成年儿子的身高作为个成年儿子的身高作为 y,将结果在平面直角坐标系将结果在平面直角坐标系上绘成上绘成散点图散点图,发现趋势,发现趋势近乎一条直线。计算出的近乎一条直线。计算出的回归直线方程为回归直线方程为 =33.73+0.516 x (1.5)18第十八页,讲稿共五十四页哦1.2 回归方程与回归名称的由来回归方程与回归名称的由来5 5 5 5 这种趋势及回归方程表明这种趋势及回归方程表明:父母平均身高父母平均身高 x 每增加一个单位时,其成年儿子的身每增加一个单位时,其成年儿子的身高高 y 也平均增加也平均增加 0.516 个单位。这个结果表明,虽然高个子父辈

30、确有生高个子儿子个单位。这个结果表明,虽然高个子父辈确有生高个子儿子的趋势,但父辈身高增加一个单位,儿子身高仅增加半个单位左右。反之,矮个子的趋势,但父辈身高增加一个单位,儿子身高仅增加半个单位左右。反之,矮个子父辈确有生矮个子儿子的趋势,但父辈身高减少一个单位,儿子身高仅减少半个单父辈确有生矮个子儿子的趋势,但父辈身高减少一个单位,儿子身高仅减少半个单位左右。位左右。通俗地说,一群特高个子父辈通俗地说,一群特高个子父辈(例如排球运动员例如排球运动员)的儿子们在同龄人中平均仅为的儿子们在同龄人中平均仅为高个子,一群高个子父辈的儿子们在同龄人中平均仅为略高个子;一群特矮个子父高个子,一群高个子父

31、辈的儿子们在同龄人中平均仅为略高个子;一群特矮个子父辈的儿子们在同龄人中平均仅为矮个子,一群矮个子父辈的儿子们在同龄人中平均辈的儿子们在同龄人中平均仅为矮个子,一群矮个子父辈的儿子们在同龄人中平均仅为略矮个子,即子代的平均高度向中心回归了。正是因为子代的身高有加到同龄仅为略矮个子,即子代的平均高度向中心回归了。正是因为子代的身高有加到同龄人平均身高的这种趋势,才使人类的身高在一定时间内相对稳定,没有出现父辈个人平均身高的这种趋势,才使人类的身高在一定时间内相对稳定,没有出现父辈个子高其子女个子更高,父辈个子矮其子女个子更矮的两极分化现象。这个例子生动子高其子女个子更高,父辈个子矮其子女个子更矮

32、的两极分化现象。这个例子生动地说明了生物学中地说明了生物学中“种种”的概念的稳定性的概念的稳定性。正是为了描述这种有趣的现象,高尔顿。正是为了描述这种有趣的现象,高尔顿引进了引进了“回归回归”这个名词来描述父辈身高这个名词来描述父辈身高 x 与子代身高与子代身高 y 的关系。的关系。尽管尽管“回归回归”这个名词的由来具有其特定的含义,人们在研究大量的问题中,其变这个名词的由来具有其特定的含义,人们在研究大量的问题中,其变量量 x 和和 y 之间的关系并不总是具有这种之间的关系并不总是具有这种“回归回归”的含义,但借用这个名词把研究变的含义,但借用这个名词把研究变量量 x 与与 y 间统计关系的

33、量化方法称为间统计关系的量化方法称为“回归回归”分析也算是对高尔顿这个伟大的统计学家的纪分析也算是对高尔顿这个伟大的统计学家的纪念。念。19第十九页,讲稿共五十四页哦1.3 回归分析的主要内容回归分析的主要内容及其一般模型及其一般模型1 1 1 1一、回归分析研究的主要内容一、回归分析研究的主要内容 回回归归分分析析研研究究的的主主要要对对象象是是客客观观事事物物变变量量间间的的统统计计关关系系,它它是是建建立立在在对对客客观观事事物物进进行行大大量量试试验验和和观观察察的的基基础础上上,用用来来寻寻求求隐隐藏藏在在那那些些看看上上去去是是不不确确定定的的现现象象中中的的统统计计规规律律性性的

34、的统统计计方方法法。回回归归分分析析方方法法是是通通过过建建立立统统计计模模型型来来研研究究变变量量间间相相互互关关系系的的密密切切程程度度、结结构构状状态态及及进进行模型预测的一种有效的工具。行模型预测的一种有效的工具。回归分析方法在生产实践中的广泛应用是它发展和完善的根本动力。如果从回归分析方法在生产实践中的广泛应用是它发展和完善的根本动力。如果从 19 世纪初世纪初(1809年年)高斯高斯(Gauss)提出最小二乘法算起,回归分析的历史已提出最小二乘法算起,回归分析的历史已有有 200 年。从经典的回归分析方法到近代的回归分析方法,它们所研究的内容已年。从经典的回归分析方法到近代的回归分

35、析方法,它们所研究的内容已非常丰富。如果按研究的方法来划分,回归分析研究的范围大致如下:非常丰富。如果按研究的方法来划分,回归分析研究的范围大致如下:20第二十页,讲稿共五十四页哦1.3 一、一、回归分析的主要内容回归分析的主要内容2 2 2 2回归分析回归分析21第二十一页,讲稿共五十四页哦1.3 二、回归模型的一般形式二、回归模型的一般形式3 3 3 3 如果变量如果变量 x1,x2,xp 与随机变量与随机变量 y 之间存在着相关关系,通常就意味着之间存在着相关关系,通常就意味着每当每当 x1,x2,xp 取定值后,取定值后,y 便有相应的概率分布与之对应。随机变量便有相应的概率分布与之对

36、应。随机变量 y 与与相关变量相关变量 x1,x2,xp 之间的概率模型为之间的概率模型为 y=f(x1,x2,xp)+(1.6)其中:随机变量其中:随机变量 y 称为称为被解释变量被解释变量(因变量因变量);x1,x2,xp 称为称为解释变量解释变量(自变量自变量)。在计量经济学中,也称因变量为内生变量,自变量为外生变量;。在计量经济学中,也称因变量为内生变量,自变量为外生变量;f(x1,x2,xp)为一般变量为一般变量 x1,x2,xp 的确定性关系的确定性关系,为为随机误差随机误差。正。正是因为随机误差项是因为随机误差项 的引入,才将变量之间的关系描述为一个随机方程,的引入,才将变量之间

37、的关系描述为一个随机方程,使得我们可以借助随机数学方法研究使得我们可以借助随机数学方法研究 y 与与 x1,x2,xp的关系。由于客观的关系。由于客观经济现象是错综复杂的,一种经济现象很难用有限个因素来准确说明,随机经济现象是错综复杂的,一种经济现象很难用有限个因素来准确说明,随机误差项可以概括表示人们的认识以及其它客观原因的局限而没有考虑的种种误差项可以概括表示人们的认识以及其它客观原因的局限而没有考虑的种种偶然因素。偶然因素。22第二十二页,讲稿共五十四页哦1.3 二、回归模型的一般形式二、回归模型的一般形式4 4 4 4随机误差项主要包括下列因素的影响:随机误差项主要包括下列因素的影响:

38、1.由由于于人人们们认认识识的的局局限限或或时时间间、费费用用、数数据据质质量量等等制制约约未未引引入入回回 归模型但又对回归被解释变量归模型但又对回归被解释变量 y 有影响的因素;有影响的因素;2.样本数据的采集过程中变量观察值的观测误差;样本数据的采集过程中变量观察值的观测误差;3.理论模型设定的误差;理论模型设定的误差;4.其它随机因素。其它随机因素。模型模型(1.6)式清楚地表达了变量式清楚地表达了变量 x1,x2,xp 与随机变量与随机变量 y 的相关关系,它的相关关系,它由两部分组成:由两部分组成:l 一部分是确定性函数关系,由一部分是确定性函数关系,由回归函数回归函数 f(x1,

39、x2,xp)给出;给出;l 另一部分是随机误差项另一部分是随机误差项 。由此可见,模型由此可见,模型(1.6)式准确地表达了相关关系的既有联系又不确定的特点。式准确地表达了相关关系的既有联系又不确定的特点。23第二十三页,讲稿共五十四页哦1.3 二、回归模型的一般形式二、回归模型的一般形式5 5 5 5 当概率模型当概率模型(1.6)式中回归函数为线性函数时,即有式中回归函数为线性函数时,即有y=0+1 x1+2 x2+p xp+(1.7)其中,其中,0,1,2,p 为未知参数,常称它们为回归系数。线性回归为未知参数,常称它们为回归系数。线性回归模型的模型的“线性线性”是针对未知参数是针对未知

40、参数 j(j=0,1,2,p)而言的。对于回归而言的。对于回归自变量的线性是非本质的,因为回归自变量是非线性时,常可以通过变量的自变量的线性是非本质的,因为回归自变量是非线性时,常可以通过变量的替换把它转化为线性的。替换把它转化为线性的。如果如果(xi1,xi2,xi p;yi),i=1,2,n 是是(1.7)式中变量式中变量(x1,x2,xp;y)的一组观测值,则线性回归模型可表示为的一组观测值,则线性回归模型可表示为 yi=0+1 xi1+2 xi2+p xi p+i,i=1,2,n(1.8)24第二十四页,讲稿共五十四页哦1.3 二、回归模型的一般形式二、回归模型的一般形式6 6 6 6

41、 为了估计模型参数的需要,古典线性回归模型通常应满为了估计模型参数的需要,古典线性回归模型通常应满足以下几个基本假设:足以下几个基本假设:1.自变量自变量 x1,x2,xp 是是非随机变量非随机变量,观测值观测值 xi1,xi2,xi p 是是常数常数;2.等方差及不相关等方差及不相关的假定条件为的假定条件为 E(i)=0,i=1,2,n cov(i,j)=(i,j=1,2,n)这这个个条条件件称称为为高高斯斯-马马尔尔柯柯夫夫(Gauss-Markov)条条件件,简简称称G-M条条件件。在在此此条条件件下下,便便可可以以得得到到关关于于回回归归系系数数的的最最小小二二乘乘估估计计及及误误差差

42、项项方方差差 2 估估计计的的一一些些重重要要性性质质,如如回回归归系系数数的的最小二乘估计是回归系数的最小方差线性无偏估计等。最小二乘估计是回归系数的最小方差线性无偏估计等。2,i=j0,i j25第二十五页,讲稿共五十四页哦1.3 二、回归模型的一般形式二、回归模型的一般形式7 7 7 73.正态分布正态分布的假定条件为的假定条件为 i N(0,2),i=1,2,n 1,2,n 相互独立相互独立在在此此条条件件下下便便可可得得到到关关于于回回归归系系数数的的最最小小二二乘乘估估计计及及 2估估计计的的进进一一步步的的结结果果,如如它它们们分分别别是是回回归归系系数数及及 2的的最最小小方方

43、差差无无偏估计等,并且可以进行回归的显著性检验及区间估计。偏估计等,并且可以进行回归的显著性检验及区间估计。4.通常为了便于数学上的处理,还要求通常为了便于数学上的处理,还要求 n p,即样本量的个,即样本量的个数要多于自变量的个数。数要多于自变量的个数。26第二十六页,讲稿共五十四页哦1.3 二、回归模型的一般形式二、回归模型的一般形式8 8 8 8 在在整整个个回回归归分分析析中中,线线性性回回归归的的统统计计模模型型最最为为重重要。这是因为要。这是因为l 线性回归的应用最广泛;线性回归的应用最广泛;l 只只有有在在回回归归模模型型为为线线性性的的假假定定下下,才才能能得得到到比比较较深深

44、入入和和一般的结果;一般的结果;l 有有许许多多非非线线性性的的回回归归模模型型可可以以通通过过适适当当的的转转化化变变为为线线性性回归问题进行处理。回归问题进行处理。因因此此,线线性性回回归归模模型型的的理理论论和和应应用用是是本本课课程程的的主主要内容要内容。27第二十七页,讲稿共五十四页哦1.3 二、回归模型的一般形式二、回归模型的一般形式9 9 9 9对线性回归模型通常要研究的问题有:对线性回归模型通常要研究的问题有:1.如何根据样本如何根据样本(xi1,xi2,xi p;yi),i=1,2,n 求出求出 0,1,2,p 及方差及方差 2的的估计估计;2.对回归方程及回归系数的种种假设

45、进行对回归方程及回归系数的种种假设进行检验检验3.如何根据回归方程进行如何根据回归方程进行预测和控制预测和控制,以及如何进行,以及如何进行实际问题的实际问题的结构分析结构分析。28第二十八页,讲稿共五十四页哦1.4 建立建立实际问题回归实际问题回归模型的过程模型的过程1 1 1 1在在实实际际问问题题回回归归分分析析模模型型的的建建立立和和分分析析中中,有有几几个个重重要要的的阶阶段段,为为了了给给大大家家一一个个整整体体的的印印象象,我我们们以以经经济济模模型型的的建建立立为为例例,先先用用逻逻辑辑框框图图表表示示回回归归模模型型的的建建模模过过程程。见见图图1.3:29第二十九页,讲稿共五

46、十四页哦1.4 建立实际问题回归模型的过程建立实际问题回归模型的过程2 2 2 2 下下面面我我们们按按照照逻逻辑辑框框图图顺顺序序叙叙述述每每个个阶阶段段要要做做的的工作以及应注意的问题。工作以及应注意的问题。一、根据研究的目的,设置指标变量一、根据研究的目的,设置指标变量 二、收集、整理统计数据二、收集、整理统计数据 三、确定理论回归模型的数学形式三、确定理论回归模型的数学形式 四、模型参数的估计四、模型参数的估计 五、模型的检验与修改五、模型的检验与修改 六、回归模型的应用六、回归模型的应用 30第三十页,讲稿共五十四页哦1.4 一、根据研究的目的一、根据研究的目的,设置指标变量设置指标

47、变量3 3 3 3 回回归归分分析析模模型型主主要要是是揭揭示示事事物物间间相相关关变变量量的的数数量量联联系系。首首先先要要根根据据所所研研究究问问题题的的目目的的设设置置因因变变量量 y,然然后后再再选选取取与与 y 有有统计关系的一些变量作为自变量。统计关系的一些变量作为自变量。通通常常情情况况下下,我我们们希希望望因因变变量量与与自自变变量量之之间间具具有有因因果果关关系系。尤尤其其是是在在研研究究某某种种经经济济活活动动或或经经济济现现象象时时,我我们们必必须须根根据据具具体体的的经经济济现现象象的的研研究究目目的的,利利用用经经济济学学理理论论,从从定定性性角角度度来来确确定定某某

48、种种经经济济问问题题中中各各因因素素之之间间的的因因果果关关系系。当当我我们们把把某某一一经经济济变变量量作作为为“果果”之之后后,接接着着更更重重要要的的是是要要正正确确选选择择作作为为“因因”的的变变量量。在在经经济济问问题题回回归归模模型型中中,前前者者被被称称为为“内内生生变变量量”或或“被被解解释释变变量量”,后后者者被被称称为为“外外生生变变量量”或或“解解释释变变量量”。变变量量的的正正确确选选择择关关键键在在于于能能否否正正确确把把握握所所研研究究的的经经济济活活动动的的经经济济学学内内涵涵。这这就就要要求研究者对所研究的经济问题及其背景有足够的了解。求研究者对所研究的经济问题

49、及其背景有足够的了解。例例如如,要要研研究究中中国国的的通通货货膨膨胀胀问问题题,必必须须懂懂得得一一些些金金融融理理论论。通通常常把把全全国国零零售售物物价价总总指指数数作作为为衡衡量量通通货货膨膨胀胀的的重重要要指指标标,那那么么,全全国国零零售售物物价价总总指指数数作作为为被被解解释释变变量量(因因变变量量),影影响响全全国国物物价价指指数数的的有有关关因因素素就就作作为为解解释释变变量量(自自变变量量)。某某文文献献在在研研究究中中国国通通货货膨膨胀胀问问题题时时,曾曾把把国国民民收收入入、居居民民存存款款、工工农农业业总总产产值值、全全民民所所有有制制单单位位固固定定资资产产投投资资

50、、货货币币流流通通量量、职职工工平平均均工工资资、社社会会商商品品零零售售总总额额等等18个个指指标标确确定定为解释变量为解释变量(自变量自变量)。31第三十一页,讲稿共五十四页哦1.4 一、根据研究目的,设置指标变量一、根据研究目的,设置指标变量4 4 4 4 对对一一个个具具体体的的经经济济问问题题,当当研研究究目目的的确确定定之之后后,被被解解释释变变量量就就容容易易确确定定下下来来,被被解解释释变变量量一一般般直直接接表表达达研研究究的的目目的的。而而对对被被解解释释变变量量有有影影响响的的解解释释变变量量的的确确定就不太容易。这是因为定就不太容易。这是因为l 我们的认识有局限性,可能

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com