2012下-第8章补充-回归分析 (2).ppt

上传人:qwe****56 文档编号:69505446 上传时间:2023-01-05 格式:PPT 页数:40 大小:892.50KB
返回 下载 相关 举报
2012下-第8章补充-回归分析 (2).ppt_第1页
第1页 / 共40页
2012下-第8章补充-回归分析 (2).ppt_第2页
第2页 / 共40页
点击查看更多>>
资源描述

《2012下-第8章补充-回归分析 (2).ppt》由会员分享,可在线阅读,更多相关《2012下-第8章补充-回归分析 (2).ppt(40页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、1第八章第八章 SPSS的回归分析的回归分析-补充补充授课教师:杨小宝授课教师:杨小宝 副教授副教授北京交通大学北京交通大学 交通运输学院交通运输学院2012.11统计软件及其应用统计软件及其应用28.5 曲线估计曲线估计8.6 非线性回归非线性回归 8.7 二元二元Logit回归回归 8.8 多项多项Logit回归回归 8.9 其它回归方法其它回归方法SPSS的回归分析的回归分析-补充补充38.5 曲线估计曲线估计8.5.1 曲线估计概述8.5.2 曲线估计基本操作8.5.3 曲线估计应用举例48.5.1 曲线估计概述变量间的相关关系中,并不总是表现出线性变量间的相关关系中,并不总是表现出线

2、性关系,非线性关系也是极为常见的。关系,非线性关系也是极为常见的。变量之变量之间的非线性关系可以划分为本质线性关系和间的非线性关系可以划分为本质线性关系和本质非线性关系。本质非线性关系。本质线性关系是指变量关本质线性关系是指变量关系形式上虽然呈非线性关系,但可通过变量系形式上虽然呈非线性关系,但可通过变量变换为线性关系,并最终可通过线性回归分变换为线性关系,并最终可通过线性回归分析建立线性模型。本质非线性关系是指变量析建立线性模型。本质非线性关系是指变量关系不仅形式上呈非线性关系,而且也无法关系不仅形式上呈非线性关系,而且也无法变换为线性关系。变换为线性关系。本节的曲线估计是解决本本节的曲线估

3、计是解决本质线性关系问题的。质线性关系问题的。5常见的本质线性模型有:常见的本质线性模型有:1、二次曲线二次曲线(Quadratic),方程为方程为,变量变换后的方程为,变量变换后的方程为2、复合曲线复合曲线(Compound),方程为方程为,变量变换后的方程为,变量变换后的方程为3、增长曲线增长曲线(Growth),方程为方程为,变量变换后的方程为,变量变换后的方程为64、对数曲线对数曲线(Logarithmic),方程为方程为 ,变量变换后的线性方程为,变量变换后的线性方程为5、三次曲线三次曲线(Cubic),方程为方程为,变量变换后的方程为,变量变换后的方程为6、S曲线曲线(S),方程为

4、方程为 ,变量变换后的,变量变换后的方程为方程为7、指数曲线(指数曲线(Exponential),),方程为方程为,变量变换后的线性方程为,变量变换后的线性方程为78、逆函数(逆函数(Inverse),),方程为方程为变量变换后的方程为变量变换后的方程为9、幂函数(幂函数(Power),),方程为方程为变量变换后的方程为变量变换后的方程为10、逻辑函数(逻辑函数(Logistic),),方程为方程为 变量变换后的线性方程为变量变换后的线性方程为8SPSS曲线估计中,首先,在不能明确究竟曲线估计中,首先,在不能明确究竟哪种模型更接近样本数据时,哪种模型更接近样本数据时,可在多种可可在多种可选择的

5、模型中选择几种模型选择的模型中选择几种模型;然后然后SPSS自动完成模型的参数估计,并输自动完成模型的参数估计,并输出回归方程显著性检验的出回归方程显著性检验的F值和概率值和概率p值、值、判定系数判定系数R2等统计量;等统计量;9最后,以判定系数为主要依据选择其中的最后,以判定系数为主要依据选择其中的最优模型最优模型,并进行预测分析等。,并进行预测分析等。另外,另外,SPSS曲线估计还可以以时间为解曲线估计还可以以时间为解释变量实现时间序列的简单回归分析和趋释变量实现时间序列的简单回归分析和趋势外推分析。势外推分析。108.5.2 曲线估计的基本操作可可通通过过绘绘制制并并观观察察样样本本数数

6、据据的的散散点点图图粗粗略略确确定定被被解解释释变变量量和和解解释释变变量量之之间间的的相相关关关关系系,为为曲曲线线拟拟合合中中的的模模型型选选择择提提供供依依据据。SPSS曲曲线线估估计计的基本操作步骤是:的基本操作步骤是:1)选择菜单选择菜单Analyze Regression Curve Estimation,2)把被解释变量选到把被解释变量选到Dependent框框.11相关回归分析(年人均消费支出和教育).sav123)曲曲线线估估计计中中的的解解释释变变量量可可以以是是相相关关因因素素变变量量也也可可是是时时间间变变量量。如如果果解解释释变变量量为为相相关关因因素素变变量量,则则

7、选选择择Variable选选项项,并并把把一一个个解解释释变变量量指指定定到到Independent框框;如如果果选选择择Time参参数数则则表表示示解解释释变变量为时间变量。量为时间变量。4)在在Models中选择几种模型。中选择几种模型。5)选选择择Plot Models选选项项绘绘制制回回归归线线;选选择择Display ANOVA table输输出出各各个个模模型型的的方方差差分分析析表表和和各各回回归系数显著性检验结果。归系数显著性检验结果。至至此此,完完成成了了曲曲线线估估计计的的操操作作,SPSS将将根根据据选选择择的的模模型型自自动动进进行行曲曲线线估估计计,并并将将结结果果显

8、显示示到到输出窗口中。输出窗口中。138.5.3 应用举例1、教育支出的相关因素分析、教育支出的相关因素分析 为为研研究究居居民民家家庭庭教教育育支支出出和和消消费费性性支支出出之之间间的的关关系系,收收集集到到1978年年至至2002年年全全国国人人均均消消费费性性支支出和教育支出的数据。出和教育支出的数据。首首先先绘绘制制教教育育支支出出和和消消费费性性支支出出的的散散点点图图。观观察察散散点点图图发发现现两两变变量量之之间间呈呈非非线线性性关关系系,可可尝尝试试选选择择二二次次、三三次次曲曲线线、复复合合函函数数和和幂幂函函数数模模型型,利利用用曲曲线线估估计计进进行行本本质质线线性性模

9、模型型分分析析。其其中中,教教育支出为被解释变量,消费性支出为解释变量。育支出为被解释变量,消费性支出为解释变量。相关回归分析(年人均消费支出和教育).sav141516172、分析和预测居民在外就餐的费用、分析和预测居民在外就餐的费用 利利用用收收集集到到1978年年至至2002年年居居民民在在外外就就餐餐消消费费的的数数据据,对对居居民民未未来来在在外外就就餐餐的的趋趋势势进进行行分分析析和预测。和预测。首首先先绘绘制制就就餐餐费费用用的的序序列列图图,选选择择菜菜单单GraphsSequence。得得到到的的序序列列图图表表明明自自80年年代代以以来来居居民民在在外外就就餐餐费费用用呈呈

10、非非线线性性增增加加,90年年代代中中期期以以来来增增长长速速度度明明显显加加快快,大大致致呈呈指指数数形形式式,可可利利用用曲曲线线估估计计进进行行分分析析。由由于于要要进进行行预预测测,因因此此在在曲曲线线估估计计主主窗窗口口中中要要单单击击Save按按钮钮,出出现现如如下下窗口:窗口:18根据上一例题中的数据根据上一例题中的数据的输出结果的输出结果,分别给出分别给出了四种模型的预测值了四种模型的预测值19Save Variables框框中中:Predicted values表表示示保保存存预预测测值值;Residual表表示示保保存存残残差差;Prediction interval表示保

11、存预测值默认表示保存预测值默认95置信区间的上下限值。置信区间的上下限值。Predict cases框框中中:只只有有当当解解释释变变量量为为时时间间时时才才可可选选该该框框中中的的选选项项。Predict from estimation period through last case表表示示计计算算当当前前所所有有样样本本期期内内的的预预测测值值;Predict through表表示示计计算算指指定定样样本本期期内内的的预预测值,指定样本期在测值,指定样本期在Observation框后输入。框后输入。本本例例希希望望预预测测2003年年和和2004年年的的值值,应应在在Observatio

12、n框后输入框后输入27。208.6 非线性回归非线性回归8.6.1 问题描述8.6.2 基本操作8.6.3 应用举例21变量之间的非线性关系可以划分为本质线性变量之间的非线性关系可以划分为本质线性关系和本质非线性关系。关系和本质非线性关系。本质线性关系是指本质线性关系是指变量关系形式上虽然呈非线性关系,但可通变量关系形式上虽然呈非线性关系,但可通过变量变换为线性关系,并最终可通过线性过变量变换为线性关系,并最终可通过线性回归分析建立线性模型。回归分析建立线性模型。本质非线性关系是本质非线性关系是指变量关系不仅形式上呈非线性关系,而且指变量关系不仅形式上呈非线性关系,而且也无法变换为线性关系。此

13、时就需要用非线也无法变换为线性关系。此时就需要用非线回归方法来分析。回归方法来分析。8.6.1 问题描述228.6.2-3 基本操作与应用举例1)通通过过绘绘制制并并观观察察样样本本数数据据的的散散点点图图粗粗略略确确定定被被解释变量和解释变量之间的非线性模型形式,解释变量和解释变量之间的非线性模型形式,2)参数初始值的选择参数初始值的选择3)选择菜单选择菜单分析分析 回归回归 非线性非线性,4)把被解释变量选到把被解释变量选到因变量因变量框框,在在模型表达式中模型表达式中写出非线性模型形式写出非线性模型形式.5)再进行损失、约束、保存等设置再进行损失、约束、保存等设置23相关回归分析(年人均

14、消费支出和教育).sav24参数设置参数设置非线性函数关系形式非线性函数关系形式参数约束参数约束条件设置条件设置25输出结果输出结果迭代记录迭代记录参数估计结果参数估计结果回归方程回归方程显著性检验显著性检验268.7 二元二元Logit回归回归8.7.1 问题描述8.7.2 二项Logit回归模型8.7.3 基本操作8.7.4 应用举例27多元回归分析中要求被解释变量是数值型变多元回归分析中要求被解释变量是数值型变量,量,然而实际应用中被解释变量可能是二值然而实际应用中被解释变量可能是二值性的分类变量。性的分类变量。尤其是社会科学研究中,像尤其是社会科学研究中,像这样被解释变量是这样被解释变

15、量是0/1二值的分类变量的情二值的分类变量的情况较为普遍。况较为普遍。此时就需要用二项此时就需要用二项Logit回归回归方法来分析。方法来分析。8.7.1 问题描述28二项二项Logit回归模型的数学模型回归模型的数学模型:对于具有对于具有N个分类的品质变量个分类的品质变量,则需设置则需设置 N-1个个0/1虚拟变量虚拟变量 8.7.2 二项Logit回归模型298.7.3-4 基本操作与应用举例1)通通过过绘绘制制并并观观察察样样本本数数据据的的散散点点图图粗粗略略确确定定被被解释变量和解释变量之间的非线性模型形式,解释变量和解释变量之间的非线性模型形式,2)参数初始值的选择参数初始值的选择

16、3)选择菜单选择菜单分析分析 回归回归 二项二项Logitsitc,4)把被解释变量选到把被解释变量选到因变量框因变量框,解释解释变量选择到变量选择到协变量框协变量框中中,与普通回归类似与普通回归类似.5)再进行再进行分类、保存、选项分类、保存、选项等设置等设置相关回归分析(消费行为logistic回归).sav30主对话框操作主对话框操作-逐步筛选策略逐步筛选策略(向前向前LR)31子对话框子对话框解释变量解释变量中的分类中的分类变量设置变量设置需点击需点击更改按钮更改按钮32变量编码结果变量编码结果逐步筛选策略逐步筛选策略(向前向前LR)-结果结果 33回归方程的回归方程的显著性检验显著性

17、检验-对数似然比对数似然比卡方检验卡方检验-P29734回归系数的回归系数的显著性检验显著性检验年龄变量的年龄变量的p值大于值大于0.135错判矩阵错判矩阵越小越好越小越好越接近越接近1,模型模型拟合优度越高拟合优度越高,类似回归中的类似回归中的R回归方程的回归方程的显著性检验显著性检验36H-L检验的含义检验的含义(P288),p0.05,认为拟合优度较低认为拟合优度较低37预测分类图预测分类图预测与实际不符预测与实际不符388.8 其它回归方法其它回归方法8.8.1 多元Logit回归(因变量为多元变量因变量为多元变量)8.8.2 有序回归(因变量为顺序变量因变量为顺序变量)8.8.3 Probit回归8.8.4 加权回归8.8.5 二阶段最小二乘回归8.8.6 最佳尺度回归39对于这些内容的对于这些内容的SPSSSPSS应用,可进一步阅读应用,可进一步阅读参考书,杜强、贾丽艳,参考书,杜强、贾丽艳,SPSSSPSS统计分析统计分析从入门到精通从入门到精通,人民邮电出版社,人民邮电出版社,20112011年年该书中的第该书中的第8 8章,回归分析。章,回归分析。40Thank you

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 财经金融

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com