回归分析实验课 实验.pdf

上传人:ylj18****41534 文档编号:73139976 上传时间:2023-02-15 格式:PDF 页数:16 大小:854.73KB
返回 下载 相关 举报
回归分析实验课 实验.pdf_第1页
第1页 / 共16页
回归分析实验课 实验.pdf_第2页
第2页 / 共16页
点击查看更多>>
资源描述

《回归分析实验课 实验.pdf》由会员分享,可在线阅读,更多相关《回归分析实验课 实验.pdf(16页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、实验报告八实验报告八实验课程:实验课程:回归分析实验课回归分析实验课专业:专业:年级:年级:姓名:姓名:学号:学号:指导教师:指导教师:完成时间:完成时间:得分:得分:统计学统计学教师评语:教师评语:学生收获与思考:学生收获与思考:实验八含定性变量的回归模型(4 4学时)学时)一、实验目的一、实验目的1掌握含定性变量的回归模型的建模步骤3运用 SAS 计算含定性变量的各种回归模型的各参数估计及相关检验统计量二、二、实验理论与方法实验理论与方法在实际问题的研究中,经常会遇到一些非数量型的变量。如品质变量;性别;战争与和平。我们把这些品质变量也称为定性变量,在建立回归模型的时候我们需要考虑到这些定

2、性变量。定性变量的回归模型分为自变量含定性变量的回归模型和因变量是定性变量的回归模型。自变量含有定性变量的时候,我们一般引进虚拟变量,将这些定性变量数量化。例如研究粮食产量问题,y为粮食产量,x为施肥量,另外考虑气候问题,分为正常年份和干旱年份两种情况,这个问题数量化方法就是引入一个0-1型变量D,令Di=1表示正常年份,Di=0表示干旱年份,粮食产量的回归模型为:yi=0+1xi+2Di+i。因变量是定性变量时,一般用logistic回归模型(分组数据的logistic回归模型,未分组数据的logistic回归模型,多类别的logistic回归模型),probit回归模型等。三三.实验内容实

3、验内容1用DATA步建立一个永久SAS数据集,数据集名为xt103,数据见表21;对数据集xt103,建立y对公司规模和公司类型的回归,并对所得到的模型进行解释。2研制一种新型玻璃,对其做耐冲实验。用一个小球从不同的高度h对玻璃做自由落体撞击,玻璃破碎记为y=1,玻璃未破碎记y=0.数据见表22.是对表中数据建立玻璃耐冲性对高度h的logistic回归,并解释回归方程的含义。3某学校对本科毕业生的去向做了一个调查,分析影响毕业去向的相关因素,结果见表23.其中毕业去向“1”=工作,“2”=读研,“3”=出国留学。性别“1”=男生,“0”=女生。用多类别的Logisitic回归分析影响毕业去向的

4、因素。四实验仪器四实验仪器计算机和 SAS 软件五五.实验步骤和结果分析实验步骤和结果分析1用DATA步建立一个永久SAS数据集,数据集名为xt103,数据见表21;对数据集xt103,建立y对公司规模和公司类型的回归,并对所得到的模型进行解释。R 检验中 R 方为 0.8951,可以认为回归拟合效果较好。回归方程通过 F 检验,说明模型是显著成立的。由参数估计表,可以看出,全部变量都是显著的,回归方程为:y 33.870.102x18.06x2其中,x2 是虚拟变量,当公司类型为“互助”时,x2 为 0,为“股份”时,x2 为 1。由方程可知,x2 为 1,即股份制公司的保险革新措施速度 y

5、 会更大。股份制公司采取保险革新措施的积极性比互助型公司高,股份制公司建立在共同承担风险上,更愿意革新。公司规模越大,采取保险革新措施的倾向越大:大规模公司保险制度的更新对公司的影响程度比小规模公司大。SAS 程序:data xt103;input y x1 x2;/*引入虚拟变量,将公司类型的互助设为 0,股份设为 1*/cards;17151 02692021175 03031022104 00277 012210 019120 04290 016238 028164 115272 111295 1386813185121224 120166 113305 130124 114246 1;

6、run;procproc regreg data=xt103;model y=x1 x2;runrun;2研制一种新型玻璃,对其做耐冲实验。用一个小球从不同的高度h对玻璃做自由落体撞击,玻璃破碎记为y=1,玻璃未破碎记y=0.数据见表22.是对表中数据建立玻璃耐冲性对高度h的logistic回归,并解释回归方程的含义。模型信息:模型解出的是y=0的概率。由三个检验中,统计量的P值都小于0.05,可以认为模型是显著的。由 Wald检验的显著性概率及其P 值,可以看出,h 变量对方程的影响是显著的。由极大似然估计,各个参数系数也通过检验。因此模型有效。p(y 0)exp(14.597.98h)二元

7、 logit 模型为1exp(14.597.98h)模型意义为,小球掉落高度为h,则玻璃未破碎的概率为p,而 y=0 表示玻璃未破碎。也就是说,该种新型的玻璃,用小球对其撞击,当小球的掉落高度为 h 时,玻璃未破碎的概率就是p(y 0)exp(14.597.98h)1exp(14.597.98h),那么,玻璃会破碎的概率就为 1-p(y=0),这也可以看成是一种比例,就是大量实验中,同个高度h,玻璃会被击破的比例。SAS 程序:datadata wjz;input h y;/*引入虚拟变量,将公司类型的互助设为 0,股份设为 1*/cards;1.5001.5201.5401.5601.581

8、1.6001.6201.6401.6601.6811.7001.7201.7401.7611.7801.8011.8201.8401.8611.8811.9001.9211.9401.9611.9812.001;run;procproc logisticlogistic data=wjz;model y=h;runrun;procproc logisticlogistic data=wjz;class h;model y=h/link=glogit aggregate scale=none;runrun;3某学校对本科毕业生的去向做了一个调查,分析影响毕业去向的相关因素,结果见表23.其中毕业

9、去向“1”=工作,“2”=读研,“3”=出国留学。性别“1”=男生,“0”=女生。用多类别的Logisitic回归分析影响毕业去向的因素。专业课x1英语x2性别x3月生活费x4毕业去向毕业去向 y y两个统计量的 P 值均大于 0.05,说明模型拟合的较好。检验全局零假设:BETA=0 无效假设检验结果(似然比,评分)的结果 P 值均小于 0.01,具有显著统计学意义。三个变量中,有两个是不显著的变量,x3,x2,剔除 x3:两个统计量的 P 值均大于 0.05,说明模型拟合的较好。检验全局零假设:BETA=0 无效假设检验结果(似然比,评分,wald)的结果 P 值均小于 0.01,具有显著

10、统计学意义。三个变量都是显著的。以 x4=“1”,即参加工作,为参照。由模型可以看出:p(y 2)exp(-19.1160.17x10.038x20.004x4)1exp(-19.1160.17x10.038x20.004x4)exp(-18.010.012x10.122x20.0101x4)p(y 3)exp(-18.010.012x10.122x20.0101x4)1exp(-19.1160.17x10.038x20.004x4)exp(-18.010.012x10.122x20.0101x4)从参数估计表中,与参加工作的同学相比,读研的(y=2)的同学相比,读研的同学其专业课成绩更好(x

11、1 的 P 值=0.003),而外语成绩(x2 的 p 值=0.356)和经济状况(x4 的 P 值=0.184)没有显著差异;出国留学的(y=3)学生其专业课成绩和参加工作的没有显著差异,外语成绩和经济状况则更好。Sas 程序:data a;input x1 x2 x3 x4 y;cards;9565.01600 26362.00850 18253.00700 26088.00850 37265.01750 18585.00100039595.00120029292.01950 26363.00850 17875.01900 19078.00500 18283.01750 28065.018

12、50 38375.00600 26090.00650 37590.01800 26383.01700 18575.00750 27386.00950 28666.01150039363.00130027372.00850 18660.01950 27663.00110019686.00750 27175.01100016372.01850 26088.00650 16795.01500 18693.00550 16376.00650 18686.00750 27685.01650 18292.01950 37360.00800 18285.01750 27575.00750 17263.016

13、50 18188.00850 39296.01950 2;run;procproc printprint;runrun;procproc logisticlogistic;class x3;model y(ref=3)=x1 x2 x3 x4/link=glogit aggregate scale=none;runrun;procproc logisticlogistic;class x3;model y(ref=3)=x1 x2 x4/link=glogit aggregate scale=none;runrun;procproc logisticlogistic;class x3;mode

14、l y(ref=1)=x1 x2 x4/link=glogit aggregate scale=none;runrun;六收获与思考六收获与思考七七.思考题思考题当自变量是定性变量的时候,我们需要引进虚拟变量进行数量化,当定性变量有 n 个水平的时候,我们该引进多少的虚拟变量,否则会怎样?不妨试试在sas 中试试会出现什么问题。答:当定性变量有 n 个水平时应该引进 n-1 个虚拟变量。否则最后一个虚拟变量无法用最小二乘估计计算出来。例:X1-X3 为虚拟变量。DataData a;input x1 x2 x3 x y;cards;1 0 0 1.26 75 1 0 0 1.35 77 1 0

15、 0 1.40 78 1 0 0 1.58 820 1 0 1.71 65 0 1 0 1.76 66 0 1 0 1.80 68 0 1 0 1.85 700 0 1 1.22 68 0 0 1 1.35 69 0 0 1 1.46 70 0 0 1 1.44 72;procproc regreg data=a;model y=x1-x3 x;runrun;X3 没有参数估计结果。因为x1 x2 x3 出现完全共线性,x1 x2 均为 0 时即代表了 x3 为 1.表表 2121iyx1公司类型117151互助22692互助321175互助43031互助522104互助60277互助7122

16、10互助819120互助94290互助1016238互助1128164股份1215272股份1311295股份143868股份153185股份1621224股份1720166股份1813305股份1930124股份2014246股份表表 2222序号 h(m)y序号 h(m)y11.500141.76121.520151.78031.540161.8014567891011121.561.581.601.621.641.661.681.701.720100001001718192021222324251.821.841.861.881.901.921.941.961.9800110101113

17、1.740262.001表表 2323序号专业课x1英语x2性别x3月生活费x4毕业去向毕业去向 y y19565.01600226362.00850138253.00700246088.00850357265.01750168585.001000379595.001200289292.01950296363.008501107875.019001119078.005001128283.017502138065.018503148375.006002156090.006503167590.018002176383.017001188575.007502197386.009502208666.0115003219363.0013002227372.008501238660.019502247663.0011001259686.007502267175.0110001276372.018502286088.006501296795.015001308693.005501316376.006501328686.007502337685.016501348292.019503357360.008001368285.017502377575.007501387263.016501398188.00850340409296.019502

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 工作报告

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com