《应用数理统计》吴翊李永乐第四章 回归分析课后作业参考答案(33页).doc

上传人:1595****071 文档编号:35314113 上传时间:2022-08-21 格式:DOC 页数:32 大小:1.61MB
返回 下载 相关 举报
《应用数理统计》吴翊李永乐第四章 回归分析课后作业参考答案(33页).doc_第1页
第1页 / 共32页
《应用数理统计》吴翊李永乐第四章 回归分析课后作业参考答案(33页).doc_第2页
第2页 / 共32页
点击查看更多>>
资源描述

《《应用数理统计》吴翊李永乐第四章 回归分析课后作业参考答案(33页).doc》由会员分享,可在线阅读,更多相关《《应用数理统计》吴翊李永乐第四章 回归分析课后作业参考答案(33页).doc(32页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、-第四章 回归分析课后作业参考答案4.1 炼铝厂测得铝的硬度x与抗张强度y的数据如下:68537084607251837064288298349343290354283324340286(1)求y对x的回归方程(2)检验回归方程的显著性()(3)求y在x=65处的预测区间(置信度为0.95)解:(1) 1、计算结果一元线性回归模型只有一个解释变量其中:x为解释变量,y为被解释变量,为待估参数,位随机干扰项。使用普通最小二乘法估计参数上述参数估计可写为所求得的回归方程为:实际意义为:当铝的硬度每增加一个单位,抗张强度增加1.80个单位。2、软件运行结果根据所给数据画散点图由散点图不能够确定y与x

2、之间是否存在线性关系,先建立线性回归方程然后看其是否能通过检验线性回归分析的系数模型 非标准化系数标准化系数T值 P值95% 系数的置信区间 学生残差 下限上限1常数项193.95146.7964.1450.00386.039301.862 x1.8010.6850.6812.6290.0300.2213.381由线性回归分析系数表得回归方程为:,说明x每增加一个单位,y相应提高1.801。(2) 1、计算结果回归方程的显著性检验(F检验) 线性回归效果不显著 线性回归效果显著在给定显著性水平时,所以拒绝,认为方程的线性回归效果显著回归系数的显著性检验(t检验) 在给定显著性水平时,所以拒绝,

3、认为回归系数显著,说明铝的硬度对抗张强度有显著的影响。回归方程的线性显著性检验(r检验) x与y线性无关 x与y线性相关在给定显著性水平时,所以拒绝,认为x与y之间具有线性关系。2、软件运行结果模型摘要模型R修正的估计的学生误差10.681(a)0.4630.39622.685由上表得r=0.681,说明y和x的之间具有线性关系。方差分析表模型 平方和自由度平均平方值F值P值1回归平方和3555.54113555.5416.9090.030(a) 残差平方和4116.9598514.620 总平方和7672.5009 由方差分析表知,p值小于给定的,说明回归方程通过F检验,回归方程显著。线性回

4、归分析的系数模型 非标准化系数标准化系数T值 P值95% 系数的置信区间 学生残差 下限上限1常数项193.95146.7964.1450.00386.039301.862 x1.8010.6850.6812.6290.0300.2213.381由线性回归分析系数表知,p值小于给定的,认为回归系数显著,说明铝的硬度对抗张强度有显著的影响。综上所述,建立的回归方程通过以上的r检验、F检验、t检验,证明回归方程效果显著。(3)当=65时,代入上述回归方程得=310.996在1-a的置信度下,的置信区间为 95%置信度下的预测区间为 255.988 366.004。4.2 在硝酸钠()溶解度试验中,

5、对不同温度测得溶解于100ml的水中的硝酸钠重量y的观测值如下:041015212936516866.771.076.380.685.792.999.9113.6125.1(1)求回归方程(2)检验回归方程的显著性(3)求y在时的预测区间(置信度为0.95)解: (1) 1、计算结果一元线性回归模型只有一个解释变量其中:t为解释变量,y为被解释变量,为待估参数,位随机干扰项。使用普通最小二乘法估计参数上述参数估计可写为所求得的回归方程为:实际意义为:在温度为0时,硝酸钠的溶解度为67.5313,温度每升高一度,溶解度增加0.8719。2、软件运行结果根据所给数据画散点图由散点图可以看出y与t之

6、间存在线性关系,因此建立线性回归模型如下线性回归分析的系数模型 非标准化系数标准化系数T值 P值95% 系数的置信区间 学生残差 下限上限1常数项67.5310.535126.3090.00066.26768.796 t0.8720.0160.99954.7470.0000.8340.910由线性回归分析系数表得回归方程为:,说明温度每增加一度,溶解度相应提高0.872。(2) 1、计算结果回归方程的显著性检验(F检验) 线性回归效果不显著 线性回归效果显著在给定显著性水平时,所以拒绝,认为方程的线性回归效果显著回归系数的显著性检验(t检验) 在给定显著性水平时,所以拒绝,认为回归系数显著,说

7、明温度对硝酸钠的溶解度有显著的影响。回归方程的线性显著性检验(r检验) t与y线性无关 t与y线性相关在给定显著性水平时,所以拒绝,认为t与y线性相关。2、软件运行结果模型摘要模型R修正的估计的学生误差10.999(a)0.9980.9971.0147由上表得r=0.999,说明y和t之间线性关系显著。方差分析表模型 平方和自由度平均平方值F值P值1回归平方和3086.25213086.2522997.2870.000(a) 残差平方和7.20871.030 总平方和3093.4608 由方差分析表知,F值很大,p值很小,回归方程通过F检验,说明回归方程显著。线性回归分析的系数模型 非标准化系

8、数标准化系数T值 P值95% 系数的置信区间 学生残差 下限上限1常数项67.5310.535126.3090.00066.26768.796 t0.8720.0160.99954.7470.0000.8340.910由线性回归分析系数表知,p值很小,通过t检验,认为回归系数显著,说明温度对硝酸钠的溶解度有显著的影响。综上所述,建立的回归方程通过以上的r检验、F检验、t检验,证明回归方程效果显著。(3)当=25时,代入上述回归方程得=89.328在1-a的置信度下,的置信区间为 95%置信度下的预测区间为 86.8113 91.8450。4.3 对同一个问题,两人分别在做线性回归。甲:取样本值

9、,得回归方程乙:取样本值,得回归方程(1)如何判断这两个回归方程是否相等(给定显著性水平)?(2)若相等,如何求一个共同的回归方程?解:检验 若,则拒绝其中检验 若,则拒绝其中检验 若,则拒绝这三步当中只有一个是拒绝原假设,则两回归方程不同。(2)共同的回归方程为:其中,4.6 某化工厂研究硝化得率y与硝化温度、硝化液中硝酸浓度之间的统计相关关系。进行10次试验,得实验数据如下表:16.519.715.521.420.816.623.114.521.316.493.490.886.783.592.194.989.688.187.383.490.9291.1387.9588.5790.4489.

10、8791.0388.0389.9385.58试求y对的回归方程。解:用所给的数据建立多元回归方程并进行检验模型摘要模型R修正的估计的学生误差10.927(a)0.8590.8190.76066由上表得r=0.927,说明y和x的之间线性关系显著。方差分析表模型平方和自由度平均平方值F值P值1回归平方和24.724212.36221.3650.001(a)残差平方和4.05070.579总平方和28.7749由方差分析表知,F值很大,p值很小,回归方程通过F检验,说明回归方程显著。线性回归分析的系数模型 非标准化系数标准化系数T值 P值95% 系数的置信区间 学生残差 下限上限r1常数项51.7

11、986.0798.5210.00037.42466.172x10.3360.0850.5643.9720.0000.1360.536 x20.3520.0650.7705.4230.0000.1980.505由线性回归分析系数表知,和的p值都很小,通过了t检验,认为回归系数显著,说明硝化温度和硝化液中硝酸浓度对硝化得率均有显著的影响。通过以上的r检验、F检验、t检验,证明回归方程效果显著。最后得到的回归方程为:说明硝化温度每增加一度,硝化得率增加0.336%;硝化液中硝酸浓度每增加1%,硝化得率增加0.352%。4.4 某建材实验室再作陶粒混凝土强度试验中,考察每立方米混凝土的水泥用量x(kg

12、)对28天后的混凝土抗压强度y()的影响,测得如下数据15016017018019020021022023024025026056.958.361.664.668.171.374.177.480.282.686.489.7(1)求y对x的线性回归方程,并问:每立方米混凝土中增加1公斤水泥时,可提高的抗压强度是多少?(2)检验线性回归方程效果的显著性();(3)求回归系数的区间估计();(4)求时,的预测值及预测区间。解:1.计算结果(1)一元线性回归模型:只有一个解释变量 Y为被解释变量,X为解释变量,与为待估参数, 为随机干扰项。用普通最小二乘法(Ordinary least squares

13、, OLS)估计和记上述参数估计量可以写成: 带入数字得:所以求得的回归方程为:y=10.283+0.304x,即 x每增加一个单位,y相应提高0.304(2)回归方程的显著性检验:总体平方和,简记为S总或Lyy回归平方和,记为S回或U残差平方和,记为S残或Qe SST=SSE(Qe)+SSR(U)对总体参数提出假设 H0: b1=0, H1:b10F检验:因为所以,拒绝原假设。T检验:因为|t|2.2281,所以拒绝原假设,即对方程有显著影响。线性关系的显著性检验:代入数据得:r=0.999拒绝原假设,即X与Y有显著的线性相关关系对总体参数提出假设 H0: b0=0, H1:b00因为|t|

14、2.2281,所以拒绝原假设,即对方程有显著影响 (3)回归系数的区间估计,构造统计量(1-a)的置信度下, 的置信区间是 得出:1的95%的置信区间为-0.295,-0.313。(4)求预测值代入数据计算得:当x=22.5时,y=17.123求预测区间构造统计量其中:从而在1-a的置信度下, Y0的置信区间为 代入数据计算得:95%置信度的预测区间为 15.43 18.815 (2)SPSS软件运行结果:根据数据的散点图为:由上图可知,x与y基本成线性关系。建立线性模型,进行相关检验:模型摘要模型R修正后的估计的学生残差1.999(a).998.998.489162由上表可以看出相关系数R接

15、近于1,y和x的线性关系显著。方差分析表模型平方和自由度均方F值P值1回归平方和1321.42711321.4275522.521.000(a)残差平方和2.39310.239总平方和1323.82011由方差分析表可见,F值很大,伴随概率p很小,说明回归方程通过F检验,及回归方程非常显著 =2.393/(12-2)=0.239 线性回归分析的系数模型 非标准化系数标准化系数T值P值95% 系数的置信区间 学生残差 下限上限r1常数项10.283.850 12.092.0008.38812.178 x.304.004.99974.314.000.295.313(1)y对x的线性回归方程,由上图

16、可得回归方程:y=10.28+0.304x。p很小,通过T检验。说明x对y有显著影响。X增加一个单位y相应提高0.304。(2)回归方程效果的显著性,以上的R检验、F检验和t检验,已证明。(3)1的95%的置信区间为-0.295,-0.313。(4)计算后的预测值表:xy预测值预测值误差预测值均数的标准误差预测下限预测上限15056.955.8811.0190.26655.28956.47316058.358.921-0.6210.23258.40459.43817061.661.96-0.360.20161.51262.40918064.665-0.40.17464.61265.389190

17、68.168.040.060.15467.69768.38320071.371.080.220.14370.76271.39821074.174.12-0.020.14373.80274.43822077.477.160.240.15476.81777.50323080.280.200.17479.81180.58824082.683.24-0.640.20182.79183.68825086.486.2790.1210.23285.76286.79626089.789.3190.3810.26688.72789.91122.5.17.123.0.7615.4318.815从上表查得,当x=2

18、2.5时,y=17.12395%置信度的预测区间为 15.43 18.815 4.5假设x是一可控变量,y是一随机变量,服从正态分布,现在不同的x值下分别对y进行观测,得如下数据,x0.250.370.440.550.600.620.680.700.73y2.572.312.121.921.751.711.601.511.50x0.750.820.840.870.880.900.951.00y1.411.331.311.251.201.191.151.00(1) 假设x与y之间有线性关系,求y对x的经验回归方程,并求的无偏估计;(2) 求回归系数;(3) 检验x和y之间的线性回归方程是否显著(

19、);(4) 求y的0.95预测区间;(5) 为了把观测值y限制在区间(1.08,1.68),需要把x的值限制在和范围之内?()解:1.计算过程及结果(1)一元线性回归模型:只有一个解释变量 Y为被解释变量,X为解释变量,与为待估参数, 为随机干扰项。用普通最小二乘法(Ordinary least squares, OLS)估计和记上述参数估计量可以写成: 带入数据得:所以求得的回归方程为:y=3.033-2.070x可以证明,的最小二乘估计量为它是关于的无偏估计量,也称为剩余方差(残差的方差)。 代入数据得:(2)由于是得到:(1-a)的置信度下的置信区间是 再由,还可得的置信水平为的置信区间

20、这里, 代入数据得到,0的95%的置信区间为2.951,3.116;1的95%的置信区间为-2.183,-1.957;的95%的置信区间为Qe/X21-/2(n-2),Qe/X2/2(n-2)=0.03/27.488,0.03/6.262=0.0011,0.0048(3)回归方程的显著性检验:总体平方和,简记为S总或Lyy回归平方和,记为S回或U残差平方和,记为S残或Qe SST=SSE(Qe)+SSR(U)对总体参数提出假设 H0: b1=0, H1:b10F检验:因为所以,拒绝原假设。T检验:因为|t|2.1315,所以拒绝原假设,即对方程有显著影响。线性关系的显著性检验:代入数据得:r=

21、0.995拒绝原假设,即X与Y有显著的线性相关关系对总体参数提出假设 H0: b0=0, H1:b00因为|t|2.1315,所以拒绝原假设,即对方程有显著影响(4)其中(5)因代入数据得2.SPSS软件运行结果根据数据得到散点图:由上图可知,x与y基本成线性关系。建立线性模型,进行相关检验:模型摘要模型R修正的估计的学生误差1.995(a).990.990.04454由上表可以看出相关系数R接近于1,y和x的线性关系显著。线性回归分析的系数模型 非标准化系数标准化系数T值P值95% 系数的置信区间 学生残差 下限上限r1常数项3.0330.039 78.354.0002.9513.116 x

22、-2.0700.053-0.995-39.139.000-2.183-1.957由上图可得回归方程:y=3.033+(-2.070)x。p很小,通过T检验。说明x对y有显著影响。方差分析表模型 平方和自由度平均平方值F值P值1回归平方和3.03913.0391531.867.000(a)残差平方和0.030150.002 总平方和3.06916 由方差分析表可见,F值很大,伴随概率sig.p很小,说明回归方程通过F检验,及回归方程非常显著(2)线性回归分析的系数模型 非标准化系数标准化系数T值P值95% 系数的置信区间 学生残差 下限上限r1常数项3.0330.039 78.354.0002.

23、9513.116 x-2.0700.053-0.995-39.139.000-2.183-1.957由上表可以看出0的95%的置信区间为2.951,3.116;1的95%的置信区间为-2.183,-1.957;2的置信区间为Qe/X21-/2(n-2), Qe/X2/2(n-2)=0.030/27.488,0.030/6.262=0.0011,0.0048(3)回归方程的显著性已在(1)中证明。(4)可以得到=nx2=17*(0.21056)2=0.7103, 的置信度为95%预测区间为 4.7某种商品的需求量y,消费者的平均收入以及商品的价格的统计数据如下表10006001200500300

24、400130011001300300576687543910075807050659010011060求y对、的回归方程。解: 线性回归分析的系数模型 非标准化系数标准化系数T值P值95% 系数的置信区间 学生残差 下限上限r1常数项111.69223.531 4.7470.00256.050167.333 消费者平均收入x10.0140.0110.3061.284.240-0.0120.041商品价格x2-7.1882.555-0.670-2.8130.026-13.231-1.146由上图可知,得到回归方程:。从表中得出,x1的T检验未通过,x1和x2有较强的共线性。则由后退法,删除第一个

25、变量,得到线性回归分析的系数表如下:线性回归分析的系数模型 非标准化系数标准化系数T值P值95% 系数的置信区间 学生残差 下限上限r1常数项140.008.551 16.3720.000120.281159.719商品价格x2-10.0001.369-0.933-7.3030.000-13.158-6.842a.因变量:商品的需求y得到回归方程:4.8 铝合金化学铣切工艺中,为了便于生产操作,需要对腐蚀速度进行控制,因此要考查腐蚀液温度、碱浓度、腐蚀液含铝量对腐蚀速度的影响,一共做了44次试验,所得数据如下表:试验号试验号173122000.02402387362000.0360273212

26、000.02352487482000.0325375302000.02402577191500.0230475422000.01902677191750.0250575362000.02452777192000.0265675482000.01852877192250.0285779122000.03202977192500.0290879212000.03003081271500.0285979302000.02903181271750.02951079422000.2753281272000.03101179362000.02503381272250.03151279482000.0225

27、3481272500.03201383122000.03703585351500.03451483212000.03603685351750.03551583302000.03553785352000.03701683422000.03253885352250.03901783362000.03053985352500.0405188348200.02704089431500.03751987122000.04404189431750.03802087212000.04254289432000.04002187302000.04204389432250.04302287422000.03904

28、489432500.0450(1)求y对的线性回归方程;(2)对所得到的回归方程进行显著性检验;(3)对自变量的显著性进行检验;(4)求时,腐蚀速度的点预测与99%的预测区间。解:因为y值相对于x来说数量级非常的小,所以先将y扩大10000倍,然后使用SPSS对y与之间的关系做回归由上表得r=0.097,说明y和之间线性关系极不显著。由方差分析表知,F值很小,p值很大,回归方程通不过F检验,说明回归方程不显著。由线性回归分析系数表知,p值很大,通不过t检验,认为回归系数高度不显著,说明对y没有显著的影响。综上所述,建立的回归方程不能通过以上的r检验、F检验、t检验,所以无法建立y与之间的回归方

29、程。4.9 有一架天平,称重时有随机误差。现对实重分别为的4个物体,按下述办法称重4次:第一次,都放在天平的右盘上,砝码放在左盘中,使其平衡,记砝码读数为。第k次放在天平的右盘上,其余两个放在左盘中。为使天平达到平衡要放上读数为的砝码,若砝码放在右盘内,则;若放在左盘内,则。试求的最小二乘估计,并求出的方差。如果对分别进行称量,需要称多少次才能得到同样精度的无偏估计。解:由题意得到方程为:令解得:同理可知如果对分别进行称量,每个需要称4次才能得到的精度,则共需称重16次。4.10 将1630岁的男女运动员按年龄分成7组,把年龄组中值作为x,考察年量大小对“旋转定向”能力的影响,已知的7组数据如

30、下:x(年龄)17192123252729y(旋转定力)22.4826.6324.230.726.5123.0020.30从散点图可以看出,用抛物线回归比较好,试求其回归多项式,并求。解:题目要求使用抛物线回归,所以先计算出,然后再使用SPSS软件对y与x、的关系做回归线性回归分析的系数模型 非标准化系数标准化系数T值 P值 学生残差1常数项-63.62932.653-1.9490.123年龄x8.1502.90010.2872.8100.048 xx-0.1820.063-10.575-2.8890.045得到的抛物线方程为:求的计算过程见下表:1722.4822.320.160.02192

31、6.6325.521.111.232124.2027.26-3.069.362330.7027.543.169.972526.5126.370.140.022723.0023.74-0.740.552920.3019.660.640.41合计21.564.11 某矿脉中13个相邻样本点处,某种金属的含量y与样本点对远点的距离有如下实测值:x23457810y106.42108.20109.58109.50110.00109.93110.49x111415161819y110.59110.60110.90110.76111.00111.20分别按:(1)(2)(3)建立y对x的回归方程,并用复相

32、关函数指出其中哪一种相关最大。解:(1)使用方程的形式进行回归拟合,先计算出的值,然后对y与进行线性拟合。模型摘要模型R修正的估计的学生误差1.886(a)0.7850.7660.64366a 自变量:sqrtx由上表得r=0.886,说明y与之间线性关系显著。方差分析表模型平方和自由度平均平方值F值P值1回归平方和16.653116.65340.1970.000(a)残差平方和4.557110.414总平方和21.21112 由方差分析表知,F值很大,p值几乎为0,,回归方程通过F检验,说明回归方程显著。线性回归分析的系数模型 非标准化系数标准化系数T值P值 学生残差1常数项106.3010

33、.600177.0310.000 sqrtx1.1950.1880.8866.3400.000由线性回归分析系数表知,回归方程系数的p值几乎为0,通过了t检验,认为回归系数显著。通过以上的r检验、F检验、t检验,证明回归方程效果显著。最后得到的回归方程为: (2)使用方程的形式进行回归拟合,先计算出lnx的值,然后对y与lnx进行线性拟合模型摘要模型R修正的估计的学生误差1.937(a)0.8770.8660.48638由上表得r=0.937,说明y和lnx的之间线性关系显著。方差分析表模型平方和自由度平均平方值F值P值1回归平方和18.608118.60878.6610.000(a)残差平方

34、和2.602110.237总平方和21.21112由方差分析表知,F值很大,p值几乎为0,回归方程通过F检验,说明回归方程显著。线性回归分析的系数模型 非标准化系数标准化系数T值P值 学生残差1常数项106.3150.430247.2250.000 lnx1.7140.1930.9378.8690.000由线性回归分析系数表知,回归方程系数的p值几乎为0,通过了t检验,认为回归系数显著。通过以上的r检验、F检验、t检验,证明回归方程效果显著。最后得到的回归方程为: (3)使用方程的形式进行回归拟合,先计算出1/x的值,然后对y与1/x进行线性拟合模型摘要模型R修正的估计的学生误差10.987(

35、a)0.9740.9720.22352由上表得r=0.987,说明y和1/x的之间线性关系显著。方差分析表模型平方和自由度平均平方值F值P值1回归平方和20.661120.661413.5290.000(a)残差平方和0.550110.050总平方和21.21112由方差分析表知,F值很大,p值机会为0,回归方程通过F检验,说明回归方程显著。线性回归分析的系数模型 非标准化系数标准化系数T值P值 学生残差1常数项1116.4870.0981134.1570.000 1/x-9.8330.484-0.987-20.3350.000由线性回归分析系数表知,回归方程系数的p值几乎为0,通过了t检验,

36、认为回归系数显著。通过以上的r检验、F检验、t检验,证明回归方程效果显著。最后得到的回归方程为: 计算复相关系数的计算过程见下表:2106.42107.991107.503106.5712.4681.1730.0233108.20108.371108.198108.2090.029004109.58108.691108.691109.0290.7900.7900.3045109.50108.973109.074109.5200.2780.18207110.00109.463109.650110.0820.2890.1220.0078109.93109.681109.879110.2580.0620.0030.10810110.49110.080110.262110.5040.1680.052011110.59110.264110.425110.5930.1060.027014110.60110.772110.838110.7850.0300.0570.03415110.90110.929110.957110.8310.0010.0030.00516110.7611

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 单元课程

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com