田间试验和统计方法.pptx

上传人:莉*** 文档编号:36623237 上传时间:2022-08-28 格式:PPTX 页数:33 大小:934.07KB
返回 下载 相关 举报
田间试验和统计方法.pptx_第1页
第1页 / 共33页
田间试验和统计方法.pptx_第2页
第2页 / 共33页
点击查看更多>>
资源描述

《田间试验和统计方法.pptx》由会员分享,可在线阅读,更多相关《田间试验和统计方法.pptx(33页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、第九章 直线回归与相关第二节 直线回归第一节 回归与相关的概念第三节 直线相关第1页/共33页第一节 回归与相关的概念 协变关系与函数关系 函数关系是一种确定性的关系,属于物理学、化学等理论科学的研究内容。 协变关系是一种非确定性的关系,即一个变数的取值受到另一变数的影响,两者之间既有关系,但又不存在完全确定的函数关系。例如,作物的产量与产量的构成因素、施肥量和病虫害等的关系。协变关系可分为平行关系和因果关系。第2页/共33页第一节 回归与相关的概念回归分析与相关分析 因果关系的变数可用回归来研究,将原因的变数称为自变数,用X表示,一般是没有误差的;结果的变数称为依变数,用Y表示, 是有误差的

2、.回归主要是研究当自变数变动时,依变数该如何变动,变动多少。 平行关系的变数可用相关来研究,主要研究两个变数关系的程度和性质.但相关分析也可研究变数间的因果关系。第3页/共33页第一节 回归与相关的概念变数之间关系的类型可分为直线关系和曲线关系。如果两个变数之间是直线关系可以采用直线回归与相关分析的方法来研究,即本章的内容; 多个变数之间是直线关系可以采用多元回归与相关分析的方法来研究,即下一章的内容;变数之间是曲线关系可以采用曲线回归与相关分析的方法来研究,即第十一章的内容。第4页/共33页第一节 回归与相关的概念 如何判断两变数之间的关系一方面可根据专业方面的知识来确定,即前人的研究结果,

3、另一方面借助于两个变数成对观测值的散点图。第5页/共33页双变数资料的散点图第一节 回归与相关的概念组别观察值平均数7 77 71 16 65 53 38 89 93 31 1 = 5.0 = 5.0第一组5 59 96 61 13 31 19 94 46 68 8 = 5.2 = 5.29 98 87 77 76 65 53 33 31 11 1 = 5.0 = 5.0第二组9 99 98 86 66 65 54 43 31 11 1 = 5.2 = 5.21 11 13 33 35 56 67 77 78 89 9 = 5.0 = 5.0第三组9 99 98 86 66 65 54 43

4、31 11 1 = 5.2 = 5.21x2x3x1y2y3y1x2x3x1y2y3y第6页/共33页第二节 直线回归直线回归方程的建立直线方程的一般形式: :bXay回归截距回归系数Y Y 的预测值 Y Y 的预测值与观测值间的偏差是误差, ,即 ebXaeyY 2121)()(iiniiinibxayyyQ最小 必须使散点图中的所有点整体上离回归直线最近, ,即误差达到最小: :任何配合直线回归方程呢? ?第7页/共33页第二节 直线回归直线回归方程的建立分别求Q对a和b的偏导数,并使之为0:0)(2)(2xbnaybxayaQ0)( 2)(22xbxaxyxbxaybQ 现在的任务是要选

5、择合适的a和b,使Q最小.微积分学中提供的最小二乘法为我们解决了这个问题。方法如下:第8页/共33页第二节 直线回归将其整理得正规方程组:yxbnaxyxbxa2 解方程组得:xxySSSPxxyyxxb/)(/ )(2xbya其中 为成对数据的离均差乘积和,简称乘积和,记为SPSPxyxy)(yyxxnyxxyyyxxSPxy/)(这样就可以得到回归方程.第9页/共33页第二节 直线回归XY23456346573.24.156.96.8下面我们来看一个回归方程建立的例子:最后计算出:4 . 149 . 05xbya先计算出一级数据:105/202090 xSS4,90,20, 52xxxn1

6、05/2525135ySS109, 5,135,252xyyyy95/2520109yxSP再计算二级数据:该资料的直线方程为: :Xy9 . 04 . 1看P160P160页的例9.19.19 . 010/9/xxySSSPb第10页/共33页第二节 直线回归直线回归方程的假设测验其中 。),0(2Ni 如果某总体的两变数 之间有线性关系:iiiXYYX , 从此总体中抽取大小为 的样本,欲用它得到样本模型: ,用 估计 ,用 估计 用 估计 。iibXy aniy baiY 称为总体模型的回归截距, 为总体回归系数。N N对( (x,y)x,y)的总体n n对( (x,y)x,y)的样本第

7、11页/共33页对此统计假设有两种测验方法:在欲用样本回归模型对总体回归模型进行估计之 前,必须确证总体中两变数之间确实有线性回归 关系存在,即测验 H0: vs HA: 00只有在此测验结果为显著时,用 估计 ,用 估计 ,用 估计 才是有意义的。aby y方差分析法 测验法t第二节 直线回归第12页/共33页方差分析法: 利用下图说明方差分析法的基本原理。 y 当自变量为 ,对应的 依变数的实测值为 , 依变数的预测值为 。 于是 的离均差 可分解为两个部分:xyy yy 总的差异 估计误差回归引起的偏离yy yyyy) (yy yy )(yyxyyxy 第二节 直线回归第13页/共33页

8、对整个资料所有点的求和得: 对于一个点有: )() ()(yyyyyy两边平方得: 222)()( 2) ()(yyyyyyyyyy222) ()(2) ()(yyyyyyyyyy)() ()()(xxbyyxxbybxxbybxay 可以证明右边的中项为0: )()() ()(xxbyyyybxxbyyyy)() )()(2xxbyyxxbyyyy0)(xxxyxySSSSSPSPbyyyy第二节 直线回归第14页/共33页对整个资料所有点的求和得: 对于一个点有: )() ()(yyyyyy两边平方得: 222)()( 2) ()(yyyyyyyyyy222) ()(2) ()(yyyyy

9、yyyyy222) () ()(yyyyyy 离回归平方和)(eQSSSSQ 回归平方和USSU 的总平方和yTSSSS y 于是: 的总平方和便分解为两个部分:y第二节 直线回归第15页/共33页 三个平方和的计算公式: nyyyySSy/)()(222 总平方和: 2) (yySSUU 回归平方和: xxyxyxSSSPbSPSSbxxbU/)(2222,)(),(222xxbyyxxbyy)(UyQSSSSSS 离回归平方和: 或USSQy222) () ()(yyyyyy离回归平方和)(eQSSSSQ 回归平方和USSU 总平方和yTSSSS 第二节 直线回归第16页/共33页 将三个

10、平方和填入方差分析表得: 方差分析表 变异来源 自由度 平方和 均方 F 值 F0.05 F0.01 回归 离回归 总变异 USSU QSSQ ySS 计算三个自由度并填入方差分析表: 总自由度: 1n 离回归自由度: 2n 回归自由度: 111n2n第二节 直线回归第17页/共33页 将三个平方和填入方差分析表得: 方差分析表 变异来源 自由度 平方和 均方 F 值 F0.05 F0.01 回归 离回归 总变异 USSU QSSQ 11n2nySS 计算回归方差 和离回归方差 : UMSQMS 回归方差: 1/UUSSMSUMSQMSF05. 0F01. 0F 离回归方差: )2/( nSS

11、MSQQ 计算出 值并对它进行测验: FQUMSMSF/第二节 直线回归第18页/共33页上例中: 10/)()(222nyyyySSy 总平方和: 回归平方和: 1 . 899 . 0/22xxyxyxSSSPbSPSSbU 离回归平方和:9 . 11 . 810USSQY 将3个平方和及其它计算结果填入方差分析表得: 方差分析表 变异来源 自由度 平方和 均方 F 值 F0.05 F0.01 回归 1 8.1 8.1 12.79* 10.13 34.12 离回归 3 1.9 0.63 总变异 4 10 第二节 直线回归第19页/共33页3,841. 5,182. 36 . 325. 0/9

12、 . 001. 005. 0dfttt t 测验法 计算一个t值与t0.05和t0.01进行比较.计算公式是: 其中:,/bsbt xQbSSMSs/ 本例中: 25. 010/63. 0/xQbSSMSs 两种测验方法都判定此资料中 与 间有显著的回归关系,结果是完全一致的,可以通过公式来证明。yx统计测验 H0: vs HA: 00), 1()(/)/(2222vFvtFMSMSMSSSbsbtaaQUQxb第二节 直线回归第20页/共33页经过测验判断 与 之间有回归关系之后,便可以用样本统计数来对总体参数作估计,并且以一定的概率保证来求出总体参数的置信区间。yx 1. 用 来估计 ,置

13、信区间为:a)a,a (aastst)/1(2xQaSSxnMSs其中, 2. 用 来估计 ,置信区间为:b),(bbstbstbxQbSSMSs/其中, 3. 用 来估计对应Y平均数 , 置信区间为:y xy /), (yystysty)/)(/ 1 (2xQySSxxnMSs其中, 4. 用 来估计预测值 ,置信区间为:y y), (yystysty)/)(/ 11 (2xQySSxxnMSs其中, 看P166-169P166-169页的内容第二节 直线回归第21页/共33页组别观察值平均数7 77 71 16 65 53 38 89 93 31 1 = 5.0 = 5.0第一组5 59

14、96 61 13 31 19 94 46 68 8 = 5.2 = 5.29 98 87 77 76 65 53 33 31 11 1 = 5.0 = 5.0第二组9 99 98 86 66 65 54 43 31 11 1 = 5.2 = 5.21 11 13 33 35 56 67 77 78 89 9 = 5.0 = 5.0第三组9 99 98 86 66 65 54 43 31 11 1 = 5.2 = 5.21x2x3x1y2y3y1x2x3x1y2y3y第三节 直线相关 变数之间的关系,再看看前面介绍的资料 到底用什么来表示数据资料的相关性呢? ?第22页/共33页yx 第一象限的

15、点;0)( ;,yyxxyyxx 第二象限的点;0)( ;,yyxxyyxx 第三象限的点;0)( ;,yyxxyyxx 第四象限的点;0)( ;,yyxxyyxxyxyx第三节 直线相关第23页/共33页第三节 直线相关 从下面的三组资料的散点图可以看出,离均差 乘积和 可以反映资料中两个随机变数之间的相互关系。)(yyxxSPxyyx075 xySP 第二组yx074 xySP 第三组yx 第一组02 xySP第24页/共33页第三节 直线相关 乘积和没有考虑到两变数自身变异的影响。乘积和是有单位的量。有时单位在实践中难以解释。例如当 为体高, 为体重,它的单位就是cm.g。xy 如何消除

16、计量单位和变异不同的影响呢?可将乘积和除以两个变数平方和的平方根,来表示两个变数之间的关系,该数值定义为相关系数,双变数样本的相关系数用r表示。即22)()()(yyxxyyxxSSSSSPryxxy 双变数总体的相关系数用表示。第25页/共33页第三节 直线相关前述的三组数据的相关系数分别为:9642. 06 .797474;9772. 06 .797475;0261. 06 .79742321rrr组别观察值平均数平方和7 77 71 16 65 53 38 89 93 31 1= 5.0= 5.0= 74.0= 74.0第一组5 59 96 61 13 31 19 94 46 68 8=

17、 5.2= 5.2= 79.6= 79.69 98 87 77 76 65 53 33 31 11 1= 5.0= 5.0= 74.0= 74.0第二组9 99 98 86 66 65 54 43 31 11 1= 5.2= 5.2= 79.6= 79.61 11 13 33 35 56 67 77 78 89 9= 5.0= 5.0= 74.0= 74.0第三组9 99 98 86 66 65 54 43 31 11 1= 5.2= 5.2= 79.6= 79.61x2x3x1y2y3y1x2x3x1y2y3yxSSySSxSSySSxSSySS第26页/共33页第三节 直线相关 相关系数是

18、没有单位的量。 相关系数的定义域为-1,1。 当相关系数为-1时,两变数为完全负相关; 当相关系数为+1时,两变数为完全正相关; 当相关系数为0时,两变数为无线性相关; 当相关系数在0到+1之间时,两变数为正相关; 当相关系数在-1到0之间时,两变数为负相关; 如第2组数据的相关系数 =0.9772;所以 与 之间有正的相关关系;2r2x2y 如第3组数据的相关系数 =-0.9642;所以 与 之间有负的相关关系;3r3x3y 如第1组数据的相关系数 =0.0261;所以 与 之间就几乎没有线性相关关系;1r1x1y第27页/共33页第三节 直线相关 如果我们只关心变数间关系的密切程度而不理会

19、正负方向,可以考察相关系数的平方值,相关系数的平方值称为决定系数。;0007. 00261. 0221r 第2组中两随机变数的关系比其他两组更密切。;9549. 09772. 0222r9297. 0)9642. 0(223r 第一组数据的决定系数为: 第二组数据的决定系数为: 第三组数据的决定系数为:第28页/共33页第三节 直线相关 在欲用样本相关系数 对总体相关系数 进行估 计之前,必须确证 不为0,即测验 H0: vs HA: r00 测验的公式是:,/)(rsrt其中:, )2/()1(2nrsr2 ndf这个 值服从t的 分布。t306.20737.03534.0/0261.005

20、.0tt 对第1组资料 3534. 08/ )0261. 01 (0261. 02rsr0不能推翻 的假设,判断 与 之间没有显著的线性相关关系。1x1y第29页/共33页第三节 直线相关在欲用样本相关系数 对总体相关系数 进行估 计之前,必须确证 不为0,即测验 H0: vs HA: r00 测验的公式是:,/)(rsrt其中:, )2/()1(2nrsr2 ndf这个 值服从t的 分布。t355.30215.130751.0/9772.001.0tt 第2组资料,0751. 08/ )9772. 01 (9772. 02rsr0不能接受 的假设,判断 与 之间有极显著的线性相关关系。2x2

21、y第30页/共33页第三节 直线相关 在欲用样本相关系数 对总体相关系数 进行估 计之前,必须确证 不为0,即测验 H0: vs HA: r00 测验的公式是:,/)(rsrt其中:, )2/()1(2nrsr2 ndf这个 值服从t的 分布。t355.32816.100938.0/9642.001.0tt 第3组资料,0938. 08/ )9642. 01 (9642. 02rsr0不能接受 的假设,判断 与 之间有极显著的线性相关关系。3x3y计算出的相关系数也可直接查P376P376的附表1010来判断其显著性第31页/共33页本章提示与作业 本章重点:直线回归方程的建立和假设测验以及相关系数的计算 作业:P190第5和6题第32页/共33页感谢您的观看!第33页/共33页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > PPT文档

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com