《概率论与数理统计第9章.ppt》由会员分享,可在线阅读,更多相关《概率论与数理统计第9章.ppt(27页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、 1第第10章章 回归分析回归分析 2一、回归的概念一、回归的概念1885年年F.Galton(高尔登高尔登)选取了大量的豌豆种子选取了大量的豌豆种子,将将它们分成它们分成7个不同的重量组,然后说服住在各地的朋个不同的重量组,然后说服住在各地的朋友按照一致的指示种友按照一致的指示种70颗种子颗种子,每一重量组种每一重量组种10颗颗,连种两代连种两代,结果如下表结果如下表 种子直径种子直径(0.01英寸英寸)上一代上一代 15 16 17 18 19 20 21下一代下一代 15.4 15.7 16.0 16.3 16.6 17 17.3注意到注意到:小个子豌豆的下一代没有上一代那么小小个子豌豆
2、的下一代没有上一代那么小而大个子豌豆的下一代比上一代要小一些而大个子豌豆的下一代比上一代要小一些 3F.Galton称这一现象为回复变异称这一现象为回复变异,他说他说:回复变异是理想平均子型回复变异是理想平均子型(下一代下一代)与父型与父型(上一代上一代)有差异的趋势使回复到可以粗糙地也许正确地称之有差异的趋势使回复到可以粗糙地也许正确地称之平均祖先型平均祖先型这就是回归现象这就是回归现象人类的身高也是如此人类的身高也是如此 4 5 6一元线性回归方程为一元线性回归方程为一元线性回归模型为一元线性回归模型为 71.散点图散点图例例1.考察某种纤维的强度与其拉伸倍数的关系考察某种纤维的强度与其拉
3、伸倍数的关系,下表是下表是实际测定的实际测定的24个纤维样品的强度与相应的拉伸倍数的个纤维样品的强度与相应的拉伸倍数的记录记录:8纤维强度随拉伸纤维强度随拉伸倍数增加而增加倍数增加而增加并且并且24个点大致分个点大致分布在一条直线附近布在一条直线附近即即事实上事实上,用用最小二乘法最小二乘法可以得到线性回归方程可以得到线性回归方程 92.最小二乘法最小二乘法但几乎不可能但几乎不可能从而得到回归方程的估计从而得到回归方程的估计上式称为样本回归方程上式称为样本回归方程其图象称为样本回归直线其图象称为样本回归直线 10为此引入以下概念为此引入以下概念:残差残差:残差平方和残差平方和SSE描述样本回归
4、直线与所有样本点的拟合程度描述样本回归直线与所有样本点的拟合程度 11残差平方和越小,拟合得就越好残差平方和越小,拟合得就越好 12令偏导数为零令偏导数为零,得得加加 13记记 14由此可得样本回归方程为由此可得样本回归方程为以上求样本回归方程的的方法称为最小二乘法以上求样本回归方程的的方法称为最小二乘法 15例例1.考察某种纤维的强度与其拉伸倍数的关系考察某种纤维的强度与其拉伸倍数的关系,下表是下表是实际测定的实际测定的24个纤维样品的强度与相应的拉伸倍数的个纤维样品的强度与相应的拉伸倍数的记录记录:数据数据P7.建立强度与拉伸倍数的线性回归方程建立强度与拉伸倍数的线性回归方程.解解:根据强度与拉伸倍数的样本数据根据强度与拉伸倍数的样本数据,可得可得 16 17强度与拉伸倍数的样本强度与拉伸倍数的样本线性回归方程线性回归方程为为 21定义比值定义比值为样本相关系数为样本相关系数对于假设对于假设其拒绝域为其拒绝域为 22即认为纤维强度即认为纤维强度y与拉伸倍数与拉伸倍数x间存在线性相关关间存在线性相关关系系,线性回归方程有效线性回归方程有效例例3 对对例例1中的样本回归方程进行相关系数检验中的样本回归方程进行相关系数检验解解样本相关系数为样本相关系数为由例1可知查表的相关系数临界值查表的相关系数临界值 27作业作业3.P268 练习10.2