一元回归分析.ppt

上传人:hwp****526 文档编号:84352592 上传时间:2023-04-05 格式:PPT 页数:35 大小:1.46MB
返回 下载 相关 举报
一元回归分析.ppt_第1页
第1页 / 共35页
一元回归分析.ppt_第2页
第2页 / 共35页
点击查看更多>>
资源描述

《一元回归分析.ppt》由会员分享,可在线阅读,更多相关《一元回归分析.ppt(35页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、 在现实问题中,处于同一个过程中的一些变量,在现实问题中,处于同一个过程中的一些变量,往往是相互依赖和相互制约的,它们之间的相互关系往往是相互依赖和相互制约的,它们之间的相互关系大致可分为两种:大致可分为两种:相关关系问题相关关系问题 (1 1)确定性关系)确定性关系函数关系;函数关系;(2 2)非确定性关系)非确定性关系相关关系;相关关系;相关关系表现为这些变量之间有一定的依赖关系,相关关系表现为这些变量之间有一定的依赖关系,但这种关系并不完全确定,它们之间的关系不能精确但这种关系并不完全确定,它们之间的关系不能精确地用函数表示出来,这些变量其实是随机变量,或至地用函数表示出来,这些变量其实

2、是随机变量,或至少有一个是随机变量。少有一个是随机变量。相关关系举例相关关系举例 例如:在气候、土壤、水利、种子和耕作技术等条件基本例如:在气候、土壤、水利、种子和耕作技术等条件基本相同时,某农作物的亩产量相同时,某农作物的亩产量 Y Y 与施肥量与施肥量 X X 之间有一定的关系,之间有一定的关系,但施肥量相同,亩产量却不一定相同。但施肥量相同,亩产量却不一定相同。亩产量是一个随机变量。亩产量是一个随机变量。又如:人的血压又如:人的血压 Y Y 与年龄与年龄 X X 之间有一定的依赖关系,一之间有一定的依赖关系,一般来说,年龄越大,血压越高,但年龄相同的两个人的血压不般来说,年龄越大,血压越

3、高,但年龄相同的两个人的血压不一定相等。一定相等。血压是一个随机变量。血压是一个随机变量。农作物的亩产量与施肥量、血压与年龄之间的这农作物的亩产量与施肥量、血压与年龄之间的这种关系称为相关关系,在这些变量中,施肥量、年龄种关系称为相关关系,在这些变量中,施肥量、年龄是可控变量,亩产量、血压是不可控变量。一般在讨是可控变量,亩产量、血压是不可控变量。一般在讨论相关关系问题中,论相关关系问题中,可控变量称为自变量,不可控变可控变量称为自变量,不可控变量称为因变量。量称为因变量。函数关系与相关关系的区别函数关系与相关关系的区别 相关关系相关关系影响影响的值,的值,函数关系函数关系决定决定的值,的值,

4、因此,统计学上讨论两变量的相关关系时,是设法因此,统计学上讨论两变量的相关关系时,是设法确定:在给定自变量确定:在给定自变量 的条件下,因变量的条件下,因变量 的的条件数学期望条件数学期望不能确定。不能确定。回归分析的概念回归分析的概念 研究一个随机变量与一个(或几个)可控变量之间研究一个随机变量与一个(或几个)可控变量之间的相关关系的统计方法称为回归分析。的相关关系的统计方法称为回归分析。只有一个自变量的回归分析称为一元回归分析;多只有一个自变量的回归分析称为一元回归分析;多于一个自变量的回归分析称为多元回归分析。于一个自变量的回归分析称为多元回归分析。引进回归函数引进回归函数称为回归方程称

5、为回归方程 回归方程反映了因变量回归方程反映了因变量 随自变量随自变量 的变化而变化的变化而变化的平均变化情况的平均变化情况.回归分析主要包括三方面的内容回归分析主要包括三方面的内容 (1 1)提供建立有相关关系的变量之间的数学关系)提供建立有相关关系的变量之间的数学关系式(称为经验公式)的一般方法;式(称为经验公式)的一般方法;(2 2)判别所建立的经验公式是否有效,并从影响随)判别所建立的经验公式是否有效,并从影响随机变量的诸变量中判别哪些变量的影响是显著的,哪些机变量的诸变量中判别哪些变量的影响是显著的,哪些是不显著的;是不显著的;回归分析的内容回归分析的内容 (3 3)利用所得到的经验

6、公式进行预测和控制。)利用所得到的经验公式进行预测和控制。一元线性回归模型一元线性回归模型 如果试验的散点图中各点呈直线状,则假设这批数如果试验的散点图中各点呈直线状,则假设这批数据的数学模型为据的数学模型为 设随机变量设随机变量Y Y依赖于自变量依赖于自变量x x,作,作n n次独立试验,次独立试验,得得n n对观测值:对观测值:称这称这n n对观测值为容量为对观测值为容量为n n的一个子样,若把这的一个子样,若把这n n对观对观测值在平面直角坐标系中描点,得到试验的测值在平面直角坐标系中描点,得到试验的散点图散点图.其中其中 ,且相互独立,且相互独立,则则 图图 9-1其中其中 同服从于正

7、态分布同服从于正态分布 相互独立,相互独立,因此因此 其中其中 是与是与 无关的无关的未知常数未知常数。(9.1)一元线性回归模型一元线性回归模型 一般地,称如下数学模型为一元线性模型一般地,称如下数学模型为一元线性模型 而而 称为回归函数或回归方程。称为回归函数或回归方程。称为回归系数。称为回归系数。回归函数(方程)的建立回归函数(方程)的建立 由观测值由观测值 确定的回归确定的回归函数函数 ,应使得,应使得 较小。较小。考虑函数考虑函数 问题:确定问题:确定 ,使得,使得 取得极小值。取得极小值。这是一个二元函数的无条件极值问题。这是一个二元函数的无条件极值问题。回归方程的建立回归方程的建

8、立 令令 回归方程的建立回归方程的建立 记记 表示对表示对 的估计值的估计值则变量则变量 对对 的回归方程为的回归方程为 简写为简写为 回归方程有效性的检验回归方程有效性的检验 对于任何一组数据对于任何一组数据 ,都可按最,都可按最小二乘法确定一个线性函数,但变量小二乘法确定一个线性函数,但变量 与与 之间是否真之间是否真有近似于线性函数的相关关系呢?尚需进行假设检验。有近似于线性函数的相关关系呢?尚需进行假设检验。假设假设 如果如果 成立,则不能认为成立,则不能认为 与与 有线性相关关系。有线性相关关系。三种检验方法:三种检验方法:F F检验法、检验法、t-t-检验法、检验法、r r检验法。

9、检验法。回归方程有效性的回归方程有效性的F检验法检验法 记记 总离差平方和总离差平方和,反映观测值与平均值的偏差程度。,反映观测值与平均值的偏差程度。经恒等变形,将经恒等变形,将 分解分解 回归方程有效性的回归方程有效性的F检验法检验法 回归平方和,反映回归值与平均值的偏差,揭示回归平方和,反映回归值与平均值的偏差,揭示变量变量 与与 的线性关系所引起的数据波动。的线性关系所引起的数据波动。剩余平方和,反映观测值与回归值的偏差,揭示剩余平方和,反映观测值与回归值的偏差,揭示试验误差和非线性关系对试验结果所引起的数据波动。试验误差和非线性关系对试验结果所引起的数据波动。回归方程有效性的回归方程有

10、效性的F检验法检验法 如果如果 为真,则为真,则 于是,统计量于是,统计量 对给定的检验水平对给定的检验水平 ,(1 1)当)当 时,时,拒绝拒绝 ,即可认为变量,即可认为变量 与与 有线性相关关系有线性相关关系;(2 2)当)当 时,时,接受接受 ,即可认为变量,即可认为变量 与与 没有线性相关关系没有线性相关关系;回归方程有效性的回归方程有效性的F检验法检验法 (2 2)当)当 时,时,接受接受 ,即可认为变量,即可认为变量 与与 没有线性相关关系没有线性相关关系;此时,可能有以下几种情况:此时,可能有以下几种情况:(2 2)对对 有显著影响,但这种影响不能用线性关系有显著影响,但这种影响

11、不能用线性关系表示,应作非线性回归;表示,应作非线性回归;(3 3)除)除 之外,还有其它变量对之外,还有其它变量对 也有显著影响,从也有显著影响,从而削弱了而削弱了 对对 的影响,应考虑多元回归。的影响,应考虑多元回归。(1 1)对对 没有显著影响,应丢弃自变量没有显著影响,应丢弃自变量 ;回归方程有效性的回归方程有效性的r检验法检验法 记记 样本的相关系数样本的相关系数 可反映变量可反映变量 与与 之间的线性相关程度。之间的线性相关程度。因为因为 回归方程有效性的回归方程有效性的r检验法检验法 记记 样本的相关系数样本的相关系数 越大,变量越大,变量 与与 之间的线性相关程度越强。之间的线

12、性相关程度越强。因为因为 (1 1)(2 2)时,时,(3 3)时,时,与与 有线性相关关系;有线性相关关系;与与 无线性相关关系;无线性相关关系;回归方程有效性的回归方程有效性的r检验法检验法 计算计算 对给定的检验水平对给定的检验水平 ,查相关系数的临界值表,查相关系数的临界值表 如果如果 ,则拒绝,则拒绝 ,即线性回归方程有效;,即线性回归方程有效;否则,接受否则,接受 ,即线性回归方程无效。,即线性回归方程无效。F F检验与检验与r r检验是一致的:检验是一致的:回归方程有效性的回归方程有效性的t检验法检验法 统计量统计量 H H0 0成立时,成立时,对给定的检验水平对给定的检验水平

13、,H H0 0的拒绝域为的拒绝域为 即当即当 时,变量时,变量 与与 有线性相关关系。有线性相关关系。F F检验与检验与t t检验是一致的:检验是一致的:编号编号123456789脂肪脂肪含量含量%15.417.518.920.021.022.815.817.819.1蛋白蛋白质含质含量量%44.039.241.838.937.438.144.640.739.8试求出试求出 与与 的关系,并判断是否有效。的关系,并判断是否有效。例例1 1 为了研究大豆脂肪含量为了研究大豆脂肪含量 和蛋白质含量和蛋白质含量 的关系,的关系,测定了九种大豆品种籽粒内的脂肪含量和蛋白质含量,测定了九种大豆品种籽粒内

14、的脂肪含量和蛋白质含量,得到如下数据得到如下数据解解 (1 1)描散点图)描散点图 (2 2)建立模型)建立模型 由散点图,设变量由散点图,设变量 与与 为线性相关关系:为线性相关关系:确定回归系数确定回归系数 和和 :编号编号123456789 x15.417.518.920.021.022.815.817.819.1168.3y44.039.241.838.937.438.144.640.739.8364.5x2237.16306.25357.21400441519.84249.64316.84364.813192.75y219361536.641747.241513.211398.761

15、451.611989.161656.491584.0414813.2xy677.6686790.02778785.4868.68704.68724.46760.186775.02所以,所求的回归方程为所以,所求的回归方程为 (3 3)检验回归方程的有效性)检验回归方程的有效性 查相关系数临界值表查相关系数临界值表 因为因为 所以回归方程在所以回归方程在 的检验水平下有统计意义。的检验水平下有统计意义。即可以认为大豆的蛋白质含量与脂肪含量有线性相关性。即可以认为大豆的蛋白质含量与脂肪含量有线性相关性。利用回归方程进行预测利用回归方程进行预测1 1、点预测、点预测 时,时,即为即为 的点预测值。的

16、点预测值。2 2、区间预测、区间预测 统计量统计量 对给定的置信水平对给定的置信水平 ,的预测区间为的预测区间为 续例续例1 1 求大豆脂肪含量为求大豆脂肪含量为18.6%18.6%的条件下蛋白质的条件下蛋白质95%95%的预测区间。的预测区间。解解 由已求得的回归方程由已求得的回归方程 得蛋白质的点预测值为得蛋白质的点预测值为 所以脂肪含量为所以脂肪含量为18.6%18.6%时,蛋白质的时,蛋白质的95%95%的预测区间为的预测区间为 利用回归方程进行预测利用回归方程进行预测控制则为预测的反问题:已知因变量的取值区间为控制则为预测的反问题:已知因变量的取值区间为 ,确定自变量的取值区间,确定自变量的取值区间 使得使得 利用回归方程进行控制利用回归方程进行控制 一般地,要解出一般地,要解出 和和 很复杂,可作简化求解:很复杂,可作简化求解:当样本容量很大时,当样本容量很大时,则,则 例例1的上机操作步骤的上机操作步骤 分两列输入分两列输入 回归分析命令回归分析命令 因变量因变量 自变量自变量 预测点预测点 置信水平置信水平 t t检验检验 r r检验检验 F F检验检验 预测区间预测区间 点预测值点预测值自变量值自变量值

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 小学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com