231变量间的相关关系(1)(人教A版必修3).ppt

上传人:asd****56 文档编号:19208503 上传时间:2022-06-05 格式:PPT 页数:43 大小:1.03MB
返回 下载 相关 举报
231变量间的相关关系(1)(人教A版必修3).ppt_第1页
第1页 / 共43页
231变量间的相关关系(1)(人教A版必修3).ppt_第2页
第2页 / 共43页
点击查看更多>>
资源描述

《231变量间的相关关系(1)(人教A版必修3).ppt》由会员分享,可在线阅读,更多相关《231变量间的相关关系(1)(人教A版必修3).ppt(43页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、2.3.1 2.3.1 变量间的相关关系变量间的相关关系 在学校,老师经常对学生这样说:在学校,老师经常对学生这样说:“如果如果你的数学成绩好,那么你的物理学习就不会你的数学成绩好,那么你的物理学习就不会有什么大问题。有什么大问题。”按照这种说法,似乎学生按照这种说法,似乎学生的物理成绩与数学成绩之间存在着一种相关的物理成绩与数学成绩之间存在着一种相关关系。这种说法有没有依据呢?关系。这种说法有没有依据呢?思考思考 凭我们的学习经验可知,物理成绩确实凭我们的学习经验可知,物理成绩确实与数学成绩有一定的关系,但除此以外,还与数学成绩有一定的关系,但除此以外,还存在其他影响物理成绩的因素。例如,是

2、否存在其他影响物理成绩的因素。例如,是否喜欢物理,用在物理学习上的时间等等。当喜欢物理,用在物理学习上的时间等等。当我们主要考虑数学成绩对物理成绩的影响时,我们主要考虑数学成绩对物理成绩的影响时,就是主要考虑这两者之间的相关关系。就是主要考虑这两者之间的相关关系。 1商品销售收入与广告支出经费之间的关系。商品销售收入与广告支出经费之间的关系。商品销售收入与广告支出经费之间有着密切的联系,商品销售收入与广告支出经费之间有着密切的联系,但商品收入不仅与广告支出多少有关,还与商品质但商品收入不仅与广告支出多少有关,还与商品质量、居民收入等因素有关。量、居民收入等因素有关。 我们还可以举出现实生活中存

3、在的许多相关我们还可以举出现实生活中存在的许多相关关系的问题。例如:关系的问题。例如: 在一定范围内,施肥量越大,粮食产量就越高。在一定范围内,施肥量越大,粮食产量就越高。但是,施肥量并不是决定粮食产量的唯一因素,但是,施肥量并不是决定粮食产量的唯一因素,因为粮食产量还要受到土壤质量、降雨量、田因为粮食产量还要受到土壤质量、降雨量、田间管理水平等因素的影响。间管理水平等因素的影响。2粮食产量与施肥量之间的关系。粮食产量与施肥量之间的关系。 在一定年龄段内,随着年龄的增长,人体内在一定年龄段内,随着年龄的增长,人体内的脂肪含量会增加,但人体内的脂肪含量还的脂肪含量会增加,但人体内的脂肪含量还与饮

4、食习惯、体育锻炼等有关,可能还与个与饮食习惯、体育锻炼等有关,可能还与个人的先天体质有关。人的先天体质有关。3人体内脂肪含量与年龄之间的关系。人体内脂肪含量与年龄之间的关系。你还能举出一些类似的例子吗?你还能举出一些类似的例子吗? 应当说,对于上述各种问题中的两个变量之应当说,对于上述各种问题中的两个变量之间的相关关系,我们都可以根据自己的生活、学间的相关关系,我们都可以根据自己的生活、学习经验作出相应的判断,因为习经验作出相应的判断,因为“经验当中有规经验当中有规律律”。但是,不管你经验多么丰富如果只凭经验。但是,不管你经验多么丰富如果只凭经验办事,还是很容易出错的。因此,在分析两个变办事,

5、还是很容易出错的。因此,在分析两个变量之间的关系时,我们还需要有一些有说服力的量之间的关系时,我们还需要有一些有说服力的方法。方法。 自变量取值一定时自变量取值一定时,因变量的取因变量的取值值带有一定随机性带有一定随机性的两个变量之间的关系的两个变量之间的关系,叫做相关关系叫做相关关系.变量间相关关系的概念变量间相关关系的概念:相同点相同点:两者均是指两个变量间的关系两者均是指两个变量间的关系.不同点不同点:函数关系是一种函数关系是一种确定确定的关系的关系;相关关系是一种相关关系是一种非确定非确定的关系的关系.事实上事实上,函数关系是函数关系是两个非随机变量两个非随机变量的关的关系系,而相关关

6、系是而相关关系是随机变量随机变量与与随机变量随机变量间的关系间的关系.函数关系是一种函数关系是一种因果因果关系关系,而相关关系而相关关系不一定是因果关不一定是因果关系系,也可能是伴随关系也可能是伴随关系.相关关系与函数关系的异同点相关关系与函数关系的异同点:请同学们回忆一下请同学们回忆一下, ,我们以前是否学过变量间的关系呢我们以前是否学过变量间的关系呢? ?两个变量间的函数关系两个变量间的函数关系.1.下列关系中下列关系中,是带有随机性相关关系的是是带有随机性相关关系的是 .正方形的边长与面积的关系正方形的边长与面积的关系;水稻产量与施肥量之间的关水稻产量与施肥量之间的关系系;人的身高与年龄

7、之间的关系人的身高与年龄之间的关系;降雪量与交通事故发生之降雪量与交通事故发生之间的关系间的关系.2. 下列两个变量之间的关系哪个不是函数关系下列两个变量之间的关系哪个不是函数关系()()A角度和它的余弦值角度和它的余弦值B. 正方形边长和面积正方形边长和面积C正边形的边数和它的内角和正边形的边数和它的内角和 D. 人的年龄和身高人的年龄和身高D即学即用即学即用.年龄年龄脂肪脂肪239.52717.83921.24125.9454927.526.35028.25329.65430.25631.45730.8年龄年龄脂肪脂肪5833.56035.26134.6 如上的一组数据,你能分析人体的脂肪

8、如上的一组数据,你能分析人体的脂肪含量与年龄之间有怎样的关系吗?含量与年龄之间有怎样的关系吗?探究探究1 、散点图:散点图: 将各数据在平面坐标系中的对应点画出来,得到表示将各数据在平面坐标系中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫做散点图两个变量的一组数据的图形,这样的图形叫做散点图。如下图:如下图:O202530 354045 50 55 60 65年龄年龄脂肪含量脂肪含量510152025303540 从刚才的散点图发现:年龄越大,体内脂肪含量越从刚才的散点图发现:年龄越大,体内脂肪含量越高,点的位置散布在从左下角到右上角的区域。称它们高,点的位置散布在从左下角到

9、右上角的区域。称它们成成正相关正相关。但有的两个变量的相关,如下图所示:但有的两个变量的相关,如下图所示: 如高原含氧量与海拔高如高原含氧量与海拔高度的相关关系,海平面以上,度的相关关系,海平面以上,海拔高度越高,含氧量越少。海拔高度越高,含氧量越少。 作出散点图发现,它们散作出散点图发现,它们散布在从左上角到右下角的区布在从左上角到右下角的区域内。又如汽车的载重和汽域内。又如汽车的载重和汽车每消耗车每消耗1升汽油所行使的升汽油所行使的平均路程,称它们成平均路程,称它们成负相关负相关.思考:课本思考:课本P86的思考题的思考题.O例例1:5个学生的数学和物理成绩如下表:个学生的数学和物理成绩如

10、下表:ABCDE数学数学8075706560物理物理7066686462画出散点图,并判断它们是否有相关关系。画出散点图,并判断它们是否有相关关系。数学成绩数学成绩解:解:由散点图可见,两者之间具有正相关关系。由散点图可见,两者之间具有正相关关系。例例2:有一个同学家开了一个小卖部,他为了研究气温:有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:数与当天气温的对比表:摄氏温度摄氏温度 -5 0 4 7 12 15 19 23 27 31 36热饮杯数热饮杯数 156 150 132

11、128 130 116 104 89 93 76 54 (1)画出散点图;画出散点图;(2)从散点图中发现气温与热饮销售杯数之间关系的一从散点图中发现气温与热饮销售杯数之间关系的一般规律;般规律;解解: (1)散点图散点图(2)气温与热饮杯数成负相关气温与热饮杯数成负相关,即气温越高,卖出去即气温越高,卖出去的热饮杯数越少。的热饮杯数越少。温度温度热饮杯数热饮杯数 从已经掌握的知识来看,吸烟会损害身体的健康。从已经掌握的知识来看,吸烟会损害身体的健康。但是除了吸烟之外但是除了吸烟之外还有许多其他的随机因素还有许多其他的随机因素影响身影响身体健康,人体健康是由很多因素共同作用的结果,体健康,人体

12、健康是由很多因素共同作用的结果,我们可以找到长寿的吸烟者,也我们可以找到长寿的吸烟者,也更容易更容易发现由于吸发现由于吸烟而引发的患病者,烟而引发的患病者,吸烟与健康是一种相关关系,吸烟与健康是一种相关关系,所以吸烟不一定引起健康问题。所以吸烟不一定引起健康问题。有关法律规定,香烟盒上必须印上有关法律规定,香烟盒上必须印上“吸烟有害吸烟有害健康健康”的警示语。吸烟是否一定会引起健康问题?的警示语。吸烟是否一定会引起健康问题?你认为你认为“健康问题不一定是由吸烟引起的,所以可健康问题不一定是由吸烟引起的,所以可以吸烟以吸烟”的说法对吗?的说法对吗? 但吸烟引起健康问题的可能性大,因此但吸烟引起健

13、康问题的可能性大,因此“健康问健康问题不一定是由吸烟引起的,所以可以吸烟题不一定是由吸烟引起的,所以可以吸烟”的的说法是不对的。说法是不对的。练习练习1: 从已经掌握的知识来看,没有发现根据说明从已经掌握的知识来看,没有发现根据说明“天鹅能天鹅能够带来孩子够带来孩子”,完全可能存在既能吸引天鹅又使婴儿完全可能存在既能吸引天鹅又使婴儿出生率高的第三个因素(例如独特的环境因素),出生率高的第三个因素(例如独特的环境因素),即即天鹅与婴儿出生率之间没有直接的关系,因此天鹅与婴儿出生率之间没有直接的关系,因此 “天鹅天鹅能够带来孩子能够带来孩子”的结论不可靠。的结论不可靠。某地区的环境条件适合天鹅栖息

14、繁衍,有人统计发现某地区的环境条件适合天鹅栖息繁衍,有人统计发现了一个有趣的现象,如果村庄附近栖息的天鹅多,那么这个了一个有趣的现象,如果村庄附近栖息的天鹅多,那么这个村庄的婴儿出生率也高,天鹅少的地方婴儿出生率低。于是,村庄的婴儿出生率也高,天鹅少的地方婴儿出生率低。于是,他就得出一个结论:天鹅能够带来孩子。你认为这样得到的他就得出一个结论:天鹅能够带来孩子。你认为这样得到的结论可靠吗?如何证明这个结论的可靠性?结论可靠吗?如何证明这个结论的可靠性? 而要证实此结论是否可靠,可以通过试验来进行。而要证实此结论是否可靠,可以通过试验来进行。相同的环境下将居民随机地分为两组,一组居民和相同的环境

15、下将居民随机地分为两组,一组居民和天鹅一起生活(比如家中都饲养天鹅),而另一组天鹅一起生活(比如家中都饲养天鹅),而另一组居民的附近不让天鹅活动,对比两组居民的出生率居民的附近不让天鹅活动,对比两组居民的出生率是否相同。是否相同。练习练习2:如果散点图中点的分布如果散点图中点的分布从从整体整体上看上看大致在一条直大致在一条直线附近,我们就称这两个变量之间具有线附近,我们就称这两个变量之间具有线性相关线性相关关系关系,这条直线就叫做,这条直线就叫做回归直线回归直线。 这条回归直线的方程,简称为回归方程。这条回归直线的方程,简称为回归方程。回归直线回归直线 1.如果所有的样本点都落在某一函数曲线上

16、,变如果所有的样本点都落在某一函数曲线上,变量之间具有函数关系量之间具有函数关系2.如果所有的样本点都落在某一函数曲线如果所有的样本点都落在某一函数曲线附近附近,变量之间就有变量之间就有相关关系相关关系3.如果所有的样本点都落在某一如果所有的样本点都落在某一直线附近直线附近,变量,变量之间就有之间就有线性相关关系线性相关关系 只有散点图中的点只有散点图中的点呈条状集中在某一直线呈条状集中在某一直线周围周围的时候,才可以说两个变量之间具有线性的时候,才可以说两个变量之间具有线性关系,才有两个变量的正线性相关和负线性相关系,才有两个变量的正线性相关和负线性相关的概念,才可以用回归直线来描述两个变量

17、关的概念,才可以用回归直线来描述两个变量之间的关系之间的关系整体上最接近整体上最接近 采用测量的方法:先画一条直线,测采用测量的方法:先画一条直线,测量出各点到它的距离,然后移动直线,到达一量出各点到它的距离,然后移动直线,到达一个使个使距离之和最小距离之和最小的位置,测量出此时直线的的位置,测量出此时直线的斜率和截距斜率和截距,就得到回归方程。,就得到回归方程。如何具体的求出这个回归方程呢?如何具体的求出这个回归方程呢? 在图中选取两点画直线,使得直线在图中选取两点画直线,使得直线两侧的点的个数基本相同。两侧的点的个数基本相同。脂肪010203040020406080脂肪 在散点图中多取几组

18、点,确定几条直线的在散点图中多取几组点,确定几条直线的方程,分别求出各条直线的方程,分别求出各条直线的斜率和截距的平均数斜率和截距的平均数,将这两个平均数作为回归方程的斜率和截距。将这两个平均数作为回归方程的斜率和截距。脂肪010203040020406080脂肪上述三种方案均有一定的道理,但可靠性不强,上述三种方案均有一定的道理,但可靠性不强,我们回到回归直线的我们回到回归直线的定义定义。求回归方程的关键是如何求回归方程的关键是如何用数学的方法来刻画用数学的方法来刻画“从整体上看,各点与直线的偏差最小从整体上看,各点与直线的偏差最小”。如果散点图中点的分布如果散点图中点的分布从从整体整体上看

19、上看大致在一条直线附近,大致在一条直线附近,我们就称这两个变量之间具有我们就称这两个变量之间具有线性相关关系线性相关关系,这条直线,这条直线就叫做就叫做回归直线回归直线。(二)回归直线(二)回归直线如何求回归直线的方程如何求回归直线的方程 实际上实际上,求回归直线的关键是如何用数学的方法求回归直线的关键是如何用数学的方法来刻画来刻画”从整体上看从整体上看,各点到此直线的距离最小各点到此直线的距离最小”.回归直线回归直线 实际上实际上,求回归直线的关键是如何用数学的方求回归直线的关键是如何用数学的方法来刻画法来刻画“从整体上看从整体上看,各点到此直线的距离最各点到此直线的距离最小小”.问题归结为

20、问题归结为:a,b取什么值时取什么值时Q最小最小,即总体偏差即总体偏差最小最小.下面是计算回归方程的斜率和截距的一下面是计算回归方程的斜率和截距的一般公式般公式.这种通过求总体偏差的最小值而得到回归直线的方这种通过求总体偏差的最小值而得到回归直线的方法就是最小二乘法法就是最小二乘法.xbyaxnxyxnxxxyyxxbniiniiiniiniiiy,)()(1221121以上公式的推导较复杂,故不作推导,但它的原理较为简单:即各点到该直线的距离的平方和最小,这一方法叫最小二乘法。归纳:归纳:求样本数据的线性回归方程,可按下列步骤进行:求样本数据的线性回归方程,可按下列步骤进行:第一步,计算平均

21、数第一步,计算平均数 , xy1niiix y21niix第二步,求和第二步,求和 , (列表)列表) 1122211()(),()nniii iiinniiiixx yyxynx ybay bxxxxnx 第三步,计算第三步,计算 ybxa=+第四步,写出回归方程第四步,写出回归方程 思考:思考:利用利用计算器计算器或或计算机计算机可求得年龄和可求得年龄和人体脂肪含量的样本数据的回归方程为人体脂肪含量的样本数据的回归方程为 ,由此我们可以根据,由此我们可以根据一个人年一个人年龄预测其体内脂肪含量的百分比龄预测其体内脂肪含量的百分比的的回归值回归值. .若某人若某人6565岁,则其体内脂肪含量

22、岁,则其体内脂肪含量的百分比的百分比约约为多少?为多少?0. 5770. 448yx=-37.1(0.57765-0.448= 37.1)若某人若某人6565岁,可预测他体内脂肪含量在岁,可预测他体内脂肪含量在37.137.1(0.5770.57765-0.448= 37.165-0.448= 37.1)附近的)附近的可能性比较可能性比较大。大。 但不能说他体内脂肪含量一定是但不能说他体内脂肪含量一定是37.137.1原因原因:线性回归方程中的截距和斜率:线性回归方程中的截距和斜率都是通过样都是通过样本本计算的计算的,存在随机误差存在随机误差,这种误差可以导致预,这种误差可以导致预测结果的偏差

23、,即使截距斜率没有误差,也不可测结果的偏差,即使截距斜率没有误差,也不可能百分百地保证对应于能百分百地保证对应于x x,预报值,预报值Y Y能等于实际值能等于实际值y y例例3 3:有一个同学家开了一个小卖部,他为了研究:有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:的热饮杯数与当天气温的对比表:1 1、画出散点图;、画出散点图;2 2、从散点图中发现气温与热饮、从散点图中发现气温与热饮销售杯数之间关系的一般规律;销售杯数之间关系的一般规律;3 3、求回归方程;、求回归方程;4 4、如

24、果某天的气温是、如果某天的气温是2 2摄氏度,摄氏度,预测这天卖出的热饮杯数。预测这天卖出的热饮杯数。图3-1050100150200-2002040热饮杯数1、散点图、散点图2 2、从图、从图3-13-1看到,各点散布在从左上角到由下角的看到,各点散布在从左上角到由下角的区域里,因此,气温与热饮销售杯数之间成负相关,区域里,因此,气温与热饮销售杯数之间成负相关,即气温越高,卖出去的热饮杯数越少。即气温越高,卖出去的热饮杯数越少。3 3、从散点图可以看出,这些点大致分布在一条直、从散点图可以看出,这些点大致分布在一条直线的附近,因此利用公式求出线的附近,因此利用公式求出回归方程回归方程的系数。

25、的系数。 Y= -2.352x+147.767Y= -2.352x+147.7674 4、当、当x=2x=2时,时,Y=143.063 Y=143.063 因此,某天的气温为因此,某天的气温为2 2摄氏度时,这天大约可以卖出摄氏度时,这天大约可以卖出143143杯热饮。杯热饮。例例4:给出施化肥量对水稻产量影响的给出施化肥量对水稻产量影响的试验数据:试验数据:施化肥施化肥量量x15202530354045水稻产水稻产量量y330 345 365 405 445 450 455(1)(1)画出上表的散点图画出上表的散点图; ;(2)(2)求出回归直线并且画出求出回归直线并且画出图形图形. . 从

26、而得回归直线方程是从而得回归直线方程是 3 .399,30yx777221117000,1132725,87175iiiiiiixyx y2573075. 43 .399,75. 430770003 .399307871752ab4.75257yx解:解:(1)(1)散点图(略)散点图(略)(2)(2)表中的数据进行具体计算,列成以下表格表中的数据进行具体计算,列成以下表格20475180001557512150912569004950 xiyi455450445405365345330yi45403530252015xi7654321i( (图形略图形略) )故可得到故可得到练习练习x123

27、4y1/23/2231.已知变量已知变量x和变量和变量y有下列对应数据有下列对应数据则则y对对x的回归直线方程为什么?的回归直线方程为什么?2 2、下列两个变量之间的关系哪个不是函数关系(、下列两个变量之间的关系哪个不是函数关系( )A A角度和它的余弦值角度和它的余弦值B. B. 正方形边长和面积正方形边长和面积C C正边形的边数和它的内角和正边形的边数和它的内角和D. D. 人的年龄和身高人的年龄和身高D32yx x4设有一个回归方程设有一个回归方程,当变量,当变量增加增加1个单位时(个单位时( )y y y y A平均增加平均增加2个单位个单位CD平均增加平均增加3个单位个单位平均减少平

28、均减少2个单位个单位平均减少平均减少3个单位个单位.BA3.b_,a_.用最小二乘法求回归系数n1i22in1iiixyxxnyxnxby ,ybxab点评:回归直线方程中 的意义是_ 当变量当变量x增加增加1个单位时个单位时, 平均增加平均增加b个单位个单位y bxy 65、线性回归方程表示的直线、线性回归方程表示的直线必经过点必经过点( )A(6,0) B(0,6) C(1,6) D(6,1)bxay6、线性回归方程表示的直线、线性回归方程表示的直线必经过点必经过点( )A(0,0)xB(,0)yC(0,)D( , )xyBD7.y0.5x0.81x25y_.已知回归方程,则时,的估计值为

29、11.69 8、已知回归方程已知回归方程 =4.4x+838.19,则可估计,则可估计x与与y的的增长速度之比约为增长速度之比约为_.y 1/4.4A.5.75 1.75yxB.1.755.75yxC.1.755.75yxD.5.75 1.75yx9.9.三点三点(3,10),(7,20),(11,24)(3,10),(7,20),(11,24)的线性回归方的线性回归方程是程是( )( )D1221,niiiniix yn x ybxn xayb x小结小结1.1.求样本数据的线性回归方程,可按求样本数据的线性回归方程,可按下列步骤进行:下列步骤进行:第一步,列表计算平均数第一步,列表计算平均

30、数 , xy1niiix y21niix第二步,求和第二步,求和 , 1122211()(),()nniii iiinniiiixx yyxynx ybay bxxxxnx 第三步,计算第三步,计算 第四步,写出回归方程第四步,写出回归方程 2.2.回归方程被样本数据回归方程被样本数据惟一惟一确定确定,各样本点,各样本点大致分布在回归直线附近大致分布在回归直线附近. .对同一个总体,对同一个总体,不同的样本数据对应不同的回归直线不同的样本数据对应不同的回归直线,所以,所以回归直线也具有回归直线也具有随机性随机性. . 3.3.对于任意一组样本数据,利用上述公式都对于任意一组样本数据,利用上述公式都可以求得可以求得“回归方程回归方程”,如果这组数据不具如果这组数据不具有线性相关关系,即不存在回归直线,那么有线性相关关系,即不存在回归直线,那么所得的所得的“回归方程回归方程”是没有实际意义的是没有实际意义的. .因此,因此,对一组样本数据,应先作散点图,对一组样本数据,应先作散点图,在具有线在具有线性相关关系的前提下性相关关系的前提下再求回归方程再求回归方程. .

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 初中资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com