高考数学一轮复习第9章算法初步统计与统计案例第4节变量间的相关关系与统计案例教师用书文新人教A版.doc

上传人:随风 文档编号:739266 上传时间:2019-06-07 格式:DOC 页数:17 大小:190KB
返回 下载 相关 举报
高考数学一轮复习第9章算法初步统计与统计案例第4节变量间的相关关系与统计案例教师用书文新人教A版.doc_第1页
第1页 / 共17页
高考数学一轮复习第9章算法初步统计与统计案例第4节变量间的相关关系与统计案例教师用书文新人教A版.doc_第2页
第2页 / 共17页
点击查看更多>>
资源描述

《高考数学一轮复习第9章算法初步统计与统计案例第4节变量间的相关关系与统计案例教师用书文新人教A版.doc》由会员分享,可在线阅读,更多相关《高考数学一轮复习第9章算法初步统计与统计案例第4节变量间的相关关系与统计案例教师用书文新人教A版.doc(17页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、1 / 17【2019【2019最新最新】精选高考数学一轮复习第精选高考数学一轮复习第9 9章算法初步统计与统计案例第章算法初步统计与统计案例第 4 4节变量间的相关关系与统计案例教师用书文新人教节变量间的相关关系与统计案例教师用书文新人教A A版版 考纲传真 1.会做两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归系数公式不要求记忆).3.了解回归分析的基本思想、方法及其简单应用.4.了解独立性检验(只要求22列联表)的思想、方法及其初步应用1回归分析回归分析是对具有相关关系的两个变量进行统计

2、分析的一种常用方法;判断相关性的常用统计图是散点图;统计量有相关系数与相关指数(1)在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关(2)在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关(3)如果散点图中点的分布从整体上看大致在一条直线附近,称两个变量具有线性相关关系2线性回归方程(1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法(2)回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),(xn,yn),其回归方程为x,则,.其中,是回归方程的斜率,是在y轴上的截距3

3、残差分析(1)残差:对于样本点(x1,y1),(x2,y2),(xn,yn),它们的随机误差为eiyibxia,i1,2,n,其估计值为iyiiyixi,i1,2,n,i称为相应于点(xi,yi)的残差2 / 17(2)相关指数:R21.4独立性检验(1)利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验(2)列联表:列出的两个分类变量的频数表,称为列联表假设有两个分类变量X和Y,它们的可能取值分别为x1,x2和y1,y2,其样本频数列联表(22列联表)为y1y2总计x1ababx2cdcd总计acbdabcd则随机变量K2(其中nabcd为样本容量)1(思考辨析)判断下列结论的

4、正误(正确的打“”,错误的打“”)(1)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系( )(2)某同学研究卖出的热饮杯数y与气温x()之间的关系,得回归方程2.352x147.767,则气温为2时,一定可卖出143杯热饮( )(3)因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验( )(4)若事件X,Y关系越密切,则由观测数据计算得到的K2的观测值越小( )答案 (1) (2) (3) (4)2(教材改编)已知变量x与y正相关,且由观测数据算得样本平均数3,3.5,则由该观测数据算得的线性回归方程可能是( )A.0.4x2.3 B.2x2.4C.2x

5、9.5D.0.3x4.4A A 因为变量因为变量x x和和y y正相关,排除选项正相关,排除选项C C,D.D.又样本中心又样本中心(3,3.5)(3,3.5)在回归直线上,排除在回归直线上,排除B B3 / 17,选项,选项A A满足满足 3(2015全国卷)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( )图941A逐年比较,2008年减少二氧化硫排放量的效果最显著B2007年我国治理二氧化硫排放显现成效C2006年以来我国二氧化硫年排放量呈减少趋势D2006年以来我国二氧化硫年排放量与年份正相关D D 对于对于A A选项,由图知从选项

6、,由图知从20072007年到年到20082008年二氧化硫排放量下降得最多,故年二氧化硫排放量下降得最多,故A A正确正确对于对于B B选项,由图知,由选项,由图知,由20062006年到年到20072007年矩形高度明显下降,因此年矩形高度明显下降,因此B B正确对于正确对于C C选项,由图知从选项,由图知从20062006年以后除年以后除20112011年稍有上升外,其余年份都是逐年下降的,所年稍有上升外,其余年份都是逐年下降的,所以以C C正确由图知正确由图知20062006年以来我国二氧化硫年排放量与年份负相关,故选年以来我国二氧化硫年排放量与年份负相关,故选D.D.4为了评价某个电

7、视栏目的改革效果,在改革前后分别从居民点抽取了100位居民进行调查,经过计算K20.99,根据这一数据分析,下列说法正确的是 ( )A有99%的人认为该电视栏目优秀B有99%的人认为该电视栏目是否优秀与改革有关系C有99%的把握认为该电视栏目是否优秀与改革有关系D没有理由认为该电视栏目是否优秀与改革有关系D D 只有只有K26.635K26.635才能有才能有99%99%的把握认为的把握认为“该电视栏目是否优秀与改革有关系该电视栏目是否优秀与改革有关系”,而即使而即使K26.635K26.635也只是对也只是对“该电视栏目是否优秀与改革有关系该电视栏目是否优秀与改革有关系”这个论断成立这个论断

8、成立的可能性大小的结论,与是否有的可能性大小的结论,与是否有99%99%的人等无关,故只有的人等无关,故只有D D正确正确 5(2017贵阳检测)若8名学生的身高和体重数据如下表:编号12345678身高/cm1651651571701751651551704 / 17体重/kg48575464614359第3名学生的体重漏填,但线性回归方程是0.849x85.712,则第3名学生的体重估计为_kg.50 设第3名学生的体重为a,则(4857a5464614359)0.849(1651651571701751 8165155170)85.712. 解得a50.相关关系的判断(1)(2015湖北

9、高考)已知变量x和y满足关系y0.1x1,变量y与z正相关下列结论中正确的是( )Ax与y正相关,x与z负相关Bx与y正相关,x与z正相关Cx与y负相关,x与z负相关Dx与y负相关,x与z正相关(2)x和y的散点图如图942所示,则下列说法中所有正确命题的序号为_图942x,y是负相关关系;在该相关关系中,若用yc1ec2x拟合时的相关指数为R,用x拟合时的相关指数为R,则RR;x,y之间不能建立线性回归方程(1)C (2) (1)因为y0.1x1的斜率小于0,故x与y负相关因为y与z正相关,可设zy,0,则zy0.1x,故x与z负相关(2)在散点图中,点散布在从左上角到右下角的区域,因此x,

10、y是负相关关系,故正确;由散点图知用yc1ec2x拟合比用x拟合效果要好,则RR,5 / 17故正确;x,y之间可以建立线性回归方程,但拟合效果不好,故错误规律方法 1.利用散点图判断两个变量是否有相关关系是比较直观简便的方法如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系若点散布在从左下角到右上角的区域,则正相关,若点散布在左上角到右下角的区域,则负相关2利用相关系数判定,当|r|越趋近于1,相关性越强当残差平方和越小,相关指数R2越大,相关性越强变式训练1 甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做试验,

11、并用回归分析方法分别求得相关系数r与残差平方和m如下表:甲乙丙丁r0.820.780.690.85m106115124103则哪位同学的试验结果体现A,B两变量有更强的线性相关性( )A甲 B乙 C丙 D丁D D 在验证两个变量之间的线性相关关系时,相关系数的绝对值越接近于在验证两个变量之间的线性相关关系时,相关系数的绝对值越接近于1 1,相关性,相关性越强,在四个选项中只有丁的相关系数最大;残差平方和越小,相关性越强,只越强,在四个选项中只有丁的相关系数最大;残差平方和越小,相关性越强,只有丁的残差平方和最小,综上可知丁的试验结果体现了有丁的残差平方和最小,综上可知丁的试验结果体现了A A,

12、B B两变量有更强的线性两变量有更强的线性相关性相关性 线性回归方程及应用(2016全国卷)如图943是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图图943注:年份代码17分别对应年份20082014.6 / 17(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量参考数据:yi9.32,tiyi40.17,0.55,2.646.参考公式:相关系数r,回归方程t中斜率和截距的最小二乘估计公式分别为,.解 (1)由折线图中的数据和附注中的参考数据得4, (ti

13、)228,0.55,2分t(ti)(yi)tiyiyi40.1749.322.89,7i1所以r0.99.因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当大,从而可以用线性回归模型拟合y与t的关系.5分(2)由1.331及(1)得0.103.8分b1.3310.10340.92.a所以y关于t的回归方程为0.920.10t.10分将2016年对应的t9代入回归方程得0.920.1091.82. 所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨.12分规律方法 1.在分析实际中两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,也可计算相关

14、系数r进行判断若具有线性相关关系,则可通过线性回归方程估计和预测变量的值2(1)正确运用计算,的公式和准确的计算,是求线性回归方程的关键(2)回归直线x必过样本点的中心(,)变式训练2 7 / 17(2014全国卷)某地区2007年至2013年农村居民家庭人均纯收入y(单位:千元)的数据如下表:年 份2007200820092010201120122013年份代号t1234567人均纯收入y2.93.33.64.44.85.25.9(1)求y关于t的线性回归方程;(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人

15、均纯收入附:回归直线的斜率和截距的最小二乘估计公式分别为:,.b解 (1)由所给数据计算得(1234567)4,(2.93.33.64.44.85.25.9)4.3,y(ti)2941014928,3分7i17i1(ti)(yi)(3)(1.4)(2)(1)(1)(0.7)00.110.520.931.614,0,5,b4.30.542.3,a所求回归方程为0.5t2.3.6分(2)由(1)知,0.50,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.9分将2015年的年份代号t9代入(1)中的回归方程,得0.592.36.8,y故预测该地区2015年农村

16、居民家庭人均纯收入为6.8千元.12分独立性检验(2017郑州调研)某高校共有学生15 000人,其中男生10 8 / 17500人,女生4 500人为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时)(1)应收集多少位女生的样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图944所示),其中样本数据的分组区间为:0,2,(2,4,(4,6,(6,8,(8,10,(10,12估计该校学生每周平均体育运动时间超过4小时的概率;【导学号:31222369】图944(3)在样本数据中,有60

17、位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.P(K2k0)0.100.050.0100.005k02.7063.8416.6357.879附:K2.解 (1)利用分层抽样,30090,所以应收集90位女生的样本数据.4分(2)由频率分布直方图得12(0.0250.100)0.75.所以该校学生每周平均体育运动时间超过4小时的概率的估计值为0.75.8分(3)由(2)知,300位学生中有3000.75225人的每周平均体育运动时间超过4小时,75人的每周平均体育运动时间不超过4小时.10

18、分又因为样本数据中有210份是关于男生的,90份是关于女生的,所以每周平均体育运动时间与性别列联表如下:每周平均体育运动时间与性别列联表男生女生总计每周平均体育运动时间不超过4小时453075每周平均体育运动时间超过4小时16560225总计21090300将22列联表中的数据代入公式计算,得K2观测值9 / 17k4.7623.841.所以,有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.12分规律方法 1.在22列联表中,如果两个变量没有关系,则应满足adbc0.|adbc|越小,说明两个变量之间关系越弱;|adbc|越大,说明两个变量之间关系越强2解决独立性检验的应用问题

19、,一定要按照独立性检验的步骤得出结论独立性检验的一般步骤:(1)根据样本数据制成22列联表;(2)根据公式K2计算K2的观测值k;(3)比较k与临界值的大小关系,作统计推断变式训练3 (2017济南联考)某市地铁即将于2017年6月开始运营,为此召开了一个价格听证会,拟定价格后又进行了一次调查,随机抽查了50人,他们的收入与态度如下;月收入(单位:百元)15,25)25,35)35,45)45,55)55,65)65,75赞成定价者人数123534认为价格偏高者人数4812521(1)若以区间的中点值为该区间内的人均月收入,求参与调查的人员中“赞成定价者”与“认为价格偏高者”的月平均收入的差距

20、是多少(结果保留2位小数);(2)由以上统计数据填下面22列联表,分析是否有99%的把握认为“月收入以55百元为分界点对地铁定价的态度有差异”.月收入不低于55百元的人数月收入低于55百元的人数总计认为价格偏高者赞成定价者10 / 17总计附:K2.P(K2k0)0.050.01k03.8416.635解 (1)“赞成定价者”的月平均收入为x120 130 240 350 560 370 4 12353450.56.“认为价格偏高者”的月平均收入为x220 430 840 1250 560 270 1 481252138.75,“赞成定价者”与“认为价格偏高者”的月平均收入的差距是x1x250

21、.5638.7511.81(百元).5分(2)根据条件可得22列联表如下:月收入不低于55百元的人数月收入低于55百元的人数总计认为价格偏高者32932赞成定价者71118总计104050K26.276.635,没有99%的把握认为“月收入以55百元为分界点对地铁定价的态度有差异”.12分思想与方法1回归分析是处理变量相关关系的一种数学方法主要解决:(1)确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式;(2)根据一组观察值,预测变量的取值及判断变量取值的变化趋势;(3)求出线性回归方程11 / 172根据K2的值可以判断两个分类变量有关的可信程度易错与防范1回归分析是对具有

22、相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义根据回归方程进行预报,仅是一个预报值,而不是真实发生的值2独立性检验中统计量K2的观测值k的计算公式很复杂,在解题中易混淆一些数据的意义,代入公式时出错,而导致整个计算结果出错课时分层训练课时分层训练( (五十七五十七) )变量间的相关关系与统计案例变量间的相关关系与统计案例A组 基础达标(建议用时:30分钟)一、选择题1四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:y与x负相关且2.347x6.423;y与x负相关

23、且3.476x5.648;y与x正相关且5.437x8.493;y与x正相关且4.326x4.578.其中一定不正确的结论的序号是 ( )A B C DD D 由正负相关性的定义知由正负相关性的定义知一定不正确一定不正确 2两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关指数R2如下,其中拟合效果最好的模型是 ( )A模型1的相关指数R2为0.98B模型2的相关指数R2为0.80C模型3的相关指数R2为0.50D模型4的相关指数R2为0.2512 / 17A A 相关指数相关指数R2R2越大,拟合效果越好,因此模型越大,拟合效果越好,因此模型1 1拟合效果最好拟合效果最好 3第3

24、1届夏季奥林匹克运动会,中国获26金,18银,26铜共70枚奖牌居奖牌榜第二,并打破3次世界记录由此许多人认为中国进入了世界体育强国之列,也有许多人持反对意见有网友为此进行了调查,在参加调查的2 548名男性公民中有1 560名持反对意见,2 452名女性公民中有1 200人持反对意见,在运用这些数据说明中国的奖牌数是否与中国进入体育强国有无关系时,用什么方法最有说服力( )A平均数与方差B回归直线方程C独立性检验D概率C C 由于参加讨论的公民按性别被分成了两组,而且每一组又被分成了两种情况:由于参加讨论的公民按性别被分成了两组,而且每一组又被分成了两种情况:认为有关与无关,故该资料取自完全

25、随机统计,符合认为有关与无关,故该资料取自完全随机统计,符合2222列联表的要求故用独列联表的要求故用独立性检验最有说服力立性检验最有说服力 4(2015福建高考)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x(万元)8.28.610.011.311.9支出y(万元)6.27.58.08.59.8根据上表可得回归直线方程x,其中0.76,.据此估计,该社区一户年收入为15万元家庭的年支出为( )A11.4万元B11.8万元C12.0万元D12.2万元B B 由题意知,由题意知,1010,8,y80.76100.4,当x15时,0.76150.4

26、11.8(万元)5通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:13 / 17男女总计爱好402060不爱好203050总计6050110由K2,算得K27.8.附表:P(K2k0)0.0500.0100.001k03.8416.63510.828参照附表,得到的正确结论是( )A在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C有99%以上的把握认为“爱好该项运动与性别有关”D有99%以上的把握认为“爱好该项运动与性别无关”C C 根据独立性检验的定义,由根据独立性检验的定义,

27、由K27.8K27.86.6356.635,可知我们在犯错误的概率不超过,可知我们在犯错误的概率不超过0 0.01.01的前提下,即有的前提下,即有99%99%以上的把握认为以上的把握认为“爱好该项运动与性别有关爱好该项运动与性别有关” 二、填空题6(2017西安质检)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验根据收集到的数据(如下表),由最小二乘法求得回归方程0.67x54.9.零件数x(个)1020304050加工时间y(min)62758189现发现表中有一个数据看不清,请你推断出该数据的值为_. 【导学号:31222370】6868 由由3030,得,得0

28、.67300.673054.954.975.75.14 / 17设表中的“模糊数字”为a,则62a758189755,即a68.7为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下22列联表:理科文科总计男131023女72027总计203050已知P(K23.841)0.05,P(K25.024)0.025.根据表中数据,得到K24.844.则认为选修文科与性别有关系出错的可能性为_5% K24.844,根据假设检验的基本原理,应该断定“是否选修文科与性别之间有关系”成立,并且这种判断出错的可能性约为5%.8(2017长沙雅礼中学质检)某单位为了了解用电量y(度)

29、与气温x()之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:气温()1813101用电量(度)24343864由表中数据得回归直线方程x中的2,预测当气温为4 时,用电量为_.【导学号:31222371】6868 根据题意知根据题意知1010,4040,因为回归直线过样本点的中心,所以,因为回归直线过样本点的中心,所以4040( (2)2)10106060,所以当,所以当x x4 4时,时,y y( (2)(2)(4)4)60606868,所以用电量为,所以用电量为6868度度 三、解答题9(2017石家庄质检)微信是现代生活进行信息交流的重要工具,据统计,某公司200名员工中

30、90%的人使用微信,其中每天使用微信时间在一小时以内的有60人,其余的员工每天使用微信的时间在一小时以上,若将员工分成青年(年15 / 17龄小于40岁)和中年(年龄不小于40岁)两个阶段,那么使用微信的人中75%是青年人若规定:每天使用微信时间在一小时以上为经常使用微信,那么经常使用微信的员工中是青年人(1)若要调查该公司使用微信的员工经常使用微信与年龄的关系,列出22列联表:青年人中年人总计经常使用微信不经常使用微信总计(2)由列联表中所得数据判断,是否有99.9%的把握认为“经常使用微信与年龄有关”?附:K2.P(K2k0)0.0100.001k06.63510.828解 (1)由已知可

31、得,该公司员工中使用微信的有20090%180(人),经常使用微信的有18060120(人),其中青年人有12080(人),使用微信的人中青年人有18075%135(人),所以22列联表:青年人中年人总计经常使用微信8040120不经常使用微信55560总计135451805分(2)将列联表中数据代入公式可得:K213.333,由于13.33310.828,所以有99.9%的把握认为“经常使用微信与年龄有关” .12分10为了研究某种细菌在特定环境下随时间变化的繁殖情况,得如下试验数16 / 17据:天数t(天)34567繁殖个数y(千个)2.5344.56(1)求y关于t的线性回归方程;(2

32、)利用(1)中的回归方程,预测t8时的细菌繁殖个数附:回归直线的斜率和截距的最小二乘法估计公式分别为:,.b解 (1)由表中数据计算得,5,4, (ti)(yi)8.5, (ti)210,2分t0.85,b40.8550.25.a所以回归方程为0.85t0.25.5分(2)将t8代入(1)的回归方程中得0.8580.256.55.10分y故预测t8时,细菌繁殖个数为6.55千个.12分B组 能力提升(建议用时:15分钟)1根据如下样本数据:x345678y4.02.50.50.52.03.0得到的回归方程为bxa,则( )Aa0,b0 Ba0,b0Ca0,b0Da0,b0B B 作出散点图如下:作出散点图如下:观察图象可知,回归直线bxa的斜率b0,当x0时,a0.故a0,b0.2(2017赣中南五校联考)心理学家分析发现视觉和空间想象能力与性别17 / 17有关,某数学兴趣小组为了验证这个结论,从所在学校中按分层抽样的方法抽取50名同学(男30女20),给所有同学几何题和代数题各一题,让各位同学自由选择一道题进行解答选题情况如下表:(单位:人)几何题代数题总计男同学22830女同学81220总计302050根据上述数据,推断视觉和空间想象能力与性别有关系,则这种推断犯错误的概率不超过_附表:

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 高中资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com