2019届高考数学二轮复习 第二部分专项二 专题六 2 第2讲 统计与统计案例 学案 .doc

上传人:荣*** 文档编号:2678582 上传时间:2020-04-27 格式:DOC 页数:21 大小:777.50KB
返回 下载 相关 举报
2019届高考数学二轮复习 第二部分专项二 专题六 2 第2讲 统计与统计案例 学案 .doc_第1页
第1页 / 共21页
2019届高考数学二轮复习 第二部分专项二 专题六 2 第2讲 统计与统计案例 学案 .doc_第2页
第2页 / 共21页
点击查看更多>>
资源描述

《2019届高考数学二轮复习 第二部分专项二 专题六 2 第2讲 统计与统计案例 学案 .doc》由会员分享,可在线阅读,更多相关《2019届高考数学二轮复习 第二部分专项二 专题六 2 第2讲 统计与统计案例 学案 .doc(21页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、第2讲统计与统计案例年份卷别考查内容及考题位置命题分析2018卷扇形统计图的应用T31.统计与统计案例在选择或填空题中的命题热点主要集中在随机抽样、用样本估计总体以及变量间的相关性判断等,难度较低,常出现在34题的位置.2.统计解答题多在第18题的位置,且多以频率分布直方图或茎叶图与线性回归分析或独立性检验相交汇的形式考查,难度中等.卷回归分析及其应用T18卷统计案例T182017卷频率分布直方图、独立性检验T18卷折线图的识别及应用T32016卷统计图表的应用T4折线图、相关性检验、线性回归方程及其应用T18抽样方法(基础型) 系统抽样总体容量为N,样本容量为n,则要将总体均分成n组,每组个

2、(有零头时要先去掉)若第一组抽到编号为k的个体,则以后各组中抽取的个体编号依次为k,k(n1). 分层抽样按比例抽样,计算的主要依据是:各层抽取的数量之比总体中各层的数量之比考法全练1福利彩票“双色球”中红色球的号码可以从01,02,03,32,33这33个两位号码中选取,小明利用如下所示的随机数表选取红色球的6个号码,选取方法是从第1行第9列的数字开始,从左到右依次读取数据,则第四个被选中的红色球号码为()81 47 23 68 63 93 17 90 12 69 86 81 62 93 50 60 91 33 75 85 61 39 8506 32 35 92 46 22 54 10 02

3、 78 49 82 18 86 70 48 05 46 88 15 19 20 49A.12B33C06D16解析:选C.被选中的红色球号码依次为17,12,33,06,32,22.所以第四个被选中的红色球号码为06,故选C.2利用系统抽样法从编号分别为1,2,3,80的80件不同产品中抽出一个容量为16的样本,如果抽出的产品中有一件产品的编号为13,则抽到产品的最大编号为()A73B78C77D76解析:选B.样本的分段间隔为5,所以13号在第三组,则最大的编号为13(163)578.故选B.3某电视台在因特网上就观众对其某一节目的喜爱程度进行调查,参加调查的一共有20 000人,其中各种态

4、度对应的人数如下表所示:最喜爱喜爱一般不喜欢4 8007 2006 4001 600电视台为了了解观众的具体想法和意见,打算从中抽选出100人进行更为详细的调查,为此要进行分层抽样,那么在分层抽样时,每类人中应抽选出的人数分别为()A25,25,25,25B48,72,64,16C20,40,30,10D24,36,32,8解析:选D.法一:因为抽样比为,所以每类人中应抽选出的人数分别为4 80024,7 20036,6 40032,1 6008.故选D.法二:最喜爱、喜爱、一般、不喜欢的比例为4 8007 2006 4001 6006982,所以每类人中应抽选出的人数分别为10024,100

5、36,10032,1008,故选D.“双图”“五数”估计总体(基础型) 统计中的5个数据特征(1)众数:在样本数据中,出现次数最多的那个数据(2)中位数:样本数据中,将数据按大小排列,位于最中间的数据如果数据的个数为偶数,就取中间两个数据的平均数作为中位数(3)平均数:样本数据的算术平均数,即(x1x2xn)(4)方差与标准差:s2(x1)2(x2)2(xnx)2;s. 从频率分布直方图中得出有关数据的技巧(1)频率:频率分布直方图中横轴表示组数,纵轴表示,频率组距.(2)频率比:频率分布直方图中各小长方形的面积之和为1,因为在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比

6、,从而根据已知的几组数据个数比求有关值(3)众数:最高小长方形底边中点的横坐标(4)中位数:平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标(5)平均数:频率分布直方图中每个小长方形的面积乘小长方形底边中点的横坐标之和(6)性质应用:若纵轴上存在参数值,则根据所有小长方形的高之和组距1,列方程即可求得参数值考法全练1某课外小组的同学们在社会实践活动中调查了20户家庭某月的用电量,如下表所示:用电量/度120140160180200户数23582则这20户家庭该月用电量的众数和中位数分别是()A180,170B160,180C160,170D180,160解析:选A.用电量为180度的

7、家庭最多,有8户,故这20户家庭该月用电量的众数是180,排除B,C;将用电量按从小到大的顺序排列后,处于最中间位置的两个数是160,180,故这20户家庭该月用电量的中位数是170.故选A.2(2018贵阳模拟)在某中学举行的环保知识竞赛中,将三个年级参赛学生的成绩进行整理后分为5组,绘制如图所示的频率分布直方图,图中从左到右依次为第一、第二、第三、第四、第五小组,已知第二小组的频数是40,则成绩在80100分的学生人数是()A15B18C20D25解析:选A.根据频率分布直方图,得第二小组的频率是0.04100.4,因为频数是40,所以样本容量是100,又成绩在80100分的频率是(0.0

8、10.005)100.15,所以成绩在80100分的学生人数是1000.1515.故选A.3(2018武汉调研)某选手的7个得分去掉1个最高分,去掉1个最低分,剩余5个得分的平均数为91,如图,该选手的7个得分的茎叶图有一个数据模糊,无法辨认,在图中用x表示,则剩余5个得分的方差为()A.B.C6D30解析:选C.由茎叶图知,最低分为87分,最高分为99分依题意得,(879390910x91)91,解得x4.则剩余5个得分的方差s2(8791)2(9391)2(9091)2(9491)2(9191)2(16419)6.故选C.4“中国人均读书4.3本(包括网络文学和教科书),比韩国的11本、法

9、国的20本、日本的40本、犹太人的64本少得多,是世界上人均读书最少的国家”这个论断被各种媒体反复引用出现这样的统计结果无疑是令人尴尬的某小区为了提高小区内人员的读书兴趣,准备举办读书活动,并进一定量的书籍丰富小区图书站由于不同年龄段的人看不同类型的书籍,为了合理配备资源,现对小区内看书人员进行年龄调查,随机抽取了40名读书者进行调查,将他们的年龄(单位:岁)分成6段:20,30),30,40),40,50),50,60),60,70),70,80后得到如图所示的频率分布直方图(1)求在这40名读书者中年龄分布在40,70)的人数;(2)求这40名读书者的年龄的平均数和中位数解:(1)由频率分

10、布直方图知年龄在40,70)的频率为(0.0200.0300.025)100.75,故这40名读书者中年龄分布在40,70)的人数为400.7530.(2)这40名读书者年龄的平均数为250.05350.10450.20550.30650.25750.1054.设中位数为x,则0.005100.010100.020100.030(x50)0.5,解得x55,故这40名读书者年龄的中位数为55.回归分析(综合型)典型例题命题角度一线性回归分析 (2018广州模拟)某地110岁男童年龄xi(单位:岁)与身高的中位数yi(单位:cm)(i1,2,10)如下表:x/岁12345678910y/cm76

11、.588.596.8104.1111.3117.7124.0130.0135.4140.2对上表的数据作初步处理,得到下面的散点图及一些统计量的值 (xi)2 (yi)2 (xi)(yi)5.5112.4582.503 947.71566.85(1)求y关于x的线性回归方程(线性回归方程系数精确到0.01);(2)某同学认为ypx2qxr更适宜作为y关于x的回归方程类型,他求得的回归方程是0.30x210.17x68.07.经调查,该地11岁男童身高的中位数为145.3 cm.与(1)中的线性回归方程比较,哪个回归方程的拟合效果更好?附:回归方程x中的斜率和截距的最小二乘估计公式分别为:,.【

12、解】(1)6.8716.87,112.456.8715.574.66,所以y关于x的线性回归方程为6.87x74.66.(2)若回归方程为6.87x74.66,当x11时,150.23.若回归方程为0.30x210.17x68.07,当x11时,y143.64.|143.64145.3|1.66|150.23145.3|4.93,所以回归方程0.30x210.17x68.07对该地11岁男童身高中位数的拟合效果更好求回归直线方程的关键及实际应用(1)关键:正确理解计算,的公式和准确地计算(2)实际应用:在分析实际中两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系

13、,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值 命题角度二非线性回归分析 (2018潍坊模拟)某机构为研究某种图书每册的成本费y(单位:元)与印刷数量x(单位:千册)的关系,收集了一些数据并进行了初步处理,得到了下面的散点图及一些统计量的值 (xi)2 (xi)(yi) (ui)2 (ui)(yi)15.253.630.2692 085.5230.30.7877.049表中ui,ui.(1)根据散点图判断:yabx与yc哪一个模型更适合作为该图书每册的成本费y(单位:元)与印刷数量x(单位:千册)的回归方程?(只要求给出判断,不必说明理由)(2)根据(1)的判断结果及表中数据,建

14、立y关于x的回归方程(回归系数的结果精确到0.01);(3)若该图书每册的定价为10元,则至少应该印刷多少册才能使销售利润不低于78 840元?(假设能够全部售出结果精确到1)附:对于一组数据(w1,v1),(w2,v2),(wn,vn),其回归直线w的斜率和截距的最小二乘估计分别为,v.【解】(1)由散点图判断,yc更适合作为该图书每册的成本费y(单位:元)与印刷数量x(单位:千册)的回归方程(2)令u,先建立y关于u的线性回归方程,由于8.9578.96,所以3.638.9570.2691.22,所以y关于u的线性回归方程为1.228.96u,所以y关于x的回归方程为1.22.(3)假设印

15、刷x千册,依题意得10xx78.840,所以x10,所以至少印刷10 000册才能使销售利润不低于78 840元求非线性回归方程的步骤(1)确定变量,作出散点图(2)根据散点图,选择恰当的拟合函数 (3)变量置换,通过变量置换把非线性回归问题转化为线性回归问题,并求出线性回归方程(4)分析拟合效果:通过计算相关指数或画残差图来判断拟合效果(5)根据相应的变换,写出非线性回归方程命题角度三回归分析与正态分布的综合问题 (2018兰州模拟)某地一商场记录了12月份某5天当中某商品的销售量y(单位:kg)与该地当日最高气温x(单位:)的相关数据,如下表:x119852y7881012(1)试求y与x

16、的回归方程x;(2)判断y与x之间是正相关还是负相关;若该地12月某日的最高气温是6 ,试用所求回归方程预测这天该商品的销售量;(3)假定该地12月份的日最高气温XN(,2),其中近似取样本平均数,2近似取样本方差s2,试求P(3.8X13.4)附:参考公式和有关数据,3.2,1.8,若XN(,2),则P(X)0.682 7,且P(2X2)0.954 5.【解】(1)由题意,7,9,xiyin28757928,xn229557250,0.56,9(0.56)712.92.所以所求回归直线方程为0.56x12.92.(2)由0.560知,y与x负相关将x6代入回归方程可得,0.56612.929

17、.56,即可预测当日该商品的销售量为9.56 kg.(3)由(1)知7,3.2,所以P(3.8X13.4)P(X2)P(X)P(2X3.841.所以有95%的把握认为学生实践操作能力强弱与性别有关(2)的取值为0,1,2,3,4.P(0),P(1),P(2),P(3),P(4).所以的分布列为01234P所以E()012341.6.独立性检验的关键(1)根据22列联表准确计算K2,若22列联表没有列出来,要先列出此表(2)K2的观测值k越大,对应假设事件H0成立的概率越小,H0不成立的概率越大 对点训练(2018高考全国卷)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新

18、的生产方式为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人第一组工人用第一种生产方式,第二组工人用第二种生产方式根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:超过m不超过m第一种生产方式第二种生产方式(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:K2,P(K2k)0.0500.0100.001k3.8416.63510.828解:(1)第二种生产方式

19、的效率更高理由如下:(以下4种理由,任选其一)()由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟因此第二种生产方式的效率更高()由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟因此第二种生产方式的效率更高()由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟因此第二种生产方式的效率更高()由茎叶图可知:用第

20、一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少因此第二种生产方式的效率更高(2)由茎叶图知m80.列联表如下:超过m不超过m第一种生产方式155第二种生产方式515(3)由于K2106.635,所以有99%的把握认为两种生产方式的效率有差异一、选择题1某班对八校联考成绩进行分析,利用随机数法抽取样本时,先将60个同学按01,02

21、,03,60进行编号,然后从随机数表第9行第5列的数开始向右读,则选出的第6个个体是()(注:下表为随机数表的第8行和第9行)6301 6378 5916 9555 6719 9810 5071 7512 8673 5807 4439 5238 793321 1234 2978 6456 0782 5242 0744 3815 5100 1342 9966 0279 54A07B25C42D52解析:选D.依题意得,依次选出的个体分别是12,34,29,56,07,52,因此选出的第6个个体是52.2(2018高考全国卷)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番为更好地了

22、解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如图所示的饼图:则下面结论中不正确的是()A新农村建设后,种植收入减少B新农村建设后,其他收入增加了一倍以上C新农村建设后,养殖收入增加了一倍D新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半解析:选A.法一:设建设前经济收入为a,则建设后经济收入为2a,则由饼图可得建设前种植收入为0.6a,其他收入为0.04a,养殖收入为0.3a.建设后种植收入为0.74a,其他收入为0.1a,养殖收入为0.6a,养殖收入与第三产业收入的总和为1.16a,所以新农村建设后,种植收入减少是错误的故选A.法二:因

23、为0.6B,所以正确s(5378)2(6278)2(6478)2(7678)2(7478)2(7878)2(7878)2(7678)2(8178)2(8578)2(8678)2(8878)2(8278)2(9278)2(9578)2121.6,s(4566)2(4866)2(5166)2(5366)2(5666)2(6266)2(6466)2(6566)2(7366)2(7366)2(7466)2(7066)2(8366)2(8266)2(9166)2175.2.故ss,B班的方差大,则B班的标准差也大,正确,故选B.法二:由茎叶图可知,A班数学兴趣小组的平均成绩明显高于B班;A班的数学成绩较

24、稳定,大多在7090分,B班的数学成绩较分散,显然B班的方差、标准差较大,故选B.二、填空题7给出下列四个命题:某班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中另一位同学的编号为23;一组数据1,2,3,3,4,5的平均数、众数、中位数都相同;若一组数据a,0,1,2,3的平均数为1,则其标准差为2;根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为x,其中2,1,3,则1.其中真命题有_(填序号)解析:在中,由系统抽样知抽样的分段间隔为52413,故抽取的样本的编号分别为7号、20号、33号、46

25、号,故是假命题;在中,数据1,2,3,3,4,5的平均数为(123345)3,中位数为3,众数为3,都相同,故是真命题;在中,因为样本的平均数为1,所以a01235,解得a1,故样本的方差为(11)2(01)2(11)2(21)2(31)22,标准差为,故是假命题;在中,回归直线方程为x2,又回归直线过点(,),把(1,3)代入回归直线方程2,得1,故是真命题答案:8(2018长沙模拟)为了解某社区居民购买水果和牛奶的年支出费用与购买食品的年支出费用的关系,随机调查了该社区5户家庭,得到如下统计数据表:购买食品的年支出费用x/万元2.092.152.502.842.92购买水果和牛奶的年支出费

26、用y/万元1.251.301.501.701.75根据上表可得回归直线方程x,其中0.59,据此估计,该社区一户购买食品的年支出费用为3.00万元的家庭购买水果和牛奶的年支出费用约为_万元解析:2.50(万元),1.50(万元),其中0.59,0.025,0.59x0.025,故年支出费用为3.00万元的家庭购买水果和牛奶的年支出费用约为0.593.000.0251.795万元答案:1.7959某同学在高三学年的五次阶段性考试中,数学成绩依次为110,114,121,119,126,则这组数据的方差是_解析:因为对一组数据同时加上或减去同一个常数,方差不变,所以本题中可先对这5个数据同时减去1

27、10,得到新的数据分别为0,4,11,9,16,其平均数为8,根据方差公式可得s2(08)2(48)2(118)2(98)2(168)230.8.答案:30.8三、解答题10某校为了解高一学生周末的“阅读时间”,从高一年级中随机抽取了100名学生进行调查,获得了每人的周末“阅读时间”(单位:小时),按照0,0.5),0.5,1),4,4.5分成9组,制成样本的频率分布直方图如图所示:(1)求图中a的值;(2)估计该校高一学生周末“阅读时间”的中位数;(3)用样本频率代替概率现从全校高一年级随机抽取20名学生,其中有k名学生“阅读时间”在1,2.5)内的概率为P(Xk),其中k0,1,2,20.

28、当P(Xk)最大时,求k的值解:(1)由频率分布直方图可知,周末“阅读时间”在0,0.5)内的频率为0.080.50.04.同理,在0.5,1),1.5,2),2,2.5),3,3.5),3.5,4),4,4.5内的频率分别为0.08,0.20,0.25,0.07,0.04,0.02,所以1(0.040.080.200.250.070.040.02)0.5a0.5a,解得a0.30.(2)设该校高一学生周末“阅读时间”的中位数为m小时因为前5组的频率之和为0.040.080.150.200.250.720.5,而前4组的频率之和为0.040.080.150.200.470.5,所以2m1,则k

29、12.6,P(Xk1)P(Xk);若t12.6,P(Xk1)P(Xk)又1,所以当k12时,P(Xk)最大所以k的值为12.11(2018石家庄质量检测(二)随着网络的发展,网上购物越来越受到人们的喜爱,各大购物网站为增加收入,促销策略越来越多样化,促销费用也不断增加下表是某购物网站2017年18月促销费用(单位:万元)和产品销量(单位:万件)的具体数据月份12345678促销费用x2361013211518产品销量y11233.5544.5(1)根据数据可知y与x具有线性相关关系,请建立y关于x的回归方程x(系数精确到0.01);(2)已知6月份该购物网站为庆祝成立1周年,特制定奖励制度:以

30、z(单位:件)表示日销量,z1 800,2 000),则每位员工每日奖励100元;z2 000,2 100),则每位员工每日奖励150元;z2 100,),则每位员工每日奖励200元现已知该网站6月份日销量z服从正态分布N(0.2,0.000 1),请你计算某位员工当月奖励金额总数大约多少元(当月奖励金额总数精确到百分位)参考数据:xiyi338.5,x1 308,其中xi,yi分别为第i个月的促销费用和产品销量,i1,2,3,8.若随机变量z服从正态分布N(,2),则P(z)0.682 7,P(2z2.706,故有90%以上的把握认为“数学成绩优秀与教学改革有关”(2)从乙班70,80),80,90),90,100分数段中抽取的人数分别为2,3,2,依题意随机变量X的所有可能取值为0,1,2,3,P(X0),P(X1),P(X2),P(X3),其分布列如下表:X0123P所以E(X)0123.

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 高考资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com