(最新)统计与统计案例.pdf

上传人:索**** 文档编号:83413420 上传时间:2023-03-30 格式:PDF 页数:102 大小:1.63MB
返回 下载 相关 举报
(最新)统计与统计案例.pdf_第1页
第1页 / 共102页
(最新)统计与统计案例.pdf_第2页
第2页 / 共102页
点击查看更多>>
资源描述

《(最新)统计与统计案例.pdf》由会员分享,可在线阅读,更多相关《(最新)统计与统计案例.pdf(102页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、第九章统计与统计案例第一节随机抽样考纲要求:1.理解随机抽样的必要性和重要性.2.会用简单随机抽样方法从总体中抽取样本.3.了解分层抽样和系统抽样方法基础真题体验 考查角度 抽样方法 1(2013课标全国卷)为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大在下面的抽样方法中,最合理的抽样方法是()A简单随机抽样B按性别分层抽样C按学段分层抽样D系统抽样【解析】由于三个学段学生的视力情况差别较大,故需按学段分层抽样【答案】C2(2014四川高考)在“世界读书日”前夕,为了了解

2、某地5 000 名居民某天的阅读时间,从中抽取了 200名居民的阅读时间进行统计分析在这个问题中,5 000 名居民的阅读时间的全体是()A总体B个体C样本的容量D从总体中抽取的一个样本【解析】调查的目的是“了解某地5 000 名居民某天的阅读时间”,所以“5 000 名居民的阅读时间的全体”是调查的总体【答案】A3(2014天津高考)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查,已知该校一年级、二年级、三年级、四年级的本科生人数之比为4556,则应从一年级本科生中抽取_ 名学生【解析】根据题意,应从一年级

3、本科生中抽取的人数为4455630060.【答案】60 命题规律预测 命题规律从近几年的高考试题看,对本节内容的考查主要体现在以下两点:1.主要考查随机抽样的方法及其计算2.题型以选择题和填空题为主,属于中低档题考向预测预测 2016 年高考将以分层抽样为切入点,结合实际生活背景,考查分层抽样的概念及相关计算.考向一 简单随机抽样 典例剖析【例 1】(2013江西高考)总体由编号为 01,02,19,20 的 20 个个体组成利用下面的随机数表选取 5 个个体,选取方法是从随机数表第1 行的第 5 列和第 6 列数字开始由左到右依次选取两个数字,则选出来的第5 个个体的编号为()7816657

4、208026314070243699728019832049234493582003623486969387481B07 C02 D01【思路点拨】读数比较与 20 的大小选数成样【解析】由随机数表法的随机抽样的过程可知选出的5 个个体是 08,02,14,07,01,所以第 5 个个体的编号是 01.【答案】D抽签法与随机数表法的适用情况:(1)抽签法适用于总体中个体数较少的情况,随机数表法适用于总体中个体数较多的情况(2)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀一般地,当总体容量和样本容量都较小时可用抽签法 对点练习 下列抽样方法是简单随机抽样的是()A从

5、 50 个零件中一次性抽取5 个做质量检验B从 50 个零件中有放回地抽取5 个做质量检验C从实数集中逐个抽取10 个正整数分析奇偶性D运动员从 8 个跑道中随机抽取一个跑道【解析】简单随机抽样是不放回、逐个、等可能的抽样,故D正确【答案】D考向二 系统抽样及其应用 典例剖析【例 2】(1)(2013 陕西高考)某单位有 840名职工,现采用系统抽样方法抽取42 人做问卷调查,将 840人按 1,2,840随机编号,则抽取的42人中,编号落入区间 481,720 的人数为()A11 B 12 C 13 D 14(2)采用系统抽样方法从960 人中抽取 32 人做问卷调查,为此将他们随机编号为1

6、,2,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的 32 人中,编号落入区间 1,450 的人做问卷A,编号落入区间 451,750 的人做问卷B,其余的人做问卷C,则抽到的人中,做问卷B的人数为()A7 B9 C10 D15【思路点拨】(1)结合系统抽样的方法及不等式解法求解(2)结合系统抽样及等差数列知识求解【解析】(1)抽样间隔为8404220.设在 1,2,20 中抽取号码x0(x01,20),在481,720 之间抽取的号码记为20kx0,则 48120kx0720,kN*.24120kx02036.x020120,1,k24,25,26,35,k值共有 352

7、4112(个),即所求人数为 12.(2)由系统抽样的特点知:抽取号码的间隔为9603230,抽取的号码依次为9,39,69,939.落入区间451,750 的有 459,489,729,这些数构成首项为459,公差为 30 的等差数列,设有n项,显然有 729459(n1)30,解得n10.所以做问卷B的有 10 人【答案】(1)B(2)C系统抽样的特点:(1)适用于元素个数很多且均衡的总体(2)各个个体被抽到的机会均等(3)总体分组后,在起始部分抽样时采用的是简单随机抽样(4)如果总体容量N能被样本容量n整除,则抽样间隔为kNn.提醒:如果总体容量N不能被样本容量n整除,可随机地从总体中剔

8、除余数,然后再按系统抽样的方法抽样 对点练习 高三(1)班共有 56 人,学号依次为 1,2,3,56,现用系统抽样的方法抽取一个容量为4 的样本已知学号为 6,34,48 的同学在样本中,那么还有一个同学的学号应为 ()A30 B25 C20 D15【解析】由题意可知,可将学号依次为1,2,3,56 的 56 名同学分成 4 组,每组 14人,抽取的样本中,若将他们的学号按从小到大的顺序排列,彼此之间会相差14,故还有一个同学的学号应为14620.【答案】C考向三 分层抽样及其应用 典例剖析【例 3】(2013湖南高考)某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120 件,80 件

9、,60 件为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽取了3 件,则n()A9 B10 C12 D13(2)(2014 湖北高考)甲、乙两套设备生产的同类型产品共4 800 件,采用分层抽样的方法从中抽取一个容量为 80 的样本进行质量检测若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为_件【思路点拨】利用“抽样比样本容量总体容量各层样本容量各层个体数量”求解(1)(2)【解析】(1)依题意得360n1208060,故n13.(2)设乙设备生产的产品总数为x件,则甲设备生产的产品总数为(4 800 x)件由分层抽样特点,

10、结合题意可得50804 800 x4 800,解得x1 800.【答案】(1)D(2)1 800与分层抽样有关问题的常见类型及解题策略:(1)确定抽样比可依据各层总数与样本数之比,确定抽样比(2)求某一层的样本数或总体个数可依据题意求出抽样比,再由某层总体个数(或样本数)确定该层的样本(或总体)数(3)求各层的样本数可依据题意,求出各层的抽样比,再求出各层样本数 对点练习 某校共有学生 2 000 名,各年级男、女生人数如下表已知在全校学生中随机抽取1 名,抽到二年级女生的概率是,现用分层抽样的方法在全校抽取64 名学生,则应在三年级抽取的学生人数为()一年级二年级三年级女生373xy男生37

11、7370z B18 C16 D12【解析】根据题意可知二年级女生的人数应为2 000380(人),故一年级共有人数750 人,二年级共有 750 人,这两个年级均应抽取647502 00024(人),则应在三年级抽取的学生人数为6424216(人)【答案】C误区分析 17 忽视“抽样比”相等导致分层抽样失误 典例剖析【典例】(2015洛阳模拟)交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员 96 人若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员

12、的总人数N为()A101 B808 C1 212 D2 012【解析】四个社区共抽取了12212543101人又由题意可知抽样比为1296,故1296101N,此处在求解时,因不理解“样本容量总体容量抽样比”致误解得N808.【答案】B【防范措施】1.对于分层抽样问题,其解决的关键是抓住“样本容量总体容量抽样比”建立等量关系2等可能性入样是所有简单随机抽样的大前提 对点练习 某工厂的一、二、三车间在12 月份共生产了3 600 双皮靴,在出厂前要检查这批产品的质量,决定采用分层抽样的方法进行抽取,若从一、二、三车间抽取的产品数分别为a、b、c,且a、b、c构成等差数列,则二车间生产的产品数为(

13、)A800 B1 000 C1 200 D 1 500【解析】设该厂的一、二、三车间生产的产品数分别为x,y,z,由题意可知xyzabc,又a,b,c成等差数列,所以2bac,即 2yxz.又xyz3 600,3y3 600,y1 200.【答案】C课堂达标训练1(2013湖南高考)某学校有男、女学生各500 名,为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100 名学生进行调查,则宜采用的抽样方法是()A抽签法B随机数法C系统抽样法D分层抽样法【解析】由于是调查男、女学生在学习兴趣与业余爱好方面是否存在差异,因此用分层抽样方法【答案】D2从 30 个个体中抽取

14、10 个样本,现给出某随机数表的第11 行到第 15 行(见下表),如果某人选取第 12 行的第 6 列和第 7 列中的数作为第一个数并且由此数向右读,则选取的前4 个的号码分别为()9264 4607 2021 3920 7766 3817 3256 16405858 7766 3170 0500 2593 0545 5370 78142889 6628 6757 8231 1589 0062 0047 38155131 8186 3709 4521 6665 5325 5383 27029055 7196 2172 3207 1114 1384 4359 4488A76,63,17,00

15、B16,00,02,30C17,00,02,25 D17,00,02,07【解析】在随机数表中,将处于0029 的号码选出,第一个数76 不合要求,第2 个 63 不合要求,满足要求的前4 个号码为 17,00,02,07.【答案】D3从 2 014名学生中选取 50 名组成参观团,若采用下面的方法选取:先用简单随机抽样法从2 014名学生中剔除 14 名学生,再用系统抽样法从剩下的2 000 名学生中选取 50 名学生则每人入选的概率()A不全相等B均不相等C都相等,且为251 007 D 都相等,且为140【解析】抽样过程中每个个体被抽取的机会均等,概率相等,故每人入选的概率为502 01

16、4251 007.故选 C.【答案】C4某学校高一、高二、高三年级的学生人数之比为334,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50 的样本,则应从高二年级抽取_名学生【解析】由分层抽样的特征可知,应从高二年级抽取3501015.【答案】15课时提升练(五十二)随机抽样一、选择题1(2014广东高考)为了解 1 000 名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为()A50 B40 C25 D20【解析】根据系统抽样的特点可知分段间隔为1 0004025,故选 C.【答案】C2(2014重庆高考)某中学有高中生3 500 人,初中生 1 500

17、 人为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70 人,则n为()A100 B150 C 200 D 250【解析】法一:由题意可得70n703 5001 500,解得n100,故选 A.法二:由题意,抽样比为703 500150,总体容量为 3 500 1 5005 000,故n5 000150100.【答案】A3(2014石家庄模拟)某学校在高三年级一班共有60 名学生,现采用系统抽样的方法从中抽取6名学生做“早餐与健康”的调查,为此将学生编号为1,2,60.选取的这 6 名学生的编号可能是()A1,2,3,4,5,6 B6,16,26,3

18、6,46,56C1,2,4,8,16,32 D3,9,13,27,36,54【解析】系统抽样是等间隔抽样【答案】B4某单位共有老、中、青职工430人,其中有青年职工160 人,中年职工人数是老年职工人数的2倍为了解职工身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32 人,则该样本中的老年职工人数为()A9 B18 C27 D36【解析】设该单位老年职工有x人,从中抽取y人则 1603x430?x90,即老年职工有 90 人,即90160y32?y18.【答案】B5将参加夏令营的600 名学生编号为:001,002,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的

19、号码为003.这 600名学生分住在三个营区,从001到 300在第营区,从 301到495在第营区,从496到 600 在第营区,则三个营区被抽中的人数依次为()A26,16,8 B25,17,8C25,16,9 D24,17,9【解析】由题意知,间隔k6005012,故抽到的个体编号为12k3(其中k0,1,2,3,49)令12k3300,解得k24.k0,1,2,24,共 25 个编号所以从营区抽取25人;令 30012k3495,解得 25k41k25,26,27,41,共 17 个编号所以从营区抽取17人;因此从第营区抽取5025178(人)【答案】B6某初级中学有学生270人,其中

20、一年级 108 人,二、三年级各 81 人,现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,270,使用系统抽样时,将学生统一随机编号为 1,2,270,并将整个编号依次分为10 段,如果抽得号码有下列四种情况:7,34,61,88,115,142,169,196,223,2505,9,100,107,111,121,180,195,200,26511,38,65,92,119,146,173,200,227,25430,57,84,111,138,165,192,219,246

21、,270关于上述样本的下列结论中,正确的是()A、都不能为系统抽样B、都不能为分层抽样C、都可能为系统抽样D、都可能为分层抽样【解析】因为为系统抽样,所以选项A不对;因为为分层抽样,所以选项B不对;因为不为系统抽样,所以选项C不对,故选 D.【答案】D二、填空题7(2014汉中模拟)用系统抽样法要从160名学生中抽取容量为20 的样本,将 160名学生随机地从 1160 编号,按编号顺序平均分成20 组(1 8 号,916号,153160 号),若第 16组抽出的号码为 126,则第 1 组中用抽签的方法确定的号码是_【解析】设第 1 组抽取的号码为b,则第n组抽取的号码为 8(n1)b,8(

22、161)b126,b6,故第 1 组抽取的号码为6.【答案】68某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40 种、10 种、30种、20 种,现从中抽取一个容量为20 的样本进行食品安全检验若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种类之和是_【解析】四类食品的每一种被抽到的概率为2010015,植物油类和果蔬类食品被抽到的种数之和为(1020)156.【答案】69某单位 200名职工的年龄分布情况如图9-1-1 所示,现要从中抽取40 名职工作样本,用系统抽样法将全体职工随机按1200 编号,并按编号顺序平均分为40 组(15 号,610 号,196

23、200号)若第 5 组抽出的号码为22,则第 8 组抽出的号码应是 _若用分层抽样方法,则40 岁以下年龄段应抽取 _人图 9-1-1【解析】由分组可知,抽号的间隔为5,又因为第 5 组抽出的号码为22,所以第 6 组抽出的号码为 27,第 7 组抽出的号码为32,第 8 组抽出的号码为 37.40 岁以下的年龄段的职工数为200100,则应抽取的人数为4020010020(人)【答案】37 20三、解答题10中央电视台为了解观众对中国好歌曲的意见,准备从502 名现场观众中抽取10%进行座谈,请用系统抽样的方法完成这一抽样【解】把 502 名观众平均分成50 组,由于 502 除以 50 的

24、商是 10,余数是 2,所以每组有 10 名观众,还剩 2 名观众,采用系统抽样的方法抽样的步骤如下:第一步,先用简单随机抽样的方法从502名观众中抽取 2 名观众,这 2 名观众不参加座谈;第二步,将剩下的500 名观众编号为 1,2,3,500,并均匀分成 50 段,每段含5005010 个个体;第三步,从第1 段即 1,2,10 这 10 个编号中,用简单随机抽样的方法抽取一个编号(比如l)作为起始编号;第四步,从l开始,再将编号为l10,l20,l30,l490的个体抽出,得到一个容量为50 的样本11某公司有一批专业技术人员,对他们进行年龄状况和接受教育程度(学历)的调查,其结果(人

25、数分布)如下表:学历35 岁以下3550 岁50岁以上本科803020研究生x20y(1)用分层抽样的方法在3550 岁年龄段的专业技术人员中抽取一个容量为5 的样本,将该样本看成一个总体,从中任取2 人,求至少有 1 人学历为研究生的概率;(2)在这个公司的专业技术人员中按年龄状况用分层抽样的方法抽取N个人,其中 35 岁以下 48 人,50 岁以上 10 人,再从这N个人中随机抽取 1 人,此人的年龄为50岁以上的概率为539,求x,y的值【解】(1)用分层抽样的方法在3550 岁年龄段的专业技术人员中抽取一个容量为5 的样本,设抽取学历为本科的人数为m,3050m5,解得m3.抽取的样本

26、中有研究生2 人,本科生 3 人,分别记作S1,S2;B1,B2,B3.从中任取 2 人的所有等可能基本事件共有10 个:(S1,B1),(S1,B2),(S1,B3),(S2,B1),(S2,B2),(S2,B3),(S1,S2),(B1,B2),(B1,B3),(B2,B3),其中至少有 1 人的学历为研究生的基本事件有7 个:(S1,B1),(S1,B2),(S1,B3),(S2,B1),(S2,B2),(S2,B3),(S1,S2)从中任取 2 人,至少有 1 人学历为研究生的概率为710.(2)由题意,得10N539,解得N78.3550 岁中被抽取的人数为78481020,4880

27、 x20501020y,解得x40,y5.即x,y的值分别为 40,5.12某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加其中一组 在参加活动的职工中,青年人占%,中年人占%,老年人占10%.登山组的职工占参加活动总人数的14,且该组中,青年人占50%,中年人占 40%,老年人占 10%.为了了解各组不同年龄层次的职工对本次活动的满意程度,现用分层抽样方法从参加活动的全体职工中抽取一个容量为200 的样本试确定:(1)游泳组中,青年人、中年人、老年人分别所占的比例;(2)游泳组中,青年人、中年人、老年人分别应抽取的人数【解】(1)设登山组人数为x,游泳组中青年人、中年

28、人、老年人各占比例分别为a、b、c,则有x40%3xb4x%,x10%3xc4x10%,解得b50%,c10%,则a40%,即游泳组中,青年人、中年人、老年人各占比例分别为40%、50%、10%.(2)游泳组中抽取的青年人数为2003440%60(人);抽取的中年人数为2003450%75(人);抽取的老年人数为2003410%15(人)第二节用样本估计总体考纲要求:1.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率分布折线图、茎叶图,理解它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的

29、解释.4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题 基础真题体验 考查角度 样本数据的数字特征 1(2012山东高考)在某次测量中得到的A样本数据如下:82,84,84,86,86,86,88,88,88,88.若B样本数据恰好是A样本数据每个都加2 后所得数据则A,B两样本的下列数字特征对应相同的是()A众数B平均数C中位数D标准差【解析】对样本中每个数据都加上一个非零常数时不改变样本的方差和标准差,众数、中位数、平均数都发生改变【答案】D考查角度 茎叶图2(2

30、013课标全国卷)为了比较两种治疗失眠症的药(分别称为 A药,B药)的疗效,随机地选取20 位患者服用 A药,20 位患者服用 B药,这 40 位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h)试验的观测结果如下:服用 A药的 20 位患者日平均增加的睡眠时间:06 35 23 服用 B药的 20 位患者日平均增加的睡眠时间:32 14 27(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好(2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好图 9-2-1【解】(1)设 A药观测数据的平均数为x,B药观测数据的平均数为y.由观测结果可得x120,y120.由

31、以上计算结果可得xy,因此可看出 A药的疗效更好(2)由观测结果可绘制茎叶图如图:从以上茎叶图可以看出,A药疗效的试验结果有710的叶集中在茎“2.”,“3.”上,而 B药疗效的试验结果有710的叶集中在茎“0.”,“1.”上,由此可看出A药的疗效更好考查角度 频率分布直方图 3(2014课标全国卷)从某企业生产的某种产品中抽取100 件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分75,85)85,95)95,105)105,115)115,125)组频数62638228(1)作出这些数据的频率分布直方图;(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用

32、该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定【解】(1)(2)质量指标值的样本平均数为x8090100110120 100.质量指标值的样本方差为s2(20)2(10)20102 202104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95 的产品所占比例的估计值为.由于该估计值小于,故不能认为该企业生产的这种产品符合“质量指标值不低于95 的产品至少要占全部产品 80%”的规定 命题规律预测 命题规律从近几年的高考试题看,对本节内容的考查体现在

33、以两个方面:1.频率分布直方图、茎叶图、平均数、方差是高考的热点2.题型以解答题为主,常以现实生活为背景与概率等知识结合命题,难度中等偏下考向预测预测 2016年高考将以生活中的实际为载体,考查学生借助统计图表、样本数据的数字特征及概率知识解决实际问题的能力.考向一 频率分布直方图及其应用 典例剖析【例 1】(2012广东高考)某校 100 名学生期中考试语文成绩的频率分布直方图如图9-2-2 所示,其中成绩分组区间是:50,60),60,70),70,80),80,90),90,100 图 9-2-2(1)求图中a的值;(2)根据频率分布直方图,估计这100 名学生语文成绩的平均分;(3)若

34、这 100 名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在 50,90)之外的人数.分数段50,60)60,70)70,80)80,90)xy11213445【思路点拨】(1)直方图中各个矩形的面积代表了频率,所以各个矩形面积之和为1,可求出a的值;(2)语文成绩的平均分采取每个小矩形的面积乘以矩形底边中点横坐标之和来求得;(3)先求出各段中语文成绩人数,再由比例求出各段中的数学成绩人数【解】(1)由频率分布直方图知:(2a 101,解得a.(2)由频率分布直方图知:这100 名学生语文成绩的平均分为5510651075108510951073

35、(分)(3)由频率分布直方图知:语文成绩在50,60),60,70),70,80),80,90)各分数段的人数依次为101005,1010040,1010030,10100 20.由题中给出的比例关系知数学成绩在上述各分数段的人数依次为5,401220,304340,205425.故数学成绩在 50,90)之外的人数为 100(5204025)10.对点练习(2014江苏高考)为了了解一片经济林的生长情况,随机抽测了其中 60株树木的底部周长(单位:cm),所得数据均在区间 80,130 上,其频率分布直方图如图9-2-3 所示,则在抽测的60 株树木中,有_株树木的底部周长小于100 cm.

36、图 9-2-3【解析】底部周长在 80,90)的频率为 10,底部周长在 90,100)的频率为 10,样本容量为 60,所以树木的底部周长小于100 cm的株数为 6024.【答案】24考向二 茎叶图的绘制及应用 典例剖析【例 2】某良种培育基地正在培育一种小麦新品种A,将其与原有的一个优良品种B进行对照试验两种小麦各种植了25 亩,所得亩产数据(单位:千克)如下:品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454品种B:363,371,

37、374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,416,422,430(1)完成数据的茎叶图(2)用茎叶图处理现有的数据,有什么优点(3)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出统计结论【思路点拨】由百位数和十位数作茎,以个位数作叶,画出茎叶图,并依据数据的集中程度分析品种A与B亩产量及其稳定性的差异【解】(1)如图所示:(2)由于每个品种的数据都只有25 个,样本不大,画茎叶图很方便;此时茎叶图不仅清晰、明了地展示了数据的分布情况,便于比较,没有任何信息损失,而

38、且还可以随时记录新的数据(3)通过观察茎叶图可以看出:品种A的亩产平均数(或均值)比品种B高;品种A的亩产标准差(或方差)比品种B大,故品种A的亩产稳定性较差茎叶图的制作及应用:(1)茎叶图的优点是保留了原始数据,便于记录及表示,能反映数据在各段上的分布情况(2)茎叶图不能直接反映总体的分布情况,这就需要通过茎叶图给出的数据求出数据的数字特征,进一步估计总体情况(3)制作茎叶图的一般方法是:将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大顺序由上到下列出 对点练习(2014岳阳模拟)甲、乙两位歌手在“中国好声音”选拔赛中,5 次得分情况如图 9-2-4 所

39、示记甲、乙两人的平均得分分别为x甲、x乙,则下列判断正确的是()图 9-2-4甲x乙,甲比乙成绩稳定甲x乙,乙比甲成绩稳定甲x乙,甲比乙成绩稳定甲x乙,乙比甲成绩稳定【解析】x甲7677889094585,x乙7588868893586,s2甲15(76 85)2(77 85)2(8885)2(9085)2(9485)2 52,s2乙15(75 86)2(88 86)2(8686)2(8886)2(9386)2.所以x甲x乙,s2甲s2乙,故乙比甲成绩稳定【答案】B考向三 数字特征的总体估计 典例剖析【例 3】(理)(1)(2014 陕西高考)设样本数据x1,x2,x10的均值和方差分别为1

40、和 4,若yixia(a为非零常数,i1,2,10),则y1,y2,y10的均值和方差分别为()A1a,4 B1a,4aC1,4 D1,4 a(2)(2012 安徽高考)甲、乙两人在一次射击比赛中各射靶5 次,两人成绩的条形统计图如图9-2-5所示,则()图 9-2-5A甲的成绩的平均数小于乙的成绩的平均数B甲的成绩的中位数等于乙的成绩的中位数C甲的成绩的方差小于乙的成绩的方差D甲的成绩的极差小于乙的成绩的极差【思路点拨】(1)由样本数据数字特征的性质求解;【解析】(1)x1x2x10101,yixia,所以y1,y2,y10的均值为 1a,方差不变仍为4.故选 A.(2)由条形统计图知:甲射

41、靶 5 次的成绩分别为:4,5,6,7,8;乙射靶 5 次的成绩分别为:5,5,5,6,9,所以x甲4567856;x乙5556956.所以x甲x乙故 A不正确甲的成绩的中位数为6,乙的成绩的中位数为5,故 B不正确s2甲15(4 6)2(5 6)2(66)2(7 6)2(8 6)2 15102,s2乙15(5 6)2(5 6)2(56)2(66)2(9 6)2 1512125,因为 2125,所以s2甲0,故 2007 年至 2013 年该地区农村居民家庭人均纯收入逐年增加,平均每年增加千元将 2015年的年份代号t9 代入(1)中的回归方程,得y9,故预测该地区 2015 年农村居民家庭人

42、均纯收入为千元考查角度 独立性检验 3(2010新课标高考)为调查某地区老人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了 500位老年人,结果如下:是否需要志愿者性别男女需要4030不需要160270(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;(2)能否有 99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关(3)根据(2)的结论,能否提供更好的调查方法来估计该地区老年人中,需要志愿者帮助的老年人的比例说明理由附:P(K2k)kK2nadbc2abcdacbd【解】(1)调查的 500 位老年人中有 70 位需要志愿者提供帮助,因此该地区老年人中,需要帮助

43、的老年人的比例的估算值为7050014%.(2)K25004027030160220030070430.由于,所以有99%的把握认为该地区的老年人是否需要帮助与性别有关(3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层,并且采用分层抽样方法比采用简单随机抽样方法更好 命题规律预测 命题规律从近几年的高考试题看,对本节内容的考查体现在以下几个方面:1.高考对本节的考查有加强的趋势以散点图、相关关系、线性回归方程为主,注重独立性检验在实际生活

44、中的应用,认识统计方案在决策中的作用2.试题既有客观题又有解答题,难度适中,属基础题考向预测预测 2016 年高考将以生活中的实例为载体,将统计、概率和独立性检验融合在一起,综合考查学生应用数据分析问题和解决问题的能力.考向一 相关关系的判断 典例剖析【例 1】(1)在下列各图中,两个变量具有相关关系的图是()图 9-3-1A(1)(2)B(1)(3)C(2)(4)D(2)(3)(2)(2014 石家庄模拟)对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是()图 9-3-2Ar2r40r3r1 B r4r20r1r3Cr4r20r3r1 D r2r40r1r3【思路点拨】结合

45、散点图及相关系数的概念对(1)(2)题分别作出解答【解析】(1)由散点图可知图(1)是函数关系,图(2)(3)是相关关系,图(4)两个变量无相关关系(2)由相关关系的定义,以及散点图所表达的含义可知r2r40r3r1,故选 A.【答案】(1)D(2)A1相关关系的判断方法:一是利用散点图直观判断,二是利用相关系数作出判断2对于由散点图作出相关性判断时,若散点图呈带状且区域较窄,说明两个变量有一定的线性相关性,若呈曲线型也是有相关性 对点练习 下列两个变量之间的关系是相关关系的是()A速度一定时,位移与时间B单位面积的产量为常数时,土地面积与总产量C身高与体重D电压一定时,电流与电阻【解析】C是

46、相关关系,A、B、D都是函数关系【答案】C考向二 线性回归分析 典例剖析【例 2】(2013重庆高考)从某居民区随机抽取10 个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得i110 xi80,i110yi20,i110 xiyi184,i1100 x2i720.(1)求家庭的月储蓄y对月收入x的线性回归方程ybxa;(2)判断变量x与y之间是正相关还是负相关;(3)若该居民区某家庭月收入为7 千元,预测该家庭的月储蓄附:线性回归方程ybxa中,bi 1nxiyin x yi1nx2in x2,ayb x,其中x,y为样本平均值,线性回归方程也可写为y

47、bxa.【思路点拨】(1)根据已知数据求回归系数,再求出线性回归方程(2)根据回归方程判断(3)利用回归方程进行预测分析【解】(1)由题意知n10,x1ni1nxi80108,y1ni 1nyi20102,又lxxi 1nx2in x2720108280,lxyi 1nxiyin x y184108224,由此得blxylxx2480,ayb x28.故所求线性回归方程为y.(2)由于变量y的值随x值的增加而增加(b0),故x与y之间是正相关(3)将x7 代入回归方程可以预测该家庭的月储蓄为y7(千元)求线性回归方程的步骤:对点练习(2014长沙模拟)下表提供了某厂节能降耗技术改造后生产甲产品

48、过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.x3456y34(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程ybxa;(3)已知该厂技改前100 吨甲产品的生产能耗为90 吨标准煤试根据(2)求出的线性回归方程,预测生产 100吨甲产品的生产能耗比技改前降低多少吨标准煤(参考数值:343546【解】(1)由题设所给数据,可得散点图如下图(2)由对照数据,计算得4i 1x2i86,x34564,y错误!,已知4i 1xiyi,所以,由最小二乘法确定的回归方程的系数为b4i1xiyi4xy4i1x2i4x2错误!.aybx.

49、因此,所求的线性回归方程为y.(3)由(2)的回归方程及技改前生产100 吨甲产品的生产能耗,得降低的生产能耗为90100吨标准煤考向三 独立性检验 典例剖析【例 3】(2014安徽高考)某高校共有学生15 000 人,其中男生 10 500 人,女生 4 500 人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时)图 9-3-3(1)应收集多少位女生的样本数据(2)根据这 300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图 9-3-3 所示),其中样本数据的分组区间为:0,2,(2,4,(4,6,(6

50、,8,(8,10,(10,12,估计该校学生每周平均体育运动时间超过4 小时的概率(3)在样本数据中,有60 位女生的每周平均体育运动时间超过4 小时,请完成每周平均体育运动时间与性别列联表,并判断在犯错误不超过的前提下,能否认为“该校学生的每周平均体育运动时间与性别有关”.P(K2k0)k0附:K2nadbc2abcdacbd.【思路点拨】(1)根据抽样比计算分层抽样中应抽取的人数;(2)利用对立事件或互斥事件的概率公式求运动时间超过4 小时的概率;(3)根据K2的计算公式求解【解】(1)300 4 50015 00090,所以应收集 90 位女生的样本数据(2)由频率分布直方图得12,所以

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 高考资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com