BP第四十讲 抽样方法与总体分布的估计.doc

上传人:思*** 文档编号:769809 上传时间:2019-06-21 格式:DOC 页数:11 大小:500.06KB
返回 下载 相关 举报
BP第四十讲 抽样方法与总体分布的估计.doc_第1页
第1页 / 共11页
BP第四十讲 抽样方法与总体分布的估计.doc_第2页
第2页 / 共11页
点击查看更多>>
资源描述

《BP第四十讲 抽样方法与总体分布的估计.doc》由会员分享,可在线阅读,更多相关《BP第四十讲 抽样方法与总体分布的估计.doc(11页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、 高考数学一轮第四十讲 第 1 页共 11 页 第四十讲 抽样方法与总体分布的估计考点解读【基础性考点知识突破基础性考点知识突破】一、随机抽样1简单随机抽样:设一个总体的个数为如果通过逐个抽取的方法从中抽取一个N样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样实现简单随机抽样,常用抽签法和随机数法2抽签法:一般地,抽签法就是把总体中的个个体编号,把号码写在号签上,将N号签放在一个不透明的容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取次,就n得到一个容量为的样本,这种抽样方法称为抽签法n3随机数法:利用随机数表、随机数骰子或计算机产生随机数进行抽样的方法,叫做随机数法

2、【提示】简单随机抽样必须具备下列特点:(l)简单随机抽样要求被抽取的样本的总体个数是有限的N(2)简单随机抽样的样本数小于或等于样本总体个数nN(3)简单随机抽样的样本是从总体中逐个抽取的(4)简单随机抽样是一种不放回抽样(5)简单随机抽样的每个个体入样的可能性均为N二、系统抽样1定义:当总体中的个体数较多时,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取 1 个体,得到所需要的样本,这种抽样叫做系统抽样2由系统抽样的定义可知系统抽样有以下特征:(1)当总体容量较大时,采用系统抽样N(2)将总体分成均衡的若干部分指的是将总体分段,分段的间隔要求相等因此,系统抽样又称等距抽样

3、,分段的间隔一般为Nkn(3)预先制定的规则指的是在第一段内采用简单随机抽样确定一个起始编号,在此编号的基础上加上分段间隔的整数倍即为抽样编号(4)系统抽样是把一个问题划分成若干部分来分块解决,从而把复杂问题简单化,体现高考数学一轮第四十讲 第 2 页共 11 页 了数学中的转化思想三、分层抽样1定义:当已知总体由差异明显的几部分组成时,常将总体分成几部分,然后按照各部分所占的比例进行抽样,这种抽样叫做分层抽样2分层抽样又称类型抽样,应用分层抽榫时应遵循以下要求:(1)分层:将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则(2)分层抽样为保证每个个体等

4、可能入样,需遵循在各层中进行简单随机抽样或系统抽样,每层样本数量与每层个体数量的比与这层个体数量与总体容量的比相等二、用样本估计总体1用样本的频率分布估计总体的频率分布频率分布直方图的理解a纵轴表示,即小长方形的高=;频率 组距频率 组距b小长方形的面积=组距=频率;频率 组距c数据落在各小组内的频率用各小长方形的面积表示,各小长方形的面积总和等于1频率分布折线图和总体密度曲线a频率分布折线图:连接频率分布直方图中各小长方形上端的中点,即得频率分布折线图b总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率分布折线图会越来越接近于一条光滑曲线,即总体密度曲线茎叶图茎是指中

5、间的一列数,叶是从茎的旁边生长出来的数2用样本的数字特征估计总体的数字特征平均数、中位数、众数数字特征样本数据平均数样本数据的算术平均数高考数学一轮第四十讲 第 3 页共 11 页 中位数将数据按大小依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数)众数出现次数最多的数据样本方差与标准差设样本的元素为,样本的平均数为,则1x2xnxxa样本方差:;2222 121()()() nsxxxxxxnb样本标准差:222 121()()() nsxxxxxxn平均数、方差的有关性质a若,的平均数为,则,的平均数为1x2xnxx1mxa2mxanmxamxab若,的方差为,则,的方差为1x

6、2xnx2s1mxa2mxanmxa22m s【培优性方法技巧综合培优性方法技巧综合】一、抽样问题的求解1三种抽样方法的选择方法如果总体中个体之间的差异明显(如年龄、学段、性别、工种) ,并能据此将总体分为几层(几类、几部分) ,那么一般选择分层抽样方法;如果总体中个体数很多,无明显层次差异,希望被抽到的个体之间的间隔均等,那么选择系统抽样方法;如果总体中个体数不多,且希望被抽取的个体带有随机性、无固定间隔,那么可以考虑简单随机抽样2抽样方法中的计算问题的求法系统抽样中的计算问题,系统抽样中被抽取的两个样本编号的间距相等,据此,若有个总体,希望抽取个nm个体,确定抽样间距时,若为整数,则抽样间

7、距为;否则,一般先剔除几个个体,n mn m使得为整数,抽样间距一般为不大于的最大整数n mn m高考数学一轮第四十讲 第 4 页共 11 页 分层抽样中的计算问题分层抽样满足“” ,即“,或=每层中抽取的个体数量样本容量 本层的总个体数量总体数量11n N22n Nn N=” ,据此在已知每层间的个体数量或数量比、样本容量、总12:nnn12:NNN体数量中的两个时,就可以求出第三个3分层抽样在高考中的考查体现在计算上,解决此类问题的关键是:明白分层抽样是等概率抽样;每层中抽取的个体数与每层的总个体数之比都相等,都等于样本容量与总体数量的比值4分层抽样的一般步骤:第一,分层;第二,按比例确定

8、每层抽取个体的数量;第三,各层抽样(抽样的方法可以是简单随机抽样,也可以是系统抽样,且各层之间的抽样方法可以不一样) ;第四,汇合成样本5系统抽样在高考中的考查体现了对抽取后的样本编号的特征,解决此类问题的关键是:a.明白系统抽样也是等概率抽样;b.明白在系统抽样中,被抽取的样本是按照一定的规律抽取的,相邻的两个样本编号的间距相等6系统抽样的步骤:第一步,将总体中的个体随机编号;第二步,将编号分段;第三步,在第 1 段中用简单随机抽样确定起始的个体编号;第四步,按照事先确定的规则抽取样本7系统抽样最基本的特征是“等距性” ,每组内所抽取的号码需要依据第一组抽取的号码和组距来确定,每组抽取样本的

9、号码依次构成一个以第一组抽取的号码为首项,组m距为公差的等差数列,第组抽取的样本号码为dnak(1)kamkd二、利用样本频率分布估计总体分布1从频率分布直方图中得出有关数据的方法频率:频率分布直方图中横轴表示组别,纵轴表示,频率=组距;频率 组距频率 组距频率比:频率分布直方图中各小长方形的面积之和为 1,因为在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比,从而根据已知的几组数据个数比求有关值;众数:最高小长方形底边中点的横坐标;中位数:平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标;高考数学一轮第四十讲 第 5 页共 11 页 平均数:频率分布直方图中每个

10、小长方形的面积乘小长方形底边中点的横坐标之和;性质应用:若纵轴上存在参数值,则根据所有小长方形的高之和组距=1 列方程即可求得参数值,2茎叶图中数据得出的方法:茎叶图是统计中用来表示数据的一种图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数,对于样本数据较少,但较为集中的一组数据:若数据是两位整数,则将十位数字作茎,个位数字作叶;若数据是三位整数,则将百位、十位数字作茎,个位数字作叶样本数据为小数时做类似处理对于样本数据较少,但较为集中的两组数据,关键是找到两组数据共有的茎,用茎叶图刻画数据的优点是:a所有的信息都可以从茎叶图中得到b茎叶图便于记录和读取,能够展示数据的分布情况缺点是:当样

11、本数据较多或数据位数较多时,茎叶图就显得不太方便茎叶图通常用来记录两值数的数据,它可以用来分析单组数据,也可以对两组数据进行比较通过茎叶图可以确定数据的中位数,数据大致集中在哪个茎,是否关于该茎对称,是否分布均匀等3组距的选择应力求“取整” ,如果极差不利于分组(如不能被组数整除) ,可适当增大极差,如在左、右两端各增加适当范围(尽量使两端增加的量相同) 4频率分布表的优点是能够反映具体数据在各个不同区间的取值频率;缺点是不够直观、形象,对分析数据分布的总体态势不太方便5频率分布直方图的优点是能够直观地表明数据分布的形状,一般呈中间高、两端低、左右对称的“峰”状结构;缺点是从直方图本身得不到具

12、体的数据内容,也就是说,把数据表示成直方图后,原始数据不能在图中表示出来6频率分布折线图和总体密度曲线频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图频率分布折线图的优点是它可以表示数量的多少,直观地反映数量的增减情况,即变化趋势;缺点是它不适合总体分布较多的情况总体密度曲线:随着样本容量的增加,作图时所分的组数也在增加,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线高考数学一轮第四十讲 第 6 页共 11 页 7频率分布直方图与众数、中位数及平均数的关系最高的小长方形底边中点的横坐标即是众数;中位数左边和右边的小长方形的面积和是相

13、等的;平均数是频率分布直方图的“重心” ,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和三、用样本的数字特征估计总体用样本的数字特征估计总体的类型及解题方法类型 1:直接给出样本数据,根据平均数、中位数、众数、方差、标准差的概念进行相关计算得出相应数据类型 2:利用茎叶图给出样本数据,正确写出茎叶图中的所有数字,再根据平均数、中位数、众数、方差、标准差的概念进行相关计算1众数、中位数、平均数与标准差及方差的理解众数、中位数与平均数都是描述一组数据集中趋势的量,其中平均数与每一个样本数据都有关,任何一个数据的改变都会引起平均数的变化标准差与方差描述了一组数据与平均数的离散

14、程度,反映了一组数据相对于平均数的波动情况,标准差与方差越大,说明这组数据的波动性越大【提示】用样本的数字特征估计总体的数字特征时,样本容量越大,估计就越精确2刻画一组数据的“集中趋势”的数字特征:中位数、众数、平均数;刻画一组数据的“离散程度”的数字特征:极差、方差、标准差,平均数容易掩盖一些极端情况,使我们对总体作出片面的判断,但标准差较好地避免了极端情况,因此,将平均数和标准差结合,便可对总体作出较好的估计3用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似实际应用中,当所得数据平均数不相等时,需先分析平均水平,再计算标准差(方差)分析稳定情况4若给出图形,一方面可以由

15、图形得到相应的样本数据,再计算平均数、方差(标准差) ;另一方面,可以从图形直观分析样本数据的分布情况,大致判断平均数的范围,并利用数据的波动性大小反映方差(标准差)的大小考点分类精讲考点考点 1 抽样问题抽样问题高考数学一轮第四十讲 第 7 页共 11 页 1用简单随机抽样方法抽取样本2用系统抽样方法抽取样本3用分层抽样方法抽取样本4抽样方法的综合问题【例 1】在一次马拉松比赛中,35 名运动员的成绩(单位:分钟)的茎叶图如图所示若将运动员按成绩由好到差编为号,再用系统抽样方法从中抽取 7 人,则其中135:成绩在区间139,151上的运动员人数是 【解析】第一组( 130 ,130 ,13

16、3 ,134 ,135),第二组(136,136,138,138,138),第三组(139,141,141,141,142),第四组(142,142,143 ,143,144),第五组( 144 ,145 ,145 ,145 ,146),第六组(146,147,148,150,151),第七组( 152 ,152 ,153 ,153 ,153),故成绩在139,151上恰有 4 组,故有 4 人,选 B【例 2】已知某地区中小学生人数和近视情况分别如图 1 和图 2 所示,为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取 2的学生进行调查,则样本容量和抽取的高中生近视人数分别是A200

17、,20 B100,20 C200,10 D100,10【解析】所抽人数为,近视人数分别为小学生(350020004500) 2%200,初中生,高中生,3500 10%3504500 30%13502000 50%1000 抽取的高中生近视人数为选 A1000 2%20【例 3】某单位有 840 名职工, 现采用系统抽样方法, 抽取 42 人做问卷调查, 将 840 人按 1, 2, , 840 随机编号, 则抽取的 42 人中, 编号落入区间481, 720的人数为(A) 11(B) 12(C) 13(D) 14【解析】依据系统抽样为等距抽样的特点,分 42 组,每组 20 人,区间 481

18、,720包含 25组到 36 组,每组抽 1 人,则抽到的人数为 12.考点考点 2 利用样本频率分布估计总体分布利用样本频率分布估计总体分布高考数学一轮第四十讲 第 8 页共 11 页 1画出样本数据的频率分布直方图2利用样本频率分布估计总体分布3由样本的茎叶图估计总体分布【例 4】某电子商务公司对 10000 名网络购物者 2014 年度的消费情况进行统计,发现消费金额(单位:万元)都在区间内,其频率分布直方图如图所示0.3,0.9(1)直方图中的= a(2)在这些购物者中,消费金额在区间内的购物者的人数为 0.5,0.9【解析】(1),解得;(2)0.1 1.5 0.1 2.5 0.10

19、.1 2a+0.1 0.8 0.1 0.21+=3a =区间内的频率为,则该区间内购物者的人数为0.5,0.91 0.1 1.50.1 2.50.6-=10000 0.66000=【例 5】某公司为了解用户对其产品的满意度,从两地区分别随机调查了 40 个用户,,A B根据用户对产品的满意度评分,得分地区用户满意评分的频率分布直方图和地区AB用户满意度评分的频数分布表地区用户满意评分的频率分布直方图AB 地区用户满意度评分的频数分布表满意度评分分组50,60)60,70)70,80)80,90)90,100)频数2814106高考数学一轮第四十讲 第 9 页共 11 页 (1)作出 B 地区用

20、户满意度评分的频数分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可) ;B 地区用户满意度评分的频数分布直方图(2)根据用户满意度评分,将用户的满意度分为三个等级;满意度评分低于 70 分70 分到 80 分不低于 90 分满意度等级不满意满意非常满意估计哪个地区用户的满意度等级为不满意的概率大?说明理由【解析】(1)作出频率分布直方图如图所示B 地区用户满意度评分的频数分布直方图通过两地区用户满意度评分的频率分布直方图可以看出,B 地区用户满意度评分的平均值高于 A 地区用户满意度评分的平均值;B 地区用户满意度评分比较集中,而 A 地区用户满

21、意度评分比较分散(2)A 地区用户的满意度等级为不满意的概率大记表示事件:“A 地区用户的满意度等级为不满意” ;表示事件“B 地区用户的ACBC满意度等级为不满意” 由直方图得的估计值为,()AP C(0.01 0.02 0.03) 100.6+=高考数学一轮第四十讲 第 10 页共 11 页 的估计值为()BP C(0.005 0.02) 100.25+=所以 A 地区用户的满意度等级为不满意的概率大考点考点 3 用样本的数字特征估计总体用样本的数字特征估计总体1求样本数字特征(平均数、方差、众数、中位数等) 2用样本的数字特征估计总体【例 6】某市为了考核甲、乙两部门的工作情况,随机访问

22、了 50 位市民。根据这 50 位市民对这两个部门的评分(评分越高表明市民的评价越高) ,绘制茎叶图如下:4 9 7 9 7 6 6 5 3 3 2 1 1 0 9 8 8 7 7 7 6 6 5 5 5 5 5 4 4 4 3 3 3 2 1 0 0 6 6 5 5 2 0 0 6 3 2 2 2 0 0 0 00 1 1 4 5 61 2 3 3 4 50 0 1 1 3 4 4 90 1 1 2 3 4 6 8 81 2 2 4 5 6 6 7 7 7 8 90 4 4 85 9109876543乙 乙 乙乙 乙 乙(1)分别估计该市的市民对甲、乙部门评分的中位数;(2)分别估计该市的市

23、民对甲、乙部门的评分高于 90 的概率;(3)根据茎叶图分析该市的市民对甲、乙两部门的评价。【解析】(1)由所给茎叶图知,50 位市民对甲部门的评分由小到大排序,排在第 25,26 位的是 75,75,故样本中位数为 75,所以该市的市民对甲部门评分的中位数的估计值是7550 位市民对乙部门的评分由小到大排序,排在第 25,26 位的是 66,68,故样本中位数为,所以该市的市民对乙部门评分的中位数的估计值是 67.6668672(2)由所给茎叶图知,50 位市民对甲、乙部门的评分高于 90 的比率分别为,50.150,故该市的市民对甲、乙部门的评分高于 90 的概率的估计值分别为80.16500.1,0.16.(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差较高考数学一轮第四十讲 第 11 页共 11 页 大本专题试题训练详见试题精练

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 高中资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com