统计学第六章抽样调查课件.pptx

上传人:石*** 文档编号:49856897 上传时间:2022-10-11 格式:PPTX 页数:75 大小:3.09MB
返回 下载 相关 举报
统计学第六章抽样调查课件.pptx_第1页
第1页 / 共75页
统计学第六章抽样调查课件.pptx_第2页
第2页 / 共75页
点击查看更多>>
资源描述

《统计学第六章抽样调查课件.pptx》由会员分享,可在线阅读,更多相关《统计学第六章抽样调查课件.pptx(75页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、统计学第六章抽样调查第1页,此课件共75页哦思考问题在对统计推断中,需要使用样本推断总体:(1)采用什么样的方式组织抽样?(2)采用什么样的方法进行抽样?(3)总体、样本和抽样分布的特征如何?(4)运用什么统计量对抽样误差进行检验?(5)如何对样本、总体特征的进行估计?第2页,此课件共75页哦 第六章第六章 抽样调查抽样调查第一节第一节 抽样调查的意义抽样调查的意义第二节第二节 抽样调查的基本概念及理论依据抽样调查的基本概念及理论依据第三节第三节 抽样平均误差抽样平均误差第四节第四节 全及指标的推断全及指标的推断第五节第五节 抽样方案设计抽样方案设计第六节第六节 必要抽样单位数的确定必要抽样单

2、位数的确定第七节第七节 假设检验假设检验第3页,此课件共75页哦一、抽样调查的概念一、抽样调查的概念 从研究总体中按一定的原则抽取部分单位作为样本进行从研究总体中按一定的原则抽取部分单位作为样本进行观察研究,以认识总体的一种统计调查方法,分为随机和非观察研究,以认识总体的一种统计调查方法,分为随机和非随机抽样。这里主要指随机抽样。这里主要指随机抽样随机抽样。指样本单位的抽取不受主观因素及其他指样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体单位都有系统性因素的影响,每个总体单位都有均等的被抽中机会均等的被抽中机会按照按照随机原则随机原则 从调查对象中抽取一部分单位进行观察,从调查对象

3、中抽取一部分单位进行观察,并运用数理统计的原理,以被抽取的那部分单位的数量并运用数理统计的原理,以被抽取的那部分单位的数量特征为代表,对总体做出数量上的推断分析特征为代表,对总体做出数量上的推断分析第4页,此课件共75页哦q抽样调查抽样调查的目的目的是的是由部分推断整体由部分推断整体q抽选部分单位时遵循抽选部分单位时遵循随机原则随机原则q抽样调查会产生抽样调查会产生抽样误差抽样误差,抽样误差,抽样误差可以计算,并可以加以控制可以计算,并可以加以控制二、抽样调查的特点二、抽样调查的特点第5页,此课件共75页哦三、抽样调查的适用范围三、抽样调查的适用范围q有些事物在测量或试验时有破坏性,有些事物在

4、测量或试验时有破坏性,不可以进行全不可以进行全面调查面调查q可以进行全面调查,但可以进行全面调查,但实际上不可行实际上不可行q和全面调查相比,抽样调查能和全面调查相比,抽样调查能节省人力、费用节省人力、费用和时间,而且比较灵活和时间,而且比较灵活q有些情况下,有些情况下,抽样调查结果比全面调查准确抽样调查结果比全面调查准确q用抽样调查的资料用抽样调查的资料修正和补充全面调查资料修正和补充全面调查资料q利用抽样推断方法,可以利用抽样推断方法,可以对某种总体的假设进行对某种总体的假设进行检验检验,判断这种假设的真伪,决定取舍。,判断这种假设的真伪,决定取舍。第6页,此课件共75页哦第二节第二节 抽

5、样调查的基本概念及理论依据抽样调查的基本概念及理论依据几组基几组基本概念本概念全及总体全及总体(总体总体)抽样总体抽样总体(样本样本)重复抽样重复抽样不重复抽样不重复抽样大数定律大数定律中心极限定理中心极限定理研究对象研究对象抽抽取取方方法法研研究究原原理理总体分布总体分布样本分布样本分布抽样分布抽样分布重复考虑顺序重复考虑顺序不重复不考虑不重复不考虑顺序顺序第7页,此课件共75页哦一、全及总体和抽样总体一、全及总体和抽样总体全及总体:全及总体:也称总体。指所要认识对象的全体。也称总体。指所要认识对象的全体。用用N N表示有限总体的单位数,称表示有限总体的单位数,称总体容量总体容量。全全及及总

6、总体体变量总体变量总体属性总体属性总体(品质标志)(品质标志)无限总体无限总体有限总体有限总体全及总体类型全及总体类型(数量标志)(数量标志)第8页,此课件共75页哦抽样总体:抽样总体:也称样本。从全及总体中随机抽取出也称样本。从全及总体中随机抽取出来,代表全及总体部分单位的集合体来,代表全及总体部分单位的集合体用用n n表示抽样总体的单位数表示抽样总体的单位数n30n30,为大样本;,为大样本;n30 nn-时,随机变量的总和时,随机变量的总和x xi i趋于均值为趋于均值为nx,nx,方差为方差为n n2 2的正态分布,即的正态分布,即 独立同分布中心极限定理对于独立同分布中心极限定理对于

7、抽样调查抽样调查的意义:的意义:从从理论上解释了理论上解释了样本与总体之间的分布特征关样本与总体之间的分布特征关系,即随着抽样单位数系,即随着抽样单位数n n的增加,的增加,趋于正态分趋于正态分布布。第20页,此课件共75页哦总体分布总体分布1 14 42 23 30 00.10.10.20.2【例例】设设一一个个总总体体,含含有有4 4个个元元素素(个个体体),即即总总体体单单位位数数N N=4=4。4 4 个个体分别为个个体分别为X X1 1=1=1、X X2 2=2=2、X X3 3=3=3、X X4 4=4=4。总体分布、样本分布和抽样分布关系:总体分布、样本分布和抽样分布关系:现从总

8、体中抽取一个容量为现从总体中抽取一个容量为n n3 3的样本的样本X X1 1=1,=1,X X2 2=2=2,X,X2 2=2=2样本分布样本分布1 14 42 23 30 00.30.30.60.64个数的相对频数分别都为0.251和2的相对频数分别为0.33和0.67第21页,此课件共75页哦 现现从从总总体体中中抽抽取取n n2 2的的简简单单随随机机样样本本,考考虑虑顺顺数数重重复复抽样,共有抽样,共有4 42 2=16=16个样本。所有样本的结果如下:个样本。所有样本的结果如下:3,43,43,33,33,23,23,13,13 32,42,42,32,32,22,22,12,12

9、 24,44,44,34,34,24,24,14,14 41,41,44 41,31,33 32 21 11,21,21,11,11 1第二个观察值第二个观察值第一个第一个观察值观察值所有可能所有可能n n=2 =2 的样本(的样本(1616个)个)3.53.53.03.02.52.52.02.03 33.03.02.52.52.02.01.51.52 24.04.03.53.53.03.02.52.54 42.52.54 42.02.03 32 21 11.51.51.01.01 1第二个观察值第二个观察值第一个第一个观察值观察值1616个样本的均值个样本的均值样本均值的抽样分布1.000.

10、10.20.3P(x)1.53.04.03.52.02.5x统计量为均值统计量为均值相对频数相对频数第22页,此课件共75页哦(2 2)德莫佛)德莫佛-拉普拉斯中心极限定理:拉普拉斯中心极限定理:设设X X是是n n次独立随机试验中事件次独立随机试验中事件A A发生发生(成功成功)的次数,的次数,p p是事件是事件A A在每次试验中发生的概率,则在每次试验中发生的概率,则X X服从二项分布服从二项分布B(n,p),B(n,p),当当n-n-时时,X X趋于均值为趋于均值为npnp,方差为,方差为npqnpq的正态分布,即的正态分布,即 独立同分布中心极限定理对于独立同分布中心极限定理对于抽样调

11、查抽样调查的意义:的意义:为概率估计提供了极为有效的条件为概率估计提供了极为有效的条件第23页,此课件共75页哦 中心极限定理研究的是变量和的分布和变量平中心极限定理研究的是变量和的分布和变量平均数的分布。它论证了以下几点:均数的分布。它论证了以下几点:第一,如果第一,如果总体很大总体很大,而且,而且服从正态分布服从正态分布,则样本,则样本均值均值的分布也服从正态分布;的分布也服从正态分布;第二,如果第二,如果总体很大总体很大,但,但不服从正态分布不服从正态分布,只要,只要样样本单位数足够大本单位数足够大(n30),样本均值的分布也趋近),样本均值的分布也趋近于正态分布。于正态分布。第三,样本

12、均值分布的平均数,等于总体均值第三,样本均值分布的平均数,等于总体均值 第四,样本均值方差等于总体方差的第四,样本均值方差等于总体方差的1/n1/n中心极限定理的重要意义第24页,此课件共75页哦抽抽样样误误差差样本均值样本均值样本成数样本成数重复抽样重复抽样第三节第三节 抽样平均误差抽样平均误差不重复抽样不重复抽样重复抽样重复抽样不重复抽样不重复抽样第25页,此课件共75页哦一、抽样误差的概念一、抽样误差的概念样本指标与总体指标之间的差别样本指标与总体指标之间的差别统统计计误误差差登记误差登记误差代表性误差代表性误差随机误差随机误差偏差偏差(不遵守随机性不遵守随机性)抽样平均误差抽样平均误差

13、实际误差实际误差根据随机性原则,用部根据随机性原则,用部分推断总体而引起的误分推断总体而引起的误差,可控制,不可避免。差,可控制,不可避免。第26页,此课件共75页哦(一)抽样平均数的抽样平均误差(一)抽样平均数的抽样平均误差抽样平均误差抽样平均误差 一系列抽样指标的标准差一系列抽样指标的标准差()全及平均指标全及平均指标全部可能样本个数全部可能样本个数抽样平均指标抽样平均指标说明:说明:实际应用中,该公式中实际应用中,该公式中全部可能样本个数全部可能样本个数与与全全及平均数及平均数都是不可能已知的,故该公式都是不可能已知的,故该公式无法用于计算无法用于计算二、抽样误差的计算二、抽样误差的计算

14、第27页,此课件共75页哦均值抽均值抽样误差样误差重复抽样重复抽样不重复抽样不重复抽样(1 1)总体单位之间总体单位之间的变异程度的变异程度(即标准差的大小即标准差的大小)。标准差越大,。标准差越大,抽样误差越大;抽样误差越大;(2 2)样本量大小样本量大小。样本量越大,抽样误差越小;。样本量越大,抽样误差越小;(3 3)抽样抽取方式抽样抽取方式。不重复抽样的抽样误差比重复抽样的抽样误。不重复抽样的抽样误差比重复抽样的抽样误差小;差小;(4 4)抽样组织形式抽样组织形式。对相同的。对相同的n n,类型抽样和等距抽样小于简单随机,类型抽样和等距抽样小于简单随机抽样,单个抽样小于整群抽样。抽样,单

15、个抽样小于整群抽样。影响因素影响因素第28页,此课件共75页哦实例分析实例分析:设有四个工人月产量分别为设有四个工人月产量分别为4040、5050、7070、8080元,现在随机从其中抽取元,现在随机从其中抽取2 2人,并求平均加工零件数,用以代表人,并求平均加工零件数,用以代表4 4人总体的平均产量水平,采用人总体的平均产量水平,采用考虑顺序重复考虑顺序重复抽样抽样,所有可能样本以及平均产量如下表:,所有可能样本以及平均产量如下表:序号序号样本变量样本变量 样本平均数样本平均数离差离差离差平方离差平方123440,4040,5040,7040,8040455560-20-15-5040022

16、5250567850,4050,5050,7050,8045506065-15-1005225100025910111270,4070,5070,7070,8055607075-5010152501002251314151680,4080,5080,7080,8060657580051520025225400合计合计-96002000第29页,此课件共75页哦序号序号产量产量(X)(X)产量离差产量离差离差平方离差平方1 12 23 34 44040505070708080-20-20-10-1010102020400400100100100100400400合计合计240240-100010

17、00产量总体的全及指标方差计算表产量总体的全及指标方差计算表结论:结论:抽样平均数的平均数等于全及平均数,抽样平均数的平均数等于全及平均数,抽样平均误差,即抽样平均数的标准差等于总体抽样平均误差,即抽样平均数的标准差等于总体标准差的标准差的可通过调整样本单位数来控制抽样平均误差。可通过调整样本单位数来控制抽样平均误差。第30页,此课件共75页哦实例分析实例分析:设有四个工人月产量分别为设有四个工人月产量分别为4040、5050、7070、8080元,随机从其中抽取元,随机从其中抽取2 2人,人,求平均加工零件数,以代表求平均加工零件数,以代表4 4人总体的平均产量水平,采用人总体的平均产量水平

18、,采用考虑顺序的不重复考虑顺序的不重复抽样抽样,则所有可能样本以及平均产量如下表:,则所有可能样本以及平均产量如下表:序号序号样本变量样本变量 样本平均数样本平均数离差离差离差平方离差平方12340,5040,7040,80455560-15-5022525045650,4050,7050,80456065-150522502578970,4070,5070,80556075-501525022510111280,4080,5080,706065750515025225合计合计-720-1000第31页,此课件共75页哦序号序号产量产量(X)(X)产量离差产量离差离差平方离差平方1 12 23

19、 34 44040505070708080-20-20-10-1010102020400400100100100100400400合计合计240240-10001000产量总体的全及指标方差计算表产量总体的全及指标方差计算表结论:不重复抽样的抽样平均误差结论:不重复抽样的抽样平均误差(9.13(9.13件件)小于小于重复抽样的抽样平均误差重复抽样的抽样平均误差(11.18(11.18件件)第32页,此课件共75页哦 现现从从总总体体中中抽抽取取n n2 2的的简简单单随随机机样样本本,考考虑虑顺顺数数重重复复抽样,共有抽样,共有4 42 2=16=16个样本。所有样本的结果如下:个样本。所有样

20、本的结果如下:3,43,43,33,33,23,23,13,13 32,42,42,32,32,22,22,12,12 24,44,44,34,34,24,24,14,14 41,41,44 41,31,33 32 21 11,21,21,11,11 1第二个观察值第二个观察值第一个第一个观察值观察值所有可能所有可能n n=2 =2 的样本(的样本(1616个)个)3.53.53.03.02.52.52.02.03 33.03.02.52.52.02.01.51.52 24.04.03.53.53.03.02.52.54 42.52.54 42.02.03 32 21 11.51.51.01.

21、01 1第二个观察值第二个观察值第一个第一个观察值观察值1616个样本的均值个样本的均值样本均值的抽样分布1.000.10.20.3P(x)1.53.04.03.52.02.5x统计量为均值统计量为均值相对频数相对频数第33页,此课件共75页哦 中心极限定理研究的是变量和的分布和变量平中心极限定理研究的是变量和的分布和变量平均数的分布。它论证了以下几点:均数的分布。它论证了以下几点:第一,如果第一,如果总体很大总体很大,而且,而且服从正态分布服从正态分布,则样本,则样本均值均值的分布也服从正态分布;的分布也服从正态分布;第二,如果第二,如果总体很大总体很大,但,但不服从正态分布不服从正态分布,

22、只要,只要样本样本单位数足够大单位数足够大(n30),样本均值的分布也趋近),样本均值的分布也趋近于正态分布。于正态分布。第三,样本均值分布的平均数,等于总体均值第三,样本均值分布的平均数,等于总体均值 第四,样本均值方差等于总体均值的第四,样本均值方差等于总体均值的1/n1/n中心极限定理的重要意义第34页,此课件共75页哦(二)抽样成数的抽样平均误差(二)抽样成数的抽样平均误差分组分组单位数单位数变量值变量值具有某一属性具有某一属性不具有某一属性不具有某一属性N N1 1N N0 01 10 0合计合计N N为研究是非标志总体的数量特征,令为研究是非标志总体的数量特征,令总体中全部单位只具

23、有总体中全部单位只具有“是是”或或“否否”、“有有”或或“无无”两种表现形式的标志,两种表现形式的标志,又叫又叫是非标志是非标志。交替标志交替标志1、数量化标志值、数量化标志值第35页,此课件共75页哦具有某种属性的具有某种属性的单位数所占比重单位数所占比重不具有某种属性的不具有某种属性的单位数所占比重单位数所占比重是非标志总体中具有某种表现或不具有是非标志总体中具有某种表现或不具有某种表现的某种表现的单位数占全部总体单位总数单位数占全部总体单位总数的的比重比重比重比重(权数权数)2、计算指标比重、计算指标比重第36页,此课件共75页哦【例例】某厂去年生产的产品中,合格率为某厂去年生产的产品中

24、,合格率为p,计算该厂产品,计算该厂产品的平均合格率。的平均合格率。交替标交替标志志xi单位数单位数(成数成数)(%)(%)变量变量x x成数成数xfxf离差离差离差离差平方平方离差平方离差平方乘权数乘权数合格品合格品不合格品不合格品1 10 0P Pq q合计合计-P+q=1P+q=1p pP P0 01-P1-P0-p0-p(1-P)(1-P)2 2(0-p)(0-p)2 2(1-P)(1-P)2 2p p (0-p)(0-p)2 2q qq q2 2p+pp+p2 2q=pqq=pq权值为比重权值为比重P的加权算的加权算术平均数术平均数第37页,此课件共75页哦(二)抽样成数的抽样平均误

25、差(二)抽样成数的抽样平均误差说明:说明:实际应用中,实际应用中,平均数和成数的标准差平均数和成数的标准差一般是未知的,一般是未知的,通常采用如下方式解决通常采用如下方式解决(1 1)用过去调查的资料)用过去调查的资料(2 2)样本方差的资料代替总体方差样本方差的资料代替总体方差(3 3)用小规模调查资料)用小规模调查资料(4 4)用估计材料)用估计材料重复抽样:重复抽样:不重复抽样:不重复抽样:第38页,此课件共75页哦【例例】某灯泡厂对某灯泡厂对1000010000个产品进行寿命检测,随机抽取个产品进行寿命检测,随机抽取2%2%样本进行测试,样本进行测试,资料如下。按质量规定,灯泡使用寿命

26、在资料如下。按质量规定,灯泡使用寿命在10001000小时小时以上者为合格品,计算以上者为合格品,计算这批灯泡的这批灯泡的时间抽样平均误差时间抽样平均误差和和合格率的平均抽样误差合格率的平均抽样误差。使用时间使用时间(小时小时)灯泡数灯泡数fi组中值组中值xixifi900900以下以下90095090095095010009501000100010501000105010501100105011001100115011001150115012001150120012001200以上以上2 24 411117171848418187 73 3合计合计200200-875 875 925 925

27、 975 975 1025 1025 1075 1075 1125 1125 1175 1175 1225 1225 1750 1750 3700 3700 10725 10725 72775 72775 90300 90300 20250 20250 8225 8225 3675 3675 66248 66248 69696 69696 73964 73964 72704 72704 27216 27216 83232 83232 97468 97468 84672 84672 211400211400575200575200-182-182-132-132-82-82-32-32 18 1

28、8 68 68 118 118 168168结论:不重复抽样的抽样平均误差小于重复抽样结论:不重复抽样的抽样平均误差小于重复抽样的抽样平均误差的抽样平均误差.第39页,此课件共75页哦【例例】某灯泡厂对某灯泡厂对1000010000个产品进行寿命检测,随机抽取个产品进行寿命检测,随机抽取2%2%样本进行测样本进行测试,资料如下。按质量规定,灯泡使用寿命在试,资料如下。按质量规定,灯泡使用寿命在10001000小时小时以上者为合格品,以上者为合格品,计算这批灯泡的计算这批灯泡的时间抽样平均误差时间抽样平均误差和和合格率的平均抽样误差合格率的平均抽样误差。使用时间使用时间(小时小时)灯泡数灯泡数f

29、i组中值组中值xixifi900900以下以下90095090095095010009501000100010501000105010501100105011001100115011001150115012001150120012001200以上以上2 24 411117171848418187 73 3合计合计200200-875 875 925 925 975 975 1025 1025 1075 1075 1125 1125 1175 1175 1225 1225 1750 1750 3700 3700 10725 10725 72775 72775 90300 90300 20250

30、20250 8225 8225 3675 3675 66248 66248 69696 69696 73964 73964 72704 72704 27216 27216 83232 83232 97468 97468 84672 84672 211400211400575200575200-182-182-132-132-82-82-32-32 18 18 68 68 118 118 168168第40页,此课件共75页哦抽抽样样误误差差样本平均值样本平均值抽样平均误差计算过程抽样平均误差计算过程样本标准差样本标准差样本标准差样本标准差代替总体标准差代替总体标准差样本均值样本均值样本成数样本

31、成数重复抽样重复抽样不重复抽样不重复抽样重复抽样重复抽样不重复抽样不重复抽样第41页,此课件共75页哦抽抽样样误误差差样本平均值样本平均值区区间间估估计计计计算算过过程程样本标准差样本标准差样本标准差样本标准差代替总体标准差代替总体标准差样本均值样本均值样本成数样本成数重复抽样重复抽样不重复抽样不重复抽样重复抽样重复抽样不重复抽样不重复抽样极限误差极限误差总体均值区间估计总体均值区间估计第42页,此课件共75页哦第四节第四节 全及指标的推断全及指标的推断抽样推断按已经抽定的按已经抽定的样本指标样本指标(样本平均样本平均数或样本成数数或样本成数)来来估计总体指标估计总体指标(总体平均数或总体成数

32、总体平均数或总体成数),或,或其其所在的范围所在的范围估计量的优良性准则估计量的优良性准则无偏性无偏性有效性有效性一致性一致性一、抽样推断的要求一、抽样推断的要求第43页,此课件共75页哦一、抽样推断的方法一、抽样推断的方法点估计把把样本平均数样本平均数或或样本成数样本成数直接作为直接作为总体平均数总体平均数或或总体成数总体成数的的估计值估计值简单,具体明确简单,具体明确优点优点缺点缺点无法控制误差,仅适用于对推断的准确程无法控制误差,仅适用于对推断的准确程度与可靠程度要求不高的情况度与可靠程度要求不高的情况1 1、直接换算法、直接换算法【例例】某大学在校的某大学在校的60006000名大学生

33、,对其实际月消费支出调查,结果名大学生,对其实际月消费支出调查,结果表明,该表明,该60006000名大学生的平均消费支出为名大学生的平均消费支出为489489元元,我们,我们推断推断说,该校说,该校全体全体大学生月消费支出为大学生月消费支出为489489元元。第44页,此课件共75页哦2、修正分数法用抽样所得的调查结果同有用抽样所得的调查结果同有关资料的对比分数来正全面关资料的对比分数来正全面统计资料时采用的一种方法统计资料时采用的一种方法【例例】某市集团公司某市集团公司20052005年年报工资总额数为年年报工资总额数为3218.13218.1万元,现抽查该万元,现抽查该集团公司集团公司1

34、414个单位,年报个单位,年报415.03415.03万元,多报万元,多报0.440.44万元,少报万元,少报1.471.47万元。万元。第45页,此课件共75页哦 的抽样分布点估计的最大好处:给出确定的值点估计的最大问题:无法控制误差第46页,此课件共75页哦抽样极限误差:抽样极限误差:以一定的可靠程度保证抽样误以一定的可靠程度保证抽样误差不超过某一给定的范围差不超过某一给定的范围.说明:说明:抽样极限误差反映了抽样估计的精确度,抽样抽样极限误差反映了抽样估计的精确度,抽样极限误差越小极限误差越小,抽样估计的精确度越高抽样估计的精确度越高,反之越低。反之越低。区间估计把在把在一定概率一定概率

35、保证下,用保证下,用样本指标样本指标去推去推断断总体指标总体指标,在考虑抽样误差的前提下,在考虑抽样误差的前提下,是通体指标落在某一范围之内,即根据是通体指标落在某一范围之内,即根据抽样指标抽样指标定出定出置信区间和置信度置信区间和置信度.第47页,此课件共75页哦置信区间:置信区间:在一定概率保证程度下,某总在一定概率保证程度下,某总体参数所在的区间范围。体参数所在的区间范围。置信度置信度:总体参数落在某一区间内的概率保证总体参数落在某一区间内的概率保证程度。也称为置信水平或可靠性。程度。也称为置信水平或可靠性。0.68270.95450.9973Z置信度置信度概率度概率度第48页,此课件共

36、75页哦常用的置信度和概率度之间的关系常用的置信度和概率度之间的关系 概率度与信任程度(置信度)成正比,概率度与信任程度(置信度)成正比,但和准确性的要求成反比。但和准确性的要求成反比。概率度概率度t误差范围误差范围概率概率F(t)0.51.001.501.962.003.000.51.001.501.962.003.000.38290.68270.86640.95000.95450.9973第49页,此课件共75页哦【例例】某灯泡厂对某灯泡厂对1000010000个产品进行寿命检测,随机抽取个产品进行寿命检测,随机抽取2%2%样本进行测样本进行测试,资料如下。按质量规定,灯泡使用寿命在试,资

37、料如下。按质量规定,灯泡使用寿命在10001000小时小时以上者为合以上者为合格品,在格品,在95.45%95.45%的概率保证程度下,计算其平均数和成数的估计区间。的概率保证程度下,计算其平均数和成数的估计区间。使用时间使用时间(小时小时)灯泡数灯泡数fi组中值组中值xixifi900900以下以下90095090095095010009501000100010501000105010501100105011001100115011001150115012001150120012001200以上以上2 24 411117171848418187 73 3合计合计200200-875 875

38、925 925 975 975 1025 1025 1075 1075 1125 1125 1175 1175 1225 1225 1750 1750 3700 3700 10725 10725 72775 72775 90300 90300 20250 20250 8225 8225 3675 3675 66248 66248 69696 69696 73964 73964 72704 72704 27216 27216 83232 83232 97468 97468 84672 84672 211400211400575200575200-182-182-132-132-82-82-32-

39、32 18 18 68 68 118 118 168168第50页,此课件共75页哦【例例】某灯泡厂对某灯泡厂对1000010000个产品进行寿命检测,随机抽取个产品进行寿命检测,随机抽取2%2%样本进行测样本进行测试,资料如下。按质量规定,灯泡使用寿命在试,资料如下。按质量规定,灯泡使用寿命在10001000小时小时以上者为合格品,以上者为合格品,在在95.45%95.45%的概率保证程度下,计算其平均数和成数的估计区间。的概率保证程度下,计算其平均数和成数的估计区间。使用时间使用时间(小时小时)灯泡数灯泡数fi组中值组中值xixifi900900以下以下900950900950950100

40、09501000100010501000105010501100105011001100115011001150115012001150120012001200以上以上2 24 411117171848418187 73 3合计合计200200-875 875 925 925 975 975 1025 1025 1075 1075 1125 1125 1175 1175 1225 1225 1750 1750 3700 3700 10725 10725 72775 72775 90300 90300 20250 20250 8225 8225 3675 3675 66248 66248 696

41、96 69696 73964 73964 72704 72704 27216 27216 83232 83232 97468 97468 84672 84672 211400211400575200575200-182-182-132-132-82-82-32-32 18 18 68 68 118 118 168168第51页,此课件共75页哦抽抽样样误误差差样本平均值样本平均值区区间间估估计计计计算算过过程程样本标准差样本标准差样本标准差样本标准差代替总体标准差代替总体标准差样本均值样本均值样本成数样本成数重复抽样重复抽样不重复抽样不重复抽样重复抽样重复抽样不重复抽样不重复抽样极限误差极限误

42、差总体均值区间估计总体均值区间估计第52页,此课件共75页哦第五节第五节 抽样方案设计抽样方案设计抽样抽样组织组织形式形式简单随机抽样简单随机抽样类型抽样类型抽样机械抽样机械抽样整群抽样整群抽样多阶段抽样多阶段抽样抽样误差抽样误差遵从原则遵从原则样本量样本量随机性原则随机性原则代表性原则代表性原则最大效果原则最大效果原则第53页,此课件共75页哦一、简单随机抽样一、简单随机抽样按随机原则直接从总体中抽出若干单位构按随机原则直接从总体中抽出若干单位构成样本。成样本。是最简单、最基本、最符合随机原则,是最简单、最基本、最符合随机原则,但同时也是抽样误差最大的抽样组织形式但同时也是抽样误差最大的抽样

43、组织形式又称又称完全随机抽样完全随机抽样或或纯随机抽样纯随机抽样,适用于均匀总,适用于均匀总体。体。*直接抽选法直接抽选法 *抽签法抽签法*随机数码表法随机数码表法 第54页,此课件共75页哦抽抽样样误误差差样本均值样本均值样本成数样本成数重复抽样重复抽样不重复抽样不重复抽样重复抽样重复抽样不重复抽样不重复抽样第55页,此课件共75页哦二、类型抽样二、类型抽样(分类(分类(层层)抽样)抽样)先对总体各单位按一定标志加以分类先对总体各单位按一定标志加以分类(层层),然,然后再从各类后再从各类(层层)中按随机原则抽取样本,由各类中按随机原则抽取样本,由各类(层层)内的样本组成一个总的样本。内的样本

44、组成一个总的样本。总体总体N N样本样本n n类型比例抽样类型比例抽样类型适宜抽样类型适宜抽样抽取方式抽取方式 第56页,此课件共75页哦各组应抽取的各组应抽取的样本单位数:样本单位数:1 1、类型比例抽样方法单位数的确定:、类型比例抽样方法单位数的确定:【例例】全及总体单位数全及总体单位数N=8000N=8000,共要抽取样本单位数,共要抽取样本单位数n=120n=120,总体分三个类型:,总体分三个类型:N1=4000,N2=2400,N3=1600,N1=4000,N2=2400,N3=1600,按类型比例抽按类型比例抽样计算各组需要抽取的样本单位数。样计算各组需要抽取的样本单位数。第5

45、7页,此课件共75页哦标志变动度大的组,抽取样本单位数的比例相应要大些;标志变动度大的组,抽取样本单位数的比例相应要大些;反之,则小些。反之,则小些。2 2、类型适宜抽样方法单位数的确定:、类型适宜抽样方法单位数的确定:【例例】全及总体单位数全及总体单位数N=8000N=8000,共要抽取样本单位数,共要抽取样本单位数n=120n=120,总体分三个类型:,总体分三个类型:N1=4000,N2=2400,N3=1600,N1=4000,N2=2400,N3=1600,标准差分别标准差分别为为1=101=10,2=152=15,3=303=30,按类型适宜抽样计算各组需按类型适宜抽样计算各组需要

46、抽取的样本单位数。要抽取的样本单位数。第58页,此课件共75页哦抽样误差的计算抽样误差的计算 1.1.先求出各层先求出各层(组组)的方差的方差(或(或)2.2.层内方差层内方差加权平均加权平均(或(或 )重重复复抽抽样样不不重重复复抽抽样样N Ni i为各层单位数,为各层单位数,第59页,此课件共75页哦【例例】某乡共有农户某乡共有农户40004000户,分粮食作物区与技术作物区。现在用类户,分粮食作物区与技术作物区。现在用类型比例抽样方法分别抽型比例抽样方法分别抽10%10%农户,调查农户收入情况,计算平均每户收农户,调查农户收入情况,计算平均每户收入及其标准差,推断全乡抽样平均每户收入和抽

47、样平均误差。入及其标准差,推断全乡抽样平均每户收入和抽样平均误差。农户总数农户总数 样本户数样本户数 抽样平均每抽样平均每户收入户收入(元元)抽样标准抽样标准差差(元元)Ninixi粮食作物区技术作物区250015002501503600540052724000400-第60页,此课件共75页哦分层抽样的抽样平均误差与组间方差无关,分层抽样的抽样平均误差与组间方差无关,取决于组内方差的平均水平。取决于组内方差的平均水平。注意注意 应扩大组间方差,缩小组内方差应扩大组间方差,缩小组内方差 总方差总方差=组内方差组内方差+组间方差组间方差 分层抽样误差小于简单抽样误差分层抽样误差小于简单抽样误差第

48、61页,此课件共75页哦四、机械抽样(等距抽样或系统抽样)四、机械抽样(等距抽样或系统抽样)研究的总体按一定的研究的总体按一定的顺序排列顺序排列,然后按固定顺,然后按固定顺序和间隔来抽选样本单位的组织抽样形式。序和间隔来抽选样本单位的组织抽样形式。总体单位排列顺序时所总体单位排列顺序时所依据的标志与调查的标依据的标志与调查的标志志无关无关等等距距抽抽样样按无关标志排列按无关标志排列按有关标志排列按有关标志排列总体单位排列顺序时所总体单位排列顺序时所依据的标志与调查的标依据的标志与调查的标志志有关有关第62页,此课件共75页哦随机起点随机起点(总体单位按某一标志排序)(总体单位按某一标志排序)等

49、距抽样抽取样本单位的具体方法:等距抽样抽取样本单位的具体方法:抽样距离:抽样距离:起点起点nR等等距距抽抽样样随机等距随机等距中点等距中点等距对称等距对称等距1 1、随机等距、随机等距第63页,此课件共75页哦2 2、中点等距、中点等距优点:样本有充分的代表性局限性:随机性不明显,不能进行样本轮换,样本利用率太低3 3、对称等距、对称等距优点:保留了半距起点等距抽样的优点,避免了他的缺点,具有明显的优点。第64页,此课件共75页哦抽样误差的计算抽样误差的计算 1 1、无关标志等距抽样按、无关标志等距抽样按简单随机抽样简单随机抽样计算计算2 2、有关标志等距抽样按、有关标志等距抽样按类型抽样类型

50、抽样计算计算 类型抽样的重复抽样的抽样误差类型抽样的重复抽样的抽样误差第65页,此课件共75页哦【例例】为了推行为了推行1515块地小麦平均亩产,按去年亩产排队块地小麦平均亩产,按去年亩产排队123地块序号123451234512345去年亩产(千克)340350355360375385395400410420430440460465480平均亩产(千克)356402455半距起点等距抽样抽选半距起点等距抽样抽选3 3,8 8,1313三块地作为样本,实割三块地作为样本,实割实测各块地平均亩产为实测各块地平均亩产为405405,410410和和480480千克,以千克,以80%80%的概率的概

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com