抽样与抽样估计 (2)讲稿.ppt

上传人:石*** 文档编号:39869521 上传时间:2022-09-08 格式:PPT 页数:78 大小:2.23MB
返回 下载 相关 举报
抽样与抽样估计 (2)讲稿.ppt_第1页
第1页 / 共78页
抽样与抽样估计 (2)讲稿.ppt_第2页
第2页 / 共78页
点击查看更多>>
资源描述

《抽样与抽样估计 (2)讲稿.ppt》由会员分享,可在线阅读,更多相关《抽样与抽样估计 (2)讲稿.ppt(78页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、关于抽样与抽样估计(2)第一页,讲稿共七十八页哦一、抽样调查一、抽样调查的概念和特点的概念和特点1 1、概念、概念:抽样调查抽样调查是按是按随机原则随机原则从全部研究对象中从全部研究对象中抽取部分单位进行观察,并根据样本的实抽取部分单位进行观察,并根据样本的实际数据对总体的际数据对总体的数量特征数量特征作出具有一定作出具有一定可可靠程度靠程度的估计和判断的估计和判断。只抽取部分单位进行调查只抽取部分单位进行调查。1 1 抽样调查抽样调查的一般问题的一般问题第二页,讲稿共七十八页哦2 2、特点、特点(1)抽样调查抽样调查建立在随机取样的基础上建立在随机取样的基础上。(2)(2)它是由部分推断整体

2、的一种认识方法它是由部分推断整体的一种认识方法。(3)抽样调查抽样调查的误差可以事先计算并加以控的误差可以事先计算并加以控制。制。第三页,讲稿共七十八页哦3 3、抽样调查的适用范围、抽样调查的适用范围抽抽样调查方法是市场经济国家在调查样调查方法是市场经济国家在调查方法上的必然选择,和普查相比,它具有方法上的必然选择,和普查相比,它具有准确度高、成本低、速度快、应用面广等准确度高、成本低、速度快、应用面广等优点。优点。第四页,讲稿共七十八页哦1.1.实实际工作不可能进行全面调查观察,而又需际工作不可能进行全面调查观察,而又需要了解其全面资料的事物;要了解其全面资料的事物;2.2.虽虽可进行全面调

3、查观察,但比较困难或并不必可进行全面调查观察,但比较困难或并不必要;要;3.3.对对普查或全面调查统计资料的质量进行检查和修普查或全面调查统计资料的质量进行检查和修正;正;4.4.抽抽样方法适用于对大量现象的观察,即组成样方法适用于对大量现象的观察,即组成事物总体的单位数量较多的情况;事物总体的单位数量较多的情况;5.5.利利用抽样推断的方法,可以对于某种总体的假用抽样推断的方法,可以对于某种总体的假设进行检验,判断这种假设的真伪,以决定取舍设进行检验,判断这种假设的真伪,以决定取舍。一般适用于以下范围:一般适用于以下范围:第五页,讲稿共七十八页哦三、有关抽样的基本概念三、有关抽样的基本概念(

4、一)总体和样本(一)总体和样本总体:总体:也称全及总体。指所要认识的研究对也称全及总体。指所要认识的研究对象全体。总体单位总数用象全体。总体单位总数用“N N”表示。表示。样本:样本:也称抽样总体,是抽出的单位组成的也称抽样总体,是抽出的单位组成的整体。样本单位总数用整体。样本单位总数用“n n”表示。表示。二、抽样推断的内容二、抽样推断的内容参数估计参数估计假设检验假设检验第六页,讲稿共七十八页哦(二)参数和统计量(二)参数和统计量1 1、针对总体计算的指标叫总体参数,也叫全及指、针对总体计算的指标叫总体参数,也叫全及指标。标。2 2、针对样本计算的指标为统计量,也叫估计量、针对样本计算的指

5、标为统计量,也叫估计量,也也叫抽样指标。叫抽样指标。参数的值是定值参数的值是定值常用的参数有:总体平均数、总体成数常用的参数有:总体平均数、总体成数P P、总体标准、总体标准差差其值随样本的不同而不同,是个随机变量。其值随样本的不同而不同,是个随机变量。抽样估计就是通过统计量的值去估计参数的值。抽样估计就是通过统计量的值去估计参数的值。常用的统计量有:样本平均数、样本成数常用的统计量有:样本平均数、样本成数p p、样本、样本标准差标准差S S第七页,讲稿共七十八页哦 1N0NNNP1第八页,讲稿共七十八页哦 。n1nnnp1%1P%3p第九页,讲稿共七十八页哦XnxxPnnp12 xp2ss第

6、十页,讲稿共七十八页哦nxnxxxxn21fxfffffxfxfxxnnn212211ffxffxffxffxinnii2211或第十一页,讲稿共七十八页哦NXXNii122)(KiiKiiiFFXX1122)(NXXNii12)(KiiKiiiFFXX112)(第十二页,讲稿共七十八页哦nxxs22)(ffxxs22)(nxxs2)(ffxxs2)(ffxxs22)(ffxxs2)(第十三页,讲稿共七十八页哦利用样本统计量对总体某些性利用样本统计量对总体某些性质或数量特征进行推断。质或数量特征进行推断。随机原则随机原则总体参数总体参数统计量统计量推断估计推断估计参数估计参数估计检验检验假设检

7、验假设检验抽样分布抽样分布第十四页,讲稿共七十八页哦(三)样本容量和样本个数(三)样本容量和样本个数1 1、样本容量:、样本容量:一个样本包含的单位数。用一个样本包含的单位数。用 “n n”表示。一般要求表示。一般要求 n n 30302 2、样本个数:、样本个数:从一个全及总体中可能抽取从一个全及总体中可能抽取的样本数目。的样本数目。第十五页,讲稿共七十八页哦(四)重复抽样和不重复抽样(四)重复抽样和不重复抽样1 1、重复抽样:也叫放回抽样。、重复抽样:也叫放回抽样。2 2、不重复抽样:也叫无放回抽样。、不重复抽样:也叫无放回抽样。一个单位可能中选多次一个单位可能中选多次每次抽单位,概率固定

8、,都为每次抽单位,概率固定,都为1/N1/N。一个单位最多中选一次一个单位最多中选一次每次抽单位,概率不同,逐渐增加每次抽单位,概率不同,逐渐增加第十六页,讲稿共七十八页哦(五五)、概率抽样与非概率抽样、概率抽样与非概率抽样1、概率抽样:也叫随机抽样,是指按照随机原、概率抽样:也叫随机抽样,是指按照随机原则抽取样本。概率抽样最基本的组织方式有:则抽取样本。概率抽样最基本的组织方式有:简单随机抽样、分层抽样、等距抽样和整群抽简单随机抽样、分层抽样、等距抽样和整群抽样。样。2、非概率抽样:也叫非随机抽样,是指从研、非概率抽样:也叫非随机抽样,是指从研究目的出发,根据调查者的经验或判断,从究目的出发

9、,根据调查者的经验或判断,从总体中有意识地抽取若干单位构成样本。重总体中有意识地抽取若干单位构成样本。重点调查、典型调查、配额调查等属于非随机点调查、典型调查、配额调查等属于非随机抽样。抽样。第十七页,讲稿共七十八页哦(六)、抽样框(六)、抽样框 1 1、抽样框是包括全部抽样单位的名单框架。编制抽、抽样框是包括全部抽样单位的名单框架。编制抽样框是实施抽样的基础。抽样框的好坏通常会直接样框是实施抽样的基础。抽样框的好坏通常会直接影响到抽样调查的随机性和调查的效果。影响到抽样调查的随机性和调查的效果。2 2、抽样框主要有三种形式:、抽样框主要有三种形式:名单抽样框,即列出全部总体单位的名录一览表名

10、单抽样框,即列出全部总体单位的名录一览表,如职工名单、企业名单等。,如职工名单、企业名单等。区域抽样框,即按地理位置将总体范围划分为若区域抽样框,即按地理位置将总体范围划分为若干小区域,以小区域为抽样单位。如对某市居民住房干小区域,以小区域为抽样单位。如对某市居民住房情况进行调查,将全市居民户划分为若干街道或片区情况进行调查,将全市居民户划分为若干街道或片区。第十八页,讲稿共七十八页哦3 3、一个理想的抽样框应该与目标总体一致,即应包括、一个理想的抽样框应该与目标总体一致,即应包括全部总体单位,既不重复,也不遗漏(穷尽与互斥)。全部总体单位,既不重复,也不遗漏(穷尽与互斥)。若有遗漏,易造成系

11、统性误差。若有遗漏,易造成系统性误差。在实践中,要取得与目标总体完全一致的抽样框往往在实践中,要取得与目标总体完全一致的抽样框往往很困难,甚至不可能,常常只能采用与目标总体近似很困难,甚至不可能,常常只能采用与目标总体近似的抽样框。的抽样框。时间表抽样框,即将总体全部单位按时间顺序排列时间表抽样框,即将总体全部单位按时间顺序排列,把总体的时间过程分为若干个小的时间单位,以此时,把总体的时间过程分为若干个小的时间单位,以此时间单位为抽样单位。如对流水线上间单位为抽样单位。如对流水线上2424小时内生产的产品小时内生产的产品进行质量抽查时,以进行质量抽查时,以5 5分钟为一个抽样单位,可将全部分钟

12、为一个抽样单位,可将全部产品分为产品分为288288个抽样单位并按时间顺序排列。个抽样单位并按时间顺序排列。第十九页,讲稿共七十八页哦(七)、抽样误差(七)、抽样误差统计调查的误差,是指调查所得结果与总体真实统计调查的误差,是指调查所得结果与总体真实值之间的差异。在抽样调查中,误差的来源有登值之间的差异。在抽样调查中,误差的来源有登记性误差和代表性误差两大类。记性误差和代表性误差两大类。登登记记误误差差系系统统性性误误差差统统计计误误差差代代表表性性误误差差实实际际误误差差随随机机误误差差抽抽样样平平均均误误差差第二十页,讲稿共七十八页哦(1 1)登记性误差,指在调查和汇总过程中)登记性误差,

13、指在调查和汇总过程中由于测量、登记、计算等方面的差错或被调由于测量、登记、计算等方面的差错或被调查者提供虚假资料而造成的误差。它在任何查者提供虚假资料而造成的误差。它在任何调查中均存在。而且调查范围越大,调查单调查中均存在。而且调查范围越大,调查单位越多,产生登记性误差的可能性也越大。位越多,产生登记性误差的可能性也越大。(2 2)代表性误差,指样本推断总体时,由于)代表性误差,指样本推断总体时,由于样本结构与总体结构不一致而产生的误差。又样本结构与总体结构不一致而产生的误差。又分系统误差与随机误差两种。分系统误差与随机误差两种。第二十一页,讲稿共七十八页哦随机误差也叫偶然误差。它是由偶然随机

14、误差也叫偶然误差。它是由偶然性因素引起的代表性误差。它不可避免性因素引起的代表性误差。它不可避免,但可计算与控制。抽样估计中的抽样,但可计算与控制。抽样估计中的抽样误差,就是指这种随机误差。误差,就是指这种随机误差。在计算抽样误差时,常常假设不存在登记性在计算抽样误差时,常常假设不存在登记性误差和系统误差误差和系统误差系统误差是非随机因素引起的误差,它系统系统误差是非随机因素引起的误差,它系统性偏高或偏低,也称偏差。性偏高或偏低,也称偏差。第二十二页,讲稿共七十八页哦2 2 抽样平均误差抽样平均误差一、抽样误差的概念一、抽样误差的概念1 1、抽样误差是指由于抽样的随机性而产生的、抽样误差是指由

15、于抽样的随机性而产生的那一部分代表性误差(随机性误差),不包括那一部分代表性误差(随机性误差),不包括 登记性误差,也不包括可能发生的偏差。登记性误差,也不包括可能发生的偏差。主要有两主要有两种种:实际抽样误差实际抽样误差,抽样平均误差。抽样平均误差。(1 1)实际抽样误差:指某一样本指标与总体参数)实际抽样误差:指某一样本指标与总体参数之间的离差之间的离差例例8 8-2-1-2-1:从从1 1、2 2、3 3中抽中抽2 2个(重复),参个(重复),参数取总体平均数数取总体平均数 (等于(等于2 2),则实际抽),则实际抽样误差如下:样误差如下:X第二十三页,讲稿共七十八页哦样本样本 样本统计

16、量样本统计量实际抽样误差实际抽样误差(-)(1 1、1 1)1 1-1-1(1(1、2 2)1.51.5-0.5-0.5(1 1、3 3)2 20 0(2 2、1 1)1.51.5-0.5-0.5(2 2、2 2)2 20 0(2 2、3 3)2.52.50.50.5(3 3、1 1)2 20 0(3 3、2 2)2.52.50.50.5(3 3、3 3)3 31 1xxxX第二十四页,讲稿共七十八页哦(2)(2)抽样平均误差:指样本指标的标准差。抽样平均误差:指样本指标的标准差。抽样实际误差是无法知道的,而抽样平均误差抽样实际误差是无法知道的,而抽样平均误差可以计算。可以计算。在讨论抽样误差

17、时,通常指抽样平均误差在讨论抽样误差时,通常指抽样平均误差要计算抽样平均误差,得从抽样分布谈起要计算抽样平均误差,得从抽样分布谈起二、抽样分布及抽样平均误差的计算二、抽样分布及抽样平均误差的计算 抽样分布是指样本指标的概率分布,由样抽样分布是指样本指标的概率分布,由样本指标的可能取值与之相应的频数或频率组成本指标的可能取值与之相应的频数或频率组成。第二十五页,讲稿共七十八页哦 对于抽样分布,可计算其均值和方差等来反对于抽样分布,可计算其均值和方差等来反映该分布的中心和离散趋势。映该分布的中心和离散趋势。(一)抽样分布的集中趋势与离中趋势的测定(一)抽样分布的集中趋势与离中趋势的测定 A A、样

18、本平均数的抽样分布的集中趋势与离、样本平均数的抽样分布的集中趋势与离中趋势的测定中趋势的测定 1 1、把所有可能样本的平均数及其相应的频数或、把所有可能样本的平均数及其相应的频数或频率排列起来,就是样本平均数的抽样分布。频率排列起来,就是样本平均数的抽样分布。通常计算这一分布的均值和标准差,分别反映样通常计算这一分布的均值和标准差,分别反映样本平均数分布的集中趋势与离中趋势。本平均数分布的集中趋势与离中趋势。第二十六页,讲稿共七十八页哦2 2、例、例8 8-2-2-2-2:从从4 4、6 6、8 8三个数中按重复抽样抽三个数中按重复抽样抽2 2个,个,调查其平均数,形成的抽样分布如下:调查其平

19、均数,形成的抽样分布如下:样本样本样本平均数样本平均数频数频数(4、4)41(4、6)(6、4)52(4、8)(6、6)(8、4)63(6、8)(8、6)72(8、8)81x第二十七页,讲稿共七十八页哦平均数平均数:xE32118273625146954计算该分布的平均数和标准差,得计算该分布的平均数和标准差,得 标准差标准差:x912212112222234而总体平均数和标准差分别为:而总体平均数和标准差分别为:X638643222238第二十八页,讲稿共七十八页哦所以,可得以下两点结论:(重复)所以,可得以下两点结论:(重复)样本平均数的平均数等于总体平均数。样本平均数的平均数等于总体平均

20、数。抽样平均数的标准差仅为总体标准差的抽样平均数的标准差仅为总体标准差的n13 3、样本平均数的标准差即是平均数的抽样样本平均数的标准差即是平均数的抽样平均误差平均误差)(x第二十九页,讲稿共七十八页哦在实际中,不可能一一列举所有可能的样本,从而不在实际中,不可能一一列举所有可能的样本,从而不能按上述方法计算。可利用上述第个结论计算,即能按上述方法计算。可利用上述第个结论计算,即:重复抽样重复抽样时:时:xnn2不重复抽样不重复抽样时:时:x)1(21NnnNnn第三十页,讲稿共七十八页哦 2S第三十一页,讲稿共七十八页哦4 4、例、例8 8-2-3-2-3:用简单重复抽样的方法,从用简单重复

21、抽样的方法,从660660个工厂中个工厂中抽取抽取3333个工厂调查月产值情况,得资料如下,试求月产个工厂调查月产值情况,得资料如下,试求月产值的抽样平均误差。值的抽样平均误差。月产值(万元)月产值(万元)工厂数工厂数 0-10 0-10 20 20 10-20 10-20 9 9 20-30 20-30 2 2 30-40 30-40 2 2第三十二页,讲稿共七十八页哦解解xfxf33235225915205=10.76 ffxx2332292024.2424.1424.476.5222291.72xn)(49.13391.72万元(万元)(万元)第三十三页,讲稿共七十八页哦B B、样本成数

22、的抽样分布的集中趋势与离中趋势、样本成数的抽样分布的集中趋势与离中趋势的测定的测定1 1、把所有可能样本的成数及其相应的频、把所有可能样本的成数及其相应的频数或频率排列起来,就是样本成数的抽样数或频率排列起来,就是样本成数的抽样分布。分布。通常计算这一分布的均值和标准差,分别反映通常计算这一分布的均值和标准差,分别反映样本成数分布的集中趋势与离中趋势。样本成数分布的集中趋势与离中趋势。第三十四页,讲稿共七十八页哦2 2、例、例8 8-2-4-2-4:从张(男)、王(男)、田(女):从张(男)、王(男)、田(女)三个人中按重复抽样抽三个人中按重复抽样抽2 2个,调查其男性比重,形个,调查其男性比

23、重,形成的抽样分布如下成的抽样分布如下 样本样本样本成数样本成数(p p)频数频数(张、张)(张、王)(张、张)(张、王)(王、张)(王、王)(王、张)(王、王)1 14 4(张、田)(张、田)(王、田)(王、田)(田、张)(田、王)(田、张)(田、王)1/21/24 4(田、田)(田、田)0 01 1第三十五页,讲稿共七十八页哦平均数:平均数:pE14410421413296计算该分布的平均数和标准差,得计算该分布的平均数和标准差,得 标准差:标准差:p914432613122291而总体成数和标准差分别为:而总体成数和标准差分别为:P32)(PP192第三十六页,讲稿共七十八页哦所以,可得

24、以下两点结论:(重复)所以,可得以下两点结论:(重复)样本成数的平均数等于总体成数。样本成数的平均数等于总体成数。抽样成数的标准差仅为总体成数标准差的抽样成数的标准差仅为总体成数标准差的n13 3、样本成数的标准差即是成数的抽样平均误样本成数的标准差即是成数的抽样平均误差差在实际中,不可能一一列举所有可能的样本在实际中,不可能一一列举所有可能的样本,从而不能按上述方法计算。可利用上述第,从而不能按上述方法计算。可利用上述第个结论计算,即:个结论计算,即:)(p第三十七页,讲稿共七十八页哦重复抽样重复抽样时:时:不重复抽样不重复抽样时:时:nppp1Nnnppp11当总体成数未知时,可用当总体成

25、数未知时,可用4 4种方法取得:种方法取得:样本资料、历史资料、小规模调查资料、估计样本资料、历史资料、小规模调查资料、估计资料资料4 4、例、例6-2-56-2-5:一批:一批8 8瓦的日光灯管瓦的日光灯管8000080000只,从中抽只,从中抽取取400400只检验,发现有只检验,发现有1212只不合格,试求合格率的抽只不合格,试求合格率的抽样平均误差。样平均误差。第三十八页,讲稿共七十八页哦解:解:样本合格样本合格率率 p40012400%97重复抽样重复抽样时:时:不重复抽样不重复抽样时:时:nppp1Nnnppp1140003.097.0=0.853%=0.853%)(8000040

26、0140003.097.0=0.85%=0.85%第三十九页,讲稿共七十八页哦第四十页,讲稿共七十八页哦(二)影响抽样平均误差的因素(二)影响抽样平均误差的因素 1 1、总体方差或标准差。总体各单位在被研究变、总体方差或标准差。总体各单位在被研究变量上的差异程度差异越大,误差越大。量上的差异程度差异越大,误差越大。2 2、样本容量样本容量n n的大小。抽取的单位数越多,误差越的大小。抽取的单位数越多,误差越小。小。3 3、抽样方法。重复抽样的误差大于不重复抽样、抽样方法。重复抽样的误差大于不重复抽样的误差。的误差。当一个总体给定后,总体各单位在被研究变量当一个总体给定后,总体各单位在被研究变量

27、上的差异程度也随之确定。所以在选定抽样方上的差异程度也随之确定。所以在选定抽样方式和方法后,要缩小抽样平均误差,必须保证式和方法后,要缩小抽样平均误差,必须保证足够多的样本容量足够多的样本容量n n4 4、抽样组织的方式、抽样组织的方式第四十一页,讲稿共七十八页哦2 2、抽样平均数极限误差:、抽样平均数极限误差:抽样成数极限误差:抽样成数极限误差:Xxx3 3 总体总体指标的推断指标的推断一、抽样极限误差一、抽样极限误差1 1、样本指标与总体指标之差的绝对值的最大、样本指标与总体指标之差的绝对值的最大值为抽样极限误差值为抽样极限误差Ppp3 3、一般通过抽样平均误差计算抽样极限误、一般通过抽样

28、平均误差计算抽样极限误差差xtxptp 第四十二页,讲稿共七十八页哦t t叫概率度,叫概率度,一个概率度对应一个概率保证程一个概率度对应一个概率保证程度度F F(t t)可通过查正态分布表得到对应的可通过查正态分布表得到对应的t t与与F F(t t)常用的常用的t t 值及所对应概率的关系值及所对应概率的关系:99.73%99.73%3 3 95.45%95.45%2 2 68.27%68.27%95%95%1 1 1.96 1.96概率概率F F(t t)概率度(概率度(t t)第四十三页,讲稿共七十八页哦4 4、例、例8 8-3-1-3-1:设成人身高的达标值为:设成人身高的达标值为16

29、5165厘厘米。从一批成年人中随机抽米。从一批成年人中随机抽7 7人,得身高分人,得身高分别为别为155155、160160、165165、170170、175175、180180、185185(厘米)。(厘米)。要求:以要求:以95.45%95.45%的概率保证度求平均身高的概率保证度求平均身高的极限误差;的极限误差;以以99.73%99.73%的概率保证度求身高达标的概率保证度求身高达标率的极限误差。率的极限误差。第四十四页,讲稿共七十八页哦 解:解:x=170=17010 xn71078.3F F(t t)=95.45%=95.45%,则则t=2t=2xtx56.7278.3所以,所以,

30、(厘米)(厘米)(厘米)(厘米)厘米厘米第四十五页,讲稿共七十八页哦p75%43.71nppp172857.07143.0=17.07%ptp%21.513%07.17所以,所以,F F(t t)=99.73%=99.73%,则则t=3t=3第四十六页,讲稿共七十八页哦二、总体二、总体指标的推断方法指标的推断方法1 1、点估计、点估计第四十七页,讲稿共七十八页哦第四十八页,讲稿共七十八页哦第四十九页,讲稿共七十八页哦三、区间估计三、区间估计区间估计就是根据样本指标和抽样极限区间估计就是根据样本指标和抽样极限误差以一定把握程度推断总体指标的区间范误差以一定把握程度推断总体指标的区间范围。围。在一

31、定概率保证程度下:在一定概率保证程度下:XxxxxXxx Ppppp Ppp 第五十页,讲稿共七十八页哦2 2、区间估计的三要素为:、区间估计的三要素为:估计值估计值抽样误差范围抽样误差范围概率保证程度概率保证程度 应用区间估计时要注意:应用区间估计时要注意:()所求出的区间只是一个可能范围,()所求出的区间只是一个可能范围,而不是一个完全肯定的范围。而不是一个完全肯定的范围。()所估计的区间大小(估计的精确度)()所估计的区间大小(估计的精确度)是与概率保证程度紧密联系的。是与概率保证程度紧密联系的。第五十一页,讲稿共七十八页哦 第五十二页,讲稿共七十八页哦(二)实例(二)实例例例8 8-3

32、-2-3-2:某农场进行小麦产量抽样调查,小麦播:某农场进行小麦产量抽样调查,小麦播种总面积为种总面积为1 1万亩,采用不重复简单随机抽样,从万亩,采用不重复简单随机抽样,从中抽选了中抽选了100100亩作为样本进行实割实测,测得样本亩作为样本进行实割实测,测得样本平均亩产平均亩产400400斤,方差斤,方差144144斤。斤。以以95.45%95.45%的可靠性推断小麦平均亩产的区间的可靠性推断小麦平均亩产的区间解:解:N=10000n=100 9545.0,144,4002tFx(1 1)计算抽样平均误差)计算抽样平均误差 斤19.110000100110014412Nnnx第五十三页,讲

33、稿共七十八页哦(2 2)计算抽样极限误差)计算抽样极限误差斤38.219.12xtx(3 3)计算总体平均数的置信区间)计算总体平均数的置信区间上限:上限:斤38.40238.2400 xx下限:下限:斤62.39738.2400 xx即:以即:以95.45%95.45%的可靠性估计该农场小麦平均亩产量的可靠性估计该农场小麦平均亩产量在在397.62397.62斤至斤至402.38402.38斤之间斤之间.第五十四页,讲稿共七十八页哦 例例8 8-3-3-3-3:某纱厂某时期内生产了:某纱厂某时期内生产了1010万个单位的万个单位的纱,按纯随机抽样方式抽取纱,按纯随机抽样方式抽取2000200

34、0个单位检验,结果合个单位检验,结果合格率为格率为95%95%,试以,试以95%95%的把握程度估计全部纱合格品率的把握程度估计全部纱合格品率的区间的区间100000N2000n%95p%51 p 95.0tF96.1tNnnppp11%48.010000020001200005.095.0%94.0%48.096.1ppt区间下限:区间下限:%06.940094.095.0pp区间上限:区间上限:%94.950094.095.0pp解:解:第五十五页,讲稿共七十八页哦例例8 8-3-4:-3-4:对一批电子元件进行耐用性能的检查,对一批电子元件进行耐用性能的检查,随机重置抽样方法选取随机重置

35、抽样方法选取100100件作耐用测试,所得件作耐用测试,所得结果的分组资料如下:结果的分组资料如下:100100合计合计 18 185500550050005000以上以上 50 50450045004000400050005000 30 30 3500 35003000300040004000 2 2 2500 250030003000以下以下件数(件数(f f)组中值(组中值(x x)耐用时数(耐用时数(小时)小时)试以试以95.45%95.45%的把握程度估计这批产品的平均耐用时的把握程度估计这批产品的平均耐用时数数第五十六页,讲稿共七十八页哦解解:(1)(1)、计算样本平均数和样本标准

36、差、计算样本平均数和样本标准差)(73110018)43405500(2)43402500(4340100434000222小时)(小时)ffxxsfxfx第五十七页,讲稿共七十八页哦(2)(2)、计算极限误差、计算极限误差(小时)小时2.1461.7322%45.95)()(1.73100731tttFnsx(3)(3)、估计区间的下限:估计区间的下限:43404340146.2=4193.8146.2=4193.8小时小时估计区间的上限:估计区间的上限:43404340146.2=4486.2146.2=4486.2小时小时 所以,这批电子元件的平均耐用时数在所以,这批电子元件的平均耐用时

37、数在4193.84193.8小时至小时至4486.24486.2小时之间,可靠程度为小时之间,可靠程度为95.45%95.45%。区间估计区间估计第五十八页,讲稿共七十八页哦例例8 8-3-5:-3-5:上例中上例中,如果如果30003000小时以下为不合格品小时以下为不合格品(1)(1)以同样的把握程度估计这批产品的合格率以同样的把握程度估计这批产品的合格率;(2)(2)如果共有如果共有2000020000件产品件产品,至少有多少件合格品。至少有多少件合格品。解解:(1):(1)%8.2%4.12%4.1100)98.01(98.01%98100981ppptnppnnp)(估计的下限:估计

38、的下限:98%98%2.8%=95.2%2.8%=95.2%估计的上限:估计的上限:98%98%2.8%=100%2.8%=100%所以,这批电子元件的合格品率在所以,这批电子元件的合格品率在95.2%95.2%至至100%100%之间,可靠程度为之间,可靠程度为95.45%95.45%。(2)(2)至少有至少有200002000095.2%=1904095.2%=19040件合格品件合格品第五十九页,讲稿共七十八页哦例例8 8-3-6-3-6对某广播电台的对某广播电台的800800名经常听众进行调名经常听众进行调查,发现有查,发现有600600名是青少年,要求误差范围不超名是青少年,要求误差

39、范围不超过过3%3%。试估计全部听众中青少年听众所占比重。试估计全部听众中青少年听众所占比重的区间范围。的区间范围。解:已知解:已知 n=800 n=800%3p%53.180025.075.0)1(%75800600npppp,96.1%53.1%3ppt查表查表F F(t)=95%t)=95%第六十页,讲稿共七十八页哦 4 4、抽样方案的设计、抽样方案的设计一、抽样设计必须掌握两个基本原则:一、抽样设计必须掌握两个基本原则:(二)、保证实现最大的抽样效果原则(二)、保证实现最大的抽样效果原则,即在一定的调查费用条件下,选取抽,即在一定的调查费用条件下,选取抽样误差最小的方案;或在给定精确度

40、的样误差最小的方案;或在给定精确度的要求下,做到调查费用最少。要求下,做到调查费用最少。(一)、保证实现抽样的随机性原则(一)、保证实现抽样的随机性原则第六十一页,讲稿共七十八页哦二、抽样调查的几种常用形式二、抽样调查的几种常用形式简单随机抽样简单随机抽样类型抽样类型抽样等距抽样等距抽样整群抽样整群抽样多阶段抽样多阶段抽样第六十二页,讲稿共七十八页哦(一一)、简单随机抽样、简单随机抽样(纯随机抽样纯随机抽样)即从总体单位中不加任何分组、排即从总体单位中不加任何分组、排队,完全随机地抽取调查单位。队,完全随机地抽取调查单位。随机抽选可有各种不同的具体做法,如:随机抽选可有各种不同的具体做法,如:

41、1.1.直接抽选法;直接抽选法;2.2.抽签法;抽签法;3.3.随机数码表法;随机数码表法;第六十三页,讲稿共七十八页哦(二二)、类型抽样、类型抽样(分类抽样分类抽样)先对总体各单位按一定标志加以分类先对总体各单位按一定标志加以分类(层层),然后再从各类,然后再从各类(层层)中按随机原则抽中按随机原则抽取样本,组成一个总的样本。取样本,组成一个总的样本。类型的划分:类型的划分:一一是必须有清楚的划类界限;是必须有清楚的划类界限;二二是必须知道各类中的单位数目和比例;是必须知道各类中的单位数目和比例;三三是分类型的数目不宜太多。是分类型的数目不宜太多。第六十四页,讲稿共七十八页哦类型抽样的好处是

42、:类型抽样的好处是:样样本代表性高、抽样误差小、抽样本代表性高、抽样误差小、抽样调查成本较低。如果抽样误差的要求相调查成本较低。如果抽样误差的要求相同的话则抽样数目可以减少。同的话则抽样数目可以减少。两种类型:两种类型:1.1.等等比例类型抽样比例类型抽样(类型比例抽样类型比例抽样);2.2.不不等比例类型抽样等比例类型抽样(类型适宜抽样类型适宜抽样)。第六十五页,讲稿共七十八页哦(三三)、机械抽样、机械抽样(等距抽样等距抽样)先先将全及总体的所有单位按某一标志顺序将全及总体的所有单位按某一标志顺序排队,然后按相等的距离抽取样本单位。排队,然后按相等的距离抽取样本单位。排列次序用的标志有两种:

43、排列次序用的标志有两种:1.1.选选择标志与抽样调查所研究内容无关,择标志与抽样调查所研究内容无关,称无关标志排队。称无关标志排队。2.2.选选择标志与抽样调查所研究的内容有关,择标志与抽样调查所研究的内容有关,称有关标志排队。称有关标志排队。研究工人的平均收入水平时,按工号排队。研究工人的平均收入水平时,按工号排队。例例研究工人的生活水平,按工人月工资额研究工人的生活水平,按工人月工资额高低排队。高低排队。例例第六十六页,讲稿共七十八页哦机械抽样的好处:机械抽样的好处:1.1.可可以使抽样过程大大简化,减轻抽样以使抽样过程大大简化,减轻抽样的工作量;的工作量;2.2.如如果用有关标志排队,还

44、可以缩小抽果用有关标志排队,还可以缩小抽样误差,提高抽样推断效果。样误差,提高抽样推断效果。机械抽样机械抽样,实际上是一种特殊的类型抽,实际上是一种特殊的类型抽样。因为,如果在类型抽样中,把总体划分为样。因为,如果在类型抽样中,把总体划分为若干相等部分,每个部分只抽一个样本,在这若干相等部分,每个部分只抽一个样本,在这种情况下,则类型抽样就成了机械抽样。种情况下,则类型抽样就成了机械抽样。第六十七页,讲稿共七十八页哦(四四)、整群抽样、整群抽样 整群抽样整群抽样即从全及总体中成群地抽取即从全及总体中成群地抽取样本单位,对抽中的群内的所有单位都进样本单位,对抽中的群内的所有单位都进行观察。行观察

45、。整群抽样的好处:整群抽样的好处:组织工作比较简单组织工作比较简单方便,适用于一些特殊的研究对象。其不足方便,适用于一些特殊的研究对象。其不足之处是,一般比其它抽样方式的抽样误差大之处是,一般比其它抽样方式的抽样误差大。第六十八页,讲稿共七十八页哦(五五)、多阶段抽样、多阶段抽样 即把抽样本单位的过程分为两个或几个阶即把抽样本单位的过程分为两个或几个阶段来进行。段来进行。(如果一次就直接抽选出具体样本单位,这(如果一次就直接抽选出具体样本单位,这叫单阶段抽样)具体讲:叫单阶段抽样)具体讲:先抽大单位先抽大单位(可可以用类型抽样或机械抽样以用类型抽样或机械抽样),再在大单位再在大单位中抽小单位中

46、抽小单位(可用整群抽样或简单随机抽样可用整群抽样或简单随机抽样),小单位中再抽更小的单位;而不是一次就,小单位中再抽更小的单位;而不是一次就直接抽取基层的调查单位。直接抽取基层的调查单位。第六十九页,讲稿共七十八页哦三、必要抽样单位数的确定三、必要抽样单位数的确定指为了使抽样误差不超过给定的允许范围至少指为了使抽样误差不超过给定的允许范围至少应抽取的样本单位数目。应抽取的样本单位数目。(一)简单随机抽样下必要抽样单位数的确(一)简单随机抽样下必要抽样单位数的确定定1 1、由样本平均数估计总体平均数时、由样本平均数估计总体平均数时重复抽样:重复抽样:n=n=xt222 不重复抽样:不重复抽样:n

47、=n=22222ttxNN第七十页,讲稿共七十八页哦不重复抽样:不重复抽样:n=n=pPPt212PPtpNPPtN122122 2、由样本成数估计总体成数时、由样本成数估计总体成数时重复抽样:重复抽样:n=n=第七十一页,讲稿共七十八页哦解:解:xtn222202502222=625=625(户)(户)例例8 8-3-6-3-6:根据历史资料,某市职工家庭年根据历史资料,某市职工家庭年收入的标准差为收入的标准差为250250元现再次调查收入状况元现再次调查收入状况,要求在,要求在95.45%95.45%的把握度下平均年收入的允的把握度下平均年收入的允许误差不超过许误差不超过2020元,问应抽

48、多少户家庭调查元,问应抽多少户家庭调查?第七十二页,讲稿共七十八页哦 例例8 8-3-7-3-7:调查一批零件的合格率,根据过去:调查一批零件的合格率,根据过去的资料,合格率为的资料,合格率为97%97%。如果要求误差不超过。如果要求误差不超过1%1%,把握程度为把握程度为95%95%,问需抽多少个零件检查?,问需抽多少个零件检查?解:解:pPPtn21201.096.12203.097.0=1118=1118(件)(件)第七十三页,讲稿共七十八页哦(二)必要抽样单位数的影响因素(二)必要抽样单位数的影响因素1 1、概率保证程度、概率保证程度2 2、总体各单位在被研究标志上的差异程度、总体各单

49、位在被研究标志上的差异程度4 4、不同的抽样方法、不同的抽样方法5 5、不同的抽样组织方式、不同的抽样组织方式 最后,要考虑调查的人力、物力、财力的最后,要考虑调查的人力、物力、财力的许可情况许可情况3 3、允许误差范围、允许误差范围第七十四页,讲稿共七十八页哦第六章第六章 抽样推断抽样推断一、判一、判 断断 对对 错错1 1、样本统计量是一个随机变量。(、样本统计量是一个随机变量。()2 2、抽样极限误差总是大于抽样平均误差。、抽样极限误差总是大于抽样平均误差。()3 3、在抽样推断中,作为推断的总体和和为观察对象的样本都是、在抽样推断中,作为推断的总体和和为观察对象的样本都是 确定的、唯一

50、的。确定的、唯一的。()4 4、在其它条件不变的情况下,提高抽样估计的可靠程度,可以提高抽样估计的、在其它条件不变的情况下,提高抽样估计的可靠程度,可以提高抽样估计的精确度。精确度。()5 5、在其它条件固定时,重复抽样的抽样误差比不重复抽样的、在其它条件固定时,重复抽样的抽样误差比不重复抽样的 抽样误差小。抽样误差小。()6 6、从全部总体单位中按照随机原则抽取部分单位组成样本,只可、从全部总体单位中按照随机原则抽取部分单位组成样本,只可 能组成一个样本能组成一个样本 。()第七十五页,讲稿共七十八页哦第六章第六章 抽样推断抽样推断二、选二、选 择择 题题1 1、抽样误差的大小(、抽样误差的

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com