抽样调查的一般原理与抽样估计.pptx

上传人:修**** 文档编号:5732057 上传时间:2022-01-16 格式:PPTX 页数:132 大小:513.56KB
返回 下载 相关 举报
抽样调查的一般原理与抽样估计.pptx_第1页
第1页 / 共132页
抽样调查的一般原理与抽样估计.pptx_第2页
第2页 / 共132页
点击查看更多>>
资源描述

《抽样调查的一般原理与抽样估计.pptx》由会员分享,可在线阅读,更多相关《抽样调查的一般原理与抽样估计.pptx(132页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、安徽理工大学统统 计计 学学第第 三十二三十二 讲讲主讲主讲 雷思友雷思友 副教授副教授/ /硕导硕导/ /系主任系主任1市场营销2009-1/2/3/4Be quiet!Shut your mouth!2第第 七七 章章 抽抽 样样 调调 查查 第一节第一节 抽样调查概述抽样调查概述 第二节第二节 抽样调查的一般原理抽样调查的一般原理 第三节第三节 抽样估计抽样估计 第四节第四节 抽样的组织形式抽样的组织形式3(一一)抽样推断的含义抽样推断的含义 抽样调查是按随机原则,从全部研究对象中抽取一抽样调查是按随机原则,从全部研究对象中抽取一部分单位进行观察,并根据样本的实际数据,对总体的部分单位进

2、行观察,并根据样本的实际数据,对总体的数量特征做出具有一定可靠程度的估计和判断,从而达数量特征做出具有一定可靠程度的估计和判断,从而达到对全部研究对象的认识的一种统计方法。到对全部研究对象的认识的一种统计方法。其中心问题其中心问题是如何根据已知的部分资料来推断未知的总体情况是如何根据已知的部分资料来推断未知的总体情况。第一节第一节 抽样调查概述抽样调查概述一、抽样调查的含义一、抽样调查的含义4(二二)抽样推断的特点抽样推断的特点1抽样推断是非全面调查抽样推断是非全面调查2抽样推断是按随机原则抽选调查单位。抽样推断是按随机原则抽选调查单位。3抽样推断是用样本的指标数值去推算总体的指标数值。抽样推

3、断是用样本的指标数值去推算总体的指标数值。4抽样推断中产生的抽样误差,可以事先计算并加以控制。抽样推断中产生的抽样误差,可以事先计算并加以控制。5二、抽样调查的主要内容二、抽样调查的主要内容(一一)随机抽样:按照随机原则从总体中抽取部分单随机抽样:按照随机原则从总体中抽取部分单位构成样本的过程。位构成样本的过程。(二二)统计估计:根据随机抽取的部分单位的特性来对统计估计:根据随机抽取的部分单位的特性来对总体的分布函数、分布参数或数字特征等进行推测估算的过程。总体的分布函数、分布参数或数字特征等进行推测估算的过程。(三三)假设检验:根据经验或认识,提出某一假设,并判断该假假设检验:根据经验或认识

4、,提出某一假设,并判断该假设正确性的过程。设正确性的过程。6三、抽样推断的作用三、抽样推断的作用(一一)解决了无法进行全面调查或很难进行解决了无法进行全面调查或很难进行全面调查的问题全面调查的问题(二二)可以补充或修正全面调查的数据可以补充或修正全面调查的数据(三三)可以节省调查费用和调查时间可以节省调查费用和调查时间7四、抽样推断涉及的基本概念四、抽样推断涉及的基本概念(一一)总体和样本总体和样本1全及总体(总体、母体)全及总体(总体、母体) 它是指调查对象的全部单位,是由具有某种共同性它是指调查对象的全部单位,是由具有某种共同性质的许多单位组成的。总体既是我们所要研究的对象,质的许多单位组

5、成的。总体既是我们所要研究的对象,又是样本所赖以抽取的母体。组成总体的单位称为又是样本所赖以抽取的母体。组成总体的单位称为总体单总体单位位,总体的单位数通常用,总体的单位数通常用N表示。表示。82抽样总体(样本、子样)抽样总体(样本、子样) 是指在总体中按随机原则抽取的那一部分是指在总体中按随机原则抽取的那一部分单位所构成的集合体。单位所构成的集合体。 组成样本的单位称为组成样本的单位称为样本单位样本单位,样本单位数亦称样本,样本单位数亦称样本容量,通常用容量,通常用n表示。样本单位数总是大于表示。样本单位数总是大于1而小于总体单而小于总体单位数位数N的,即的,即1nN。9 样本单位数样本单位

6、数n相对于总体的单位数相对于总体的单位数N要小得多。要小得多。统计把统计把nN称为抽样比例。样本单位数达到或超过称为抽样比例。样本单位数达到或超过30个个(n30)称为称为大样本大样本,而在,而在30个以下个以下(n30)称为称为小样本小样本。社会经济现象的抽样调查多取大样本,而自然实。社会经济现象的抽样调查多取大样本,而自然实验观察则多取小样本。以很小的样本来推断很大的总体,验观察则多取小样本。以很小的样本来推断很大的总体,这是抽样推断法的重要特点。这是抽样推断法的重要特点。10(二二)总体指标和抽样指标总体指标和抽样指标1总体指标总体指标总体指标是指根据总体各单位的标志值计算出来总体指标是

7、指根据总体各单位的标志值计算出来的,反映总体某种属性或特征的综合指标,亦称的,反映总体某种属性或特征的综合指标,亦称为总体参数。由于总体是惟一确定的,因此,根为总体参数。由于总体是惟一确定的,因此,根据总体计算的总体指标也是据总体计算的总体指标也是惟一确定惟一确定的。的。常用的总体指标有:常用的总体指标有:总体平均数、总体成数、总体标总体平均数、总体成数、总体标准差和总体方差。准差和总体方差。11X(1)总体平均数总体平均数代表总体单位数量标志一般水平的指标,它表明变代表总体单位数量标志一般水平的指标,它表明变量量变动的集中趋势,通常用变动的集中趋势,通常用 表示。表示。NXNXXXXXnii

8、n11.其中:其中:X1,X2,Xn为总体中每一为总体中每一 个调查单位的取值个调查单位的取值 N是总体单位数是总体单位数 是总和符号是总和符号12NNp1NNQ0(2)总体成数总体成数当总体的一个现象有两种表现时,其中具有某当总体的一个现象有两种表现时,其中具有某一种表现的单位数占总体单位数目的比重,叫一种表现的单位数占总体单位数目的比重,叫总体成数,用总体成数,用P或或Q表示。其计算公式为:表示。其计算公式为: N代表总体单位数;代表总体单位数; N1代表具有某一种表现的总体单位数;代表具有某一种表现的总体单位数; No代表具有另一种表现的总体单位数;代表具有另一种表现的总体单位数; P、

9、Q代表成数。代表成数。13PQNNNQPNNN110101则14例例1 某公司生产的某公司生产的10000件产品中,有件产品中,有500件件为不合格品。则为不合格品。则 产品不合格率产品不合格率 P N5001000050 产品合格率产品合格率 Q1P15095N115(3)总体标准差和总体方差。总体标准差和总体方差。 表示单位之间标志值的变异程度指标,叫做总表示单位之间标志值的变异程度指标,叫做总体标准差,又称体标准差,又称总体均方差(标准差)总体均方差(标准差)。总体标准差的。总体标准差的平方称为平方称为总体方差总体方差。其计算公式为:。其计算公式为:NXX2NXX22162.抽样指标抽样

10、指标抽样指标是指根据抽样总体各单位标志值计算的综合指抽样指标是指根据抽样总体各单位标志值计算的综合指标,又称样本指标。常用的抽样指标有:标,又称样本指标。常用的抽样指标有:抽样平均数、抽样平均数、抽样成数、抽样总体标准差和抽样总体方差。抽样成数、抽样总体标准差和抽样总体方差。17(1)抽样平均数。抽样平均数。代表样本单位数量标志一般水平的指标称抽样平代表样本单位数量标志一般水平的指标称抽样平均数或样本平均数。均数或样本平均数。nxnxxxxxniin1321.18(2)抽样成数。抽样成数。在抽样总体中,一个现象有两种表现时,其中具有在抽样总体中,一个现象有两种表现时,其中具有某一种表现的单位数

11、占抽样总体单位数的比重,叫某一种表现的单位数占抽样总体单位数的比重,叫做抽样成数,亦称样本成数。用做抽样成数,亦称样本成数。用p或或q表示。其计算表示。其计算公式为:公式为:nnp1nnq019同总体成数同总体成数p1q1)(0101则nnnqpnnn20例例52) 从某公司生产的产品中,抽样检查了从某公司生产的产品中,抽样检查了100件产品,其中有件产品,其中有5件不合格,则:件不合格,则: 样本产品不合格率样本产品不合格率 : 样本产品合格率样本产品合格率 %510051nnp%95%511pq21(3)抽样总体标准差和抽样总体方差。抽样总体标准差和抽样总体方差。说明抽样总体之间标志值变异

12、程度的指标,说明抽样总体之间标志值变异程度的指标,叫做抽样叫做抽样总体标准差总体标准差。抽样总体标准差的平方称为。抽样总体标准差的平方称为抽样总体方抽样总体方差差(简称样本方差)。其计算公式为:(简称样本方差)。其计算公式为:nxxs2nxxs2222 一个总体可以抽取许多个样本,而样本不同,一个总体可以抽取许多个样本,而样本不同,抽样指标的数值也各不相同。可见,抽样指标的数值也各不相同。可见,抽样指标的数抽样指标的数值不是惟一确定的值不是惟一确定的。因为抽样指标是样本变量的函数,。因为抽样指标是样本变量的函数,是随机可变的变量。也就是说,由是随机可变的变量。也就是说,由 样本观测值所决定的样

13、本观测值所决定的统计量是随机变量。统计量是随机变量。23 (三三)重复抽样和不重复抽样重复抽样和不重复抽样1重复抽样(重置抽样)重复抽样(重置抽样)采用这种方法抽取样本单位的特点是:同一单位采用这种方法抽取样本单位的特点是:同一单位有多次重复被抽中的机会,并且总体单位数目始有多次重复被抽中的机会,并且总体单位数目始终不变,每个单位抽中或抽不中的机会在各次都终不变,每个单位抽中或抽不中的机会在各次都是相同的。是相同的。242不重复抽样(不重置抽样)不重复抽样(不重置抽样)采用这种方法抽取样本单位的特点是:同一单位采用这种方法抽取样本单位的特点是:同一单位只有一次被抽中的机会,并且总体单位数目随着

14、只有一次被抽中的机会,并且总体单位数目随着样本单位数目抽取的次数的增多而愈变愈少。每样本单位数目抽取的次数的增多而愈变愈少。每个单位抽中或抽不中的机会在各次是不同的。个单位抽中或抽不中的机会在各次是不同的。25 抽样推断是通过样本对总体进行推算。其中,统计抽样推断是通过样本对总体进行推算。其中,统计量与被估算的总体指标之间的关系,是推算的关键。两量与被估算的总体指标之间的关系,是推算的关键。两者的关系主要通过统计量的分布来反映,且因样本量的者的关系主要通过统计量的分布来反映,且因样本量的大小而有差别。大小而有差别。第二节第二节 抽样推断的一般原理抽样推断的一般原理一、抽样推断的理论依据一、抽样

15、推断的理论依据26(一一)大样本统计量的推断依据大样本统计量的推断依据大数定律大数定律 在重复试验中,事件频率的稳定性是大量随机在重复试验中,事件频率的稳定性是大量随机现象的统计规律性的典型表现。人们根据频率的稳定性现象的统计规律性的典型表现。人们根据频率的稳定性预见到概率的存在和概率的性质,同样,在长期的统计预见到概率的存在和概率的性质,同样,在长期的统计实践中,人们也找到了大量随机现象的平均结果也具有实践中,人们也找到了大量随机现象的平均结果也具有稳定性的理论依据,即大数定律。稳定性的理论依据,即大数定律。27大数定律大数定律在统计中是指一切关于大量随机现象的平在统计中是指一切关于大量随机

16、现象的平均结果稳定性的定理,它为那些均值存在稳定性及均结果稳定性的定理,它为那些均值存在稳定性及整个统计推断提供了最基本的理论依据。整个统计推断提供了最基本的理论依据。大数定律的本质意大数定律的本质意义在于,尽管单个随机现象的具体表现不可避免地引起随机义在于,尽管单个随机现象的具体表现不可避免地引起随机偏差,然而在大量随机现象共同作用时,由于这些随机偏差偏差,然而在大量随机现象共同作用时,由于这些随机偏差互相抵消、补偿和拉平,致使总的平均结果趋于稳定。互相抵消、补偿和拉平,致使总的平均结果趋于稳定。28比雪夫大数定理:设比雪夫大数定理:设x1,x2,x3,xn为独立的随机为独立的随机变量序列,

17、服从同一分布,且具有相同的期望值变量序列,服从同一分布,且具有相同的期望值以及方差,则对于任意正数以及方差,则对于任意正数 有有1)1(lim1niinxnp29安徽理工大学统统 计计 学学第第 三十三三十三 讲讲主讲主讲 雷思友雷思友 副教授副教授/ /硕导硕导/ /系主任系主任30(二二)大样本统计量分布的依据一大样本统计量分布的依据一中心极限定理中心极限定理 中心极限定理是指在一定的条件下,大量相互中心极限定理是指在一定的条件下,大量相互独立的随机现象的概率分布是以正态分布为极限。因正独立的随机现象的概率分布是以正态分布为极限。因正态分布在概率论中占有中心地位,所以把该定理叫做中态分布在

18、概率论中占有中心地位,所以把该定理叫做中心极限定理。心极限定理。31大数定律只揭示了大量随机变量的平均结果,但并大数定律只揭示了大量随机变量的平均结果,但并没有涉及到随机变量的分布规律,而中心极限定理没有涉及到随机变量的分布规律,而中心极限定理则说明了许多随机变量的分布是正态或近似正态的。这则说明了许多随机变量的分布是正态或近似正态的。这就可以简化统计推断中许多统计量的分布问题,所以它就可以简化统计推断中许多统计量的分布问题,所以它是统计学中的重要工具之一。是统计学中的重要工具之一。32 二、抽样推断的原理二、抽样推断的原理 抽样估计就是以样本的实际资料为依据,计抽样估计就是以样本的实际资料为

19、依据,计算一定的样本指标,并以此对总体做出数量上的算一定的样本指标,并以此对总体做出数量上的估计和判断。其原理是:估计和判断。其原理是: (一一)抽样推断运用的是归纳推理方法抽样推断运用的是归纳推理方法抽样推断的方法是归纳法,而归纳法推断结论的正确性抽样推断的方法是归纳法,而归纳法推断结论的正确性必须过事实的验证。必须过事实的验证。33(二二)抽样推断运用的是概率原理抽样推断运用的是概率原理 抽样推断的结论,其可靠性究竟是多少,需要抽样推断的结论,其可靠性究竟是多少,需要运用概率的原理加以说明。运用概率的原理加以说明。(三(三)抽样推断的结论存在着一定的抽样误差抽样推断的结论存在着一定的抽样误

20、差抽样误差是抽样调查所特有的,而且是不可避免的。抽样误差是抽样调查所特有的,而且是不可避免的。34抽样推断结论的可靠程度和抽样推断结论的可靠程度和抽样误差抽样误差的大小是联的大小是联系在一起的。在其他条件不变的情况下,允许的系在一起的。在其他条件不变的情况下,允许的误差范围愈大,则概率的保证程度也愈大;反之,误差范围愈大,则概率的保证程度也愈大;反之,如果精确度的要求愈高,允许的误差范围愈小,则概率如果精确度的要求愈高,允许的误差范围愈小,则概率的保证程度也愈小。抽样误差范围可以事先通过的保证程度也愈小。抽样误差范围可以事先通过定资定资料加以计算,并能采取一定的组织措施来控制这个误差料加以计算

21、,并能采取一定的组织措施来控制这个误差范围,保证抽样推断的结果达到一定的可靠程度。范围,保证抽样推断的结果达到一定的可靠程度。35 三、抽样推断的优良标准三、抽样推断的优良标准(一一)无偏性无偏性用抽样指标推断总体指标要求抽样指标的平均数用抽样指标推断总体指标要求抽样指标的平均数等于被估计的总体指标。就是说,虽然每个可能等于被估计的总体指标。就是说,虽然每个可能样本的抽样指标不一定等于未知的总体指标,但在多次反复估样本的抽样指标不一定等于未知的总体指标,但在多次反复估计中,要求各个抽样指标的平均数应该等于总体指标,亦即从计中,要求各个抽样指标的平均数应该等于总体指标,亦即从平均来说,抽样指标的

22、估计是没有偏误的,叫做平均来说,抽样指标的估计是没有偏误的,叫做无偏性无偏性。36例如,样本平均数总是总体平均数例如,样本平均数总是总体平均数X的无偏估计量,亦即的无偏估计量,亦即样本平均数的平均数等于总体平均数。因为样本平均数的平均数等于总体平均数。因为XxEnxEnxExE)()()()(37(二)一致性二)一致性用抽样指标推断总体指标要求其样本的单位数充分用抽样指标推断总体指标要求其样本的单位数充分大时,抽样指标也充分地靠近总体指标。也可以说该抽大时,抽样指标也充分地靠近总体指标。也可以说该抽样指标对总体指标是一个一致估计量。样指标对总体指标是一个一致估计量。 381)(limxExnX

23、xE)(1)(limXxpn证明:设证明:设 为任意正数,根据大数定律有:为任意正数,根据大数定律有:抽样平均数的期望值等于总体平均数,即抽样平均数的期望值等于总体平均数,即39(三三)有效性有效性 用抽样指标推断总体指标时,要求作为优良估用抽样指标推断总体指标时,要求作为优良估计量的方差应比其他估计量的方差小。即用抽样计量的方差应比其他估计量的方差小。即用抽样平均数和总体某一变量来估计总体平均数,虽然两者都平均数和总体某一变量来估计总体平均数,虽然两者都是无偏的估计量,而且在每一次估计中两种估计量和总是无偏的估计量,而且在每一次估计中两种估计量和总体平均数都可能有离差,但样本平均数更靠近在总

24、体平体平均数都可能有离差,但样本平均数更靠近在总体平均数的周围,平均说来它的离差比较小,所以对比来说,均数的周围,平均说来它的离差比较小,所以对比来说,抽样平均数是更为优良的估计值抽样平均数是更为优良的估计值40第三节第三节 抽样估计抽样估计一、抽样误差的概念一、抽样误差的概念 1.由样本得到的估计值与被估计的总体未知真实特征值由样本得到的估计值与被估计的总体未知真实特征值之差,就是误差。或样本指标数值与总体指标数值之间的差之差,就是误差。或样本指标数值与总体指标数值之间的差数。数。 2.抽样误差就是指按随机原则抽样时,单纯由不同的随机抽样误差就是指按随机原则抽样时,单纯由不同的随机样本得出不

25、同的估计量而产生的误差。样本得出不同的估计量而产生的误差。413. 由于总体平均数和成数是惟一确定的,抽样平均由于总体平均数和成数是惟一确定的,抽样平均4. 数和成数则是随机变量,因而抽样误差也不是惟数和成数则是随机变量,因而抽样误差也不是惟5. 一确定的,而是随机变量。抽样误差愈小,表示样本一确定的,而是随机变量。抽样误差愈小,表示样本的代表性愈高;反之,样本的代表性就愈低。同样,抽的代表性愈高;反之,样本的代表性就愈低。同样,抽样误差还说明样本指标与总体指标的相差范围,因此,样误差还说明样本指标与总体指标的相差范围,因此,它也是推算总体的依据。它也是推算总体的依据。424.抽样误差是抽样调

26、查自身所固有的不可避免的误抽样误差是抽样调查自身所固有的不可避免的误差,虽然不能消除这种误差,但可以用数理统计方法进行计算差,虽然不能消除这种误差,但可以用数理统计方法进行计算确定其数量界限并加以控制,也就是根据研究的需要,把它控确定其数量界限并加以控制,也就是根据研究的需要,把它控制出所允许的范围以内。制出所允许的范围以内。43二、抽样平均误差二、抽样平均误差 (一一)抽样平均误差的含义抽样平均误差的含义 抽样平均误差是指一个抽样方案的所有可能样本的抽样平均误差是指一个抽样方案的所有可能样本的某统计量与总体相应指标的离差的平均值。纯随机抽样某统计量与总体相应指标的离差的平均值。纯随机抽样平均

27、误差的定义关系式如下:平均误差的定义关系式如下:所有可能的样本个数望值)(各种样本统计量期抽样平均误差244上式表明了抽样平均误差的含义,并不能作为计算公上式表明了抽样平均误差的含义,并不能作为计算公式。因为:式。因为:1.在现实的抽样中,我们只能取得一个样在现实的抽样中,我们只能取得一个样本,不可能也没必要获得全部所有可能样本,所以抽本,不可能也没必要获得全部所有可能样本,所以抽样平均误差也不可能通过所有样本来直接计算。样平均误差也不可能通过所有样本来直接计算。2.统计量的分布律中我们已经知道:统计量是以总体相应指统计量的分布律中我们已经知道:统计量是以总体相应指标为期望值,抽样平均误差实质

28、上就是该统计量在其概率分标为期望值,抽样平均误差实质上就是该统计量在其概率分布中的标准差。布中的标准差。45 (二二)抽样平均误差的计算抽样平均误差的计算 1抽样平均数的平均误差抽样平均数的平均误差 (1)在重复抽样的条件下总体方差已知,样本平均)在重复抽样的条件下总体方差已知,样本平均数服从正态分布,其抽样平均数的平均误差计算公式为:数服从正态分布,其抽样平均数的平均误差计算公式为:nnx246由上式可以看出,由上式可以看出,抽样平均数的平均误差就是抽样平抽样平均数的平均误差就是抽样平均数均数 的标准差。的标准差。抽样平均误差和总体标准差是成正比的,与抽样平均误差和总体标准差是成正比的,与样

29、本单位数的平方根成反比。因此,要想减少抽样平均误差样本单位数的平方根成反比。因此,要想减少抽样平均误差以提高抽样指标的代表性,只能增大样本单位数以提高抽样指标的代表性,只能增大样本单位数n,因为总体,因为总体标准差是不能改变的。标准差是不能改变的。47(2)在不重复抽样的条件下,抽样平均数的平)在不重复抽样的条件下,抽样平均数的平均误差计算公式为:均误差计算公式为: 当总体单位数当总体单位数N很大时,公式中的很大时,公式中的N1可以用可以用N代替。代替。)1(2NnNnx48在实际计算时,不重复抽样的抽样平均数的平均误在实际计算时,不重复抽样的抽样平均数的平均误差可用下式计算:差可用下式计算:

30、)1(2Nnnx49 2成数的平均误差成数的平均误差统计成数统计成数(比重比重)是一种结构相对数,它实际属于是非是一种结构相对数,它实际属于是非标志平均数的特例。统计上习惯以标志平均数的特例。统计上习惯以1表示表示“是是”,以,以0表表示示“非非”。p为为1的概率,的概率,q1p为为0的概率。成数的方差是的概率。成数的方差是P(1P)其特点为,最大值为其特点为,最大值为025(0.50.5),即当两种表现,即当两种表现的总体单位各占一半时,它的变异程度最大。的总体单位各占一半时,它的变异程度最大。50当当N很大时,以很大时,以N代替代替N1,则可简化为:,则可简化为:)1()1(Nnnppp5

31、1在重复抽样条件下,其计算公式为:在重复抽样条件下,其计算公式为:nppp)1(在不重复抽样条件下,其计算公式为:在不重复抽样条件下,其计算公式为:)1 ()1 (Nnnppp52例例3某公司生产一批灯泡,共某公司生产一批灯泡,共1000只,从中随机抽取只,从中随机抽取100只,测其寿命平均为只,测其寿命平均为1000小时,样本标准差为小时,样本标准差为610小小时,计算其抽样误差。时,计算其抽样误差。按重复抽样计算:按重复抽样计算:(小时)61006022nsx53按不重复抽样计算:按不重复抽样计算:小时)(69.5)10001001(10060)1(22Nnnsx54例例54 某公司有员工

32、某公司有员工10000人,从中随机抽选人,从中随机抽选1000人调查电脑的拥有率,发现人调查电脑的拥有率,发现50家有,问这一调查的抽样家有,问这一调查的抽样误差为多少?误差为多少?解:解:p5010000.05按重复抽样计算:按重复抽样计算:%69.0100095.005.0)1(nppp55按不重复抽样计算:%65.0)1000010001(100095.005.0)1()1(Nnnppp56(三)极限误差三)极限误差极限误差是指抽样推断中依一定的概率保证下的误极限误差是指抽样推断中依一定的概率保证下的误差的最大范围。差的最大范围。1.抽样平均数的极限误差:抽样平均数的极限误差:xXxxX

33、Xxx571.抽样成数的极限误差:抽样成数的极限误差:PpppPPpp58ppppPxxXxxxXxxX同理:59(四)抽样估计的可靠程度(四)抽样估计的可靠程度抽样极限误差通常是以抽样平均误差为标准单位来衡量抽样极限误差通常是以抽样平均误差为标准单位来衡量的,即:的,即:pptxxt;60抽样极限误差也可以表示为抽样平均误差的若干倍,其抽样极限误差也可以表示为抽样平均误差的若干倍,其倍数即概率度倍数即概率度t:ntntxtXxx261同理:nPPtptPpp)1(62例例5.5某农场种植小麦某农场种植小麦5000亩,收获前夕随机抽取亩,收获前夕随机抽取25亩进行实割实测,测得平均亩产亩进行实

34、割实测,测得平均亩产500千克,标准差为千克,标准差为50千克,试求全部千克,试求全部5000亩小麦的平均亩产在亩小麦的平均亩产在480千克至千克至520千克之间的概率。千克之间的概率。9545.0)2(20500X20500p210500480t102550nsxxx)(解:F63三、影响抽样误差的因素三、影响抽样误差的因素 (一一)抽样单位数目的多少抽样单位数目的多少 (二二)总体被研究的标志的变异程度总体被研究的标志的变异程度 (三三)抽样方法和组织形式的不同抽样方法和组织形式的不同64四、抽样估计四、抽样估计(一一)抽样估计的现实意义抽样估计的现实意义 社会经济统计的认识对象是现象总体

35、的数量方面,社会经济统计的认识对象是现象总体的数量方面,理应搜集现象总体的全面资料,再依据统计目的研究其总体的理应搜集现象总体的全面资料,再依据统计目的研究其总体的数量特征,以获得总体本质及其规律性的认识。但在实际工作数量特征,以获得总体本质及其规律性的认识。但在实际工作中,由于受客观条件或环境的限制,往往不可能或没必要搜集中,由于受客观条件或环境的限制,往往不可能或没必要搜集总体的全面资料,只可能或只需要利用样本资料估计总体的数总体的全面资料,只可能或只需要利用样本资料估计总体的数量特征或推算总体的总量指标,这就是抽样估计。量特征或推算总体的总量指标,这就是抽样估计。65(二二)抽样估计的方

36、法抽样估计的方法 抽样估计有两种方法:点估计和区间估计。抽样估计有两种方法:点估计和区间估计。 点估计点估计也叫定值估计,它是以抽样得到的样本指也叫定值估计,它是以抽样得到的样本指标作为总体指标的估计值,同时给出极限误差和相应的可标作为总体指标的估计值,同时给出极限误差和相应的可靠程度的一种估计方法。在实践中,对总体的特征值靠程度的一种估计方法。在实践中,对总体的特征值(如平如平均数、成数等均数、成数等)估计,主要借助于点估计,具体表示点估计估计,主要借助于点估计,具体表示点估计是用样本数据计算出估计值,同时给出估计精度和相应的是用样本数据计算出估计值,同时给出估计精度和相应的可靠程度。可靠程

37、度。66区间估计区间估计是根据一定的精确度和可靠程度的要求,是根据一定的精确度和可靠程度的要求,用样本指标和抽样误差去推断总体指标的可能范围用样本指标和抽样误差去推断总体指标的可能范围的一种估计方法。由于点估计量与总体的未知参数并不完全相的一种估计方法。由于点估计量与总体的未知参数并不完全相等,故它们之间必然存在着一定的误差,并且不能确知误差的等,故它们之间必然存在着一定的误差,并且不能确知误差的大小、估计精度的高低以及估计的可信程度等信息。为此区间大小、估计精度的高低以及估计的可信程度等信息。为此区间估计将考虑这些因素,即根据样本统计量及估计的可能误差,估计将考虑这些因素,即根据样本统计量及

38、估计的可能误差,找出在一定保证程度下的估计区间,即置信区间。找出在一定保证程度下的估计区间,即置信区间。67对总体平均数对总体平均数(或总体成数或总体成数)的估计有两种情形:的估计有两种情形:(一)根据已经给定的极限抽样误差范围,求概率(一)根据已经给定的极限抽样误差范围,求概率保证程度保证程度F(t),进而进行点估计和区间估计。,进而进行点估计和区间估计。 1.抽取样本,计算样本平均数抽取样本,计算样本平均数(或样本成数或样本成数),作为总体平均数,作为总体平均数(或总体成数或总体成数)的估计值,并计算样本标准差的估计值,并计算样本标准差S,以此推算抽样,以此推算抽样平均误差。平均误差。68

39、2.根据给定的抽样极限误差范围,估计总体平均数根据给定的抽样极限误差范围,估计总体平均数(或总体成数或总体成数)的下限的下限 (或或 )和上限和上限 (或或 )。3.将抽样极限误差除以抽样平均误差将抽样极限误差除以抽样平均误差,求出概率度求出概率度t值,再根值,再根t值查概率表求出相应的可信度值查概率表求出相应的可信度F(t)。 4.进行区间估计和点估计。进行区间估计和点估计。XXPPXXPP69例例55) 某糖厂有一台自动包糖机,包装重量为某糖厂有一台自动包糖机,包装重量为50kg。现对包装的白糖重量进行检验,每生产。现对包装的白糖重量进行检验,每生产10袋抽取袋抽取1袋。某日糖厂共包装袋。

40、某日糖厂共包装300袋,抽取的袋,抽取的30袋资料如下,若根据袋资料如下,若根据质量要求,每袋糖的极限误差不大于质量要求,每袋糖的极限误差不大于120g,试估计该机器的,试估计该机器的包装精度。包装精度。70重量(kg)x袋数f49.449.649.850.050.250.450.650.813575441合计3071(1)计算样本平均数和标准差,并推算平均误差:)计算样本平均数和标准差,并推算平均误差:349.03066.31.503015032ffxxsfxfx72(2)根据给定的极限误差)根据给定的极限误差0.12kg,计算总体,计算总体平均数的上限和下限:平均数的上限和下限:98.49

41、12.01.50 x22.5012.01.50 xxx下限上限73(3)9545.02p206.012.0t06.030349.0nsxxx)(,F74 ( 4)点估计:该包装机平均包装重量为)点估计:该包装机平均包装重量为50.1kg,误差不大于,误差不大于120g的可靠程度为的可靠程度为9545 区间估计:在区间估计:在9545的可靠程度下,估计该包装的可靠程度下,估计该包装机包装的平均重量在机包装的平均重量在49.98-50.22kg之间。之间。75例例57 某公司设计一种新式产品,为了预测销某公司设计一种新式产品,为了预测销路,随机抽取了路,随机抽取了900人进行了调查,结果有人进行了

42、调查,结果有720人人表示可以购买。如果要求极限误差不超过表示可以购买。如果要求极限误差不超过35,试估计该产品可以销售的比率。试估计该产品可以销售的比率。 (1)根据样本资料,计算样本成数及平均误差:)根据样本资料,计算样本成数及平均误差:)(33.190040402.08.0p1ps80900720nnpp176(2)根据给定的极限误差)根据给定的极限误差3.5,计算:,计算:%5.76%5.3%80%5.83%5.3%80下限上限PPPP)(992.58(p58.233.15.3t3F77 (4)点估计:估计该产品的销售率为)点估计:估计该产品的销售率为80,其误差不大于其误差不大于3.

43、5的可靠程度为的可靠程度为99。 区间估计:在区间估计:在99的保证程度下,估计该产品销售率的保证程度下,估计该产品销售率在在76.5-83.5之间。之间。78(二)根据给定的可信度(二)根据给定的可信度F(t),求出极限抽样误差,求出极限抽样误差,进而进行点估计和区间估计。具体步骤是:进而进行点估计和区间估计。具体步骤是: 1.抽取样本,计算样本平均数抽取样本,计算样本平均数(或样本成数或样本成数)作为总体作为总体平均数平均数(或总体成数或总体成数)的估计值,并计算样本标准差的估计值,并计算样本标准差S,以,以此推算抽样平均误差。此推算抽样平均误差。792.根据给定的可信度根据给定的可信度F

44、(t)的要求,查概率表求得概的要求,查概率表求得概率度率度t值。值。3.根据概率度和抽样平均误差计算抽样极限误差的可能根据概率度和抽样平均误差计算抽样极限误差的可能范围,并据以计算被估计的总体平均数范围,并据以计算被估计的总体平均数(或总体成数或总体成数)的上、的上、下限。下限。 4.进行点估计和区间估计。进行点估计和区间估计。80例例5.8 从全校近万名学生中,随机抽取从全校近万名学生中,随机抽取100名学生名学生的平均身高为的平均身高为160cm,根据计算,学生身高的标准,根据计算,学生身高的标准差为差为3cm。现要求可信度要达到。现要求可信度要达到9545,试对全,试对全体学生的平均身高

45、进行估计。体学生的平均身高进行估计。3.01000010011003n1ns3s160 x122xN,)已知解:(81(2)根据给定的可信度根据给定的可信度F(t):9545,查概率表,查概率表t=2(3)计算极限误差和平均身高的上下限:计算极限误差和平均身高的上下限: 上限上限160+0.6160.6cm 下限下限160-0.6159.4cm6.03.02txX82 (4)点估计:该校学生平均身高为点估计:该校学生平均身高为160cm其误差其误差不大于不大于0.6cm的可靠性为的可靠性为9545。 区间估计:在区间估计:在9545的保证程度下,该校学生的平的保证程度下,该校学生的平均身高为均

46、身高为159.4160.6cm之间。之间。83第四节第四节 抽样的组织形式抽样的组织形式 一、抽样的组织方式一、抽样的组织方式 抽样组织方式按抽样组织方式按抽样时对总体的加工整理形式抽样时对总体的加工整理形式不同,不同,分为简单随机抽样、类型抽样、等距抽样和整群抽样。分为简单随机抽样、类型抽样、等距抽样和整群抽样。84(一一)简单随机抽样简单随机抽样1简单随机抽样的含义简单随机抽样的含义 简单随机抽样又称为纯随机抽样,它是不对总体做任简单随机抽样又称为纯随机抽样,它是不对总体做任何加工整理,直接从总体中抽取调查单位的抽样方式。必须满足何加工整理,直接从总体中抽取调查单位的抽样方式。必须满足下列

47、两条要求:下列两条要求:代表性,即要求样本分布与总体分布相同;代表性,即要求样本分布与总体分布相同;独立性,即要求样本各个单位相互独立。独立性,即要求样本各个单位相互独立。852简单随机的抽样方法简单随机的抽样方法 (1)抽签法。适合用于总体单位数较少的总体。抽签法。适合用于总体单位数较少的总体。 (2)随机数表法。适合用于大规模的社会经济调查。随机数表法。适合用于大规模的社会经济调查。 (3)简单随机抽样的平均误差简单随机抽样的平均误差nnx2nppp)1(86(二二)类型抽样类型抽样 1类型抽样的含义类型抽样的含义 类型抽样又称为分层抽样或分类抽样,它是将总体单类型抽样又称为分层抽样或分类

48、抽样,它是将总体单位先按一定标志分组,然后在各组中随机抽取样本的抽样组织位先按一定标志分组,然后在各组中随机抽取样本的抽样组织方式。类型抽样是应用于总体内各单位在被研究标志上有明显方式。类型抽样是应用于总体内各单位在被研究标志上有明显差别的抽样。主要原则是:分组时应使组内差异尽可能小,使差别的抽样。主要原则是:分组时应使组内差异尽可能小,使组间差异尽可能大。组间差异尽可能大。87 2类型抽样的方法类型抽样的方法(1)等比例抽样等比例抽样:按同样的抽样比按同样的抽样比nN,确定各组中应,确定各组中应抽的样本单位数,如各组单位数为抽的样本单位数,如各组单位数为N,则从中抽取,则从中抽取的样本单位为

49、的样本单位为N1(其其nN相等相等),各组样本单位数确定后,按随,各组样本单位数确定后,按随机原则从各组中抽取各类单位组成样本。机原则从各组中抽取各类单位组成样本。 (2)不等比例抽样多指某类单位在总体中占的比重过小时,对其不等比例抽样多指某类单位在总体中占的比重过小时,对其按比例抽不到或只能抽到很少数量,为了保证样本中各类单位按比例抽不到或只能抽到很少数量,为了保证样本中各类单位的代表性而采取不等比例抽样的方法。的代表性而采取不等比例抽样的方法。88(三三)等距抽样等距抽样 1等距抽样的概念等距抽样的概念 等距抽样又称为机械抽样或系统抽样。它是先将等距抽样又称为机械抽样或系统抽样。它是先将总

50、体各单位按有关标志或无关标志进行排列,再按照固定的顺总体各单位按有关标志或无关标志进行排列,再按照固定的顺序和间隔来抽选样本单位的一种抽样组织形式。序和间隔来抽选样本单位的一种抽样组织形式。 等距抽样是不重复抽样,通常可以保证被抽取的单位在总体等距抽样是不重复抽样,通常可以保证被抽取的单位在总体中均匀分布,缩小各单位之间的差异程度,提高样本的代表性。中均匀分布,缩小各单位之间的差异程度,提高样本的代表性。892抽样方法抽样方法 (1)无关标志排队法无关标志排队法:就是指总体单位采用与调查项:就是指总体单位采用与调查项目没有关系的标志进行排队的方法。目没有关系的标志进行排队的方法。 (2)有关标

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 管理文献 > 其他资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com