社会调查方法抽样.ppt

上传人:石*** 文档编号:49404844 上传时间:2022-10-08 格式:PPT 页数:77 大小:5.13MB
返回 下载 相关 举报
社会调查方法抽样.ppt_第1页
第1页 / 共77页
社会调查方法抽样.ppt_第2页
第2页 / 共77页
点击查看更多>>
资源描述

《社会调查方法抽样.ppt》由会员分享,可在线阅读,更多相关《社会调查方法抽样.ppt(77页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、社会社会调查方法抽方法抽样现在学习的是第1页,共77页社会调查方法社会调查方法开篇案例 我们知道,近几十年来,美国总统大选前夕,总有一些民意测验机构喜欢对总统选择投票的结果进行预测。1936年美国总统选举前夕,盖洛普民意测验所仅仅调查了3000人,就成功地预测了民主党人罗斯福将当选为美国的新一任总统。1984年这家民意测验机构又一次成功地预测了罗纳得里根将以59%比41%的优势战胜蒙代尔而当选为美国的新一任总统。这一预测结果与实际投票结果(59%:41%)相一致。而当时盖洛普民意测验所在将近1亿美国选民中,调查的对象还不到2000人。现在学习的是第2页,共77页社会调查方法社会调查方法案例20

2、04年美国大选主要民调样本数调查机构调查机构样本量样本量福克斯新闻福克斯新闻 1200 1200 盖洛普盖洛普 1573 1573 全国广播公司全国广播公司/华尔街日报华尔街日报 1014 1014 哥伦比亚广播公司哥伦比亚广播公司/纽约时报纽约时报 939 939 美国广播公司美国广播公司/华盛顿邮报华盛顿邮报 939 939 新闻周刊新闻周刊 882882现在学习的是第3页,共77页社会调查方法社会调查方法51.3451.3448.3148.3120042004年美国总统大选一周前民调结果年美国总统大选一周前民调结果现在学习的是第4页,共77页社会调查方法社会调查方法抽样与我们的生活抽样与

3、我们的生活v生活中充满了抽样 冬泳之前,用脚尖试探一下水温;做菜时,用勺子舀起一些试试味道浓了还是淡了;在书店挑选一本营销调研的书籍,随手拿起一本,翻看其中几页以决定是否购买;体检时抽一试管的血看看身体血液情况;现在学习的是第5页,共77页社会调查方法社会调查方法为什么需要抽样?为什么需要抽样?v一些实验本质上是破坏性的v物理上不具备考察总体所有项目的可能性v对总体每一项目逐一考察费用过高v对总体每一项目逐一考察相当耗时v样本结论充分性现在学习的是第6页,共77页社会调查方法社会调查方法抽样方法论抽样方法论v抽样过程就是使用少量项目或者总体的一部分得出关于整个总体的结论v样本(sample)是

4、一个更大的总体的子集或一部分v抽样的目的在于帮助我们对总体的一些未知特征进行估计现在学习的是第7页,共77页社会调查方法社会调查方法抽样的有关术语抽样的有关术语抽样的基本程序抽样的基本程序抽样类型(方法)抽样类型(方法)样本规模与抽样误差样本规模与抽样误差1234现在学习的是第8页,共77页社会调查方法社会调查方法一、抽样的有关术语1 1、总体总体(PopulationPopulation)()(此指调查总体)(此指调查总体)(在社会调查中用在社会调查中用N N表示)表示)通常与构成的元素共同定义,总体是构成它的所有元素的集合,而元素则是构成总体通常与构成的元素共同定义,总体是构成它的所有元素

5、的集合,而元素则是构成总体的基本单位。的基本单位。(1)(1)研究总体:是在理论上明确界定的个体(分析单位)集合体。(是理论上的研究总体:是在理论上明确界定的个体(分析单位)集合体。(是理论上的总体)总体)(2)(2)调查总体:是研究者实际抽样样本的个体(分析单位)的集合体。(是实际操作中的总体)调查总体:是研究者实际抽样样本的个体(分析单位)的集合体。(是实际操作中的总体)二者不同:研究总体是我们概念上的,而调查总体是我们实际抽取样本的集合。二者不同:研究总体是我们概念上的,而调查总体是我们实际抽取样本的集合。二者二者关系:关系:调查总体调查总体应当无限趋近直至等于应当无限趋近直至等于研究总

6、体研究总体。如:开展对某省大学生择业倾向调查时,该省所有在校大学生的集合就是如:开展对某省大学生择业倾向调查时,该省所有在校大学生的集合就是研究研究总体,每总体,每个在校大学生就是构成总体的元素。该省所有在个在校大学生就是构成总体的元素。该省所有在册大册大学生学生则构成调查总体。则构成调查总体。2 2、样本样本(SampleSample)(社会调查中用)(社会调查中用n n表示)表示)是从调查总体中按一定方式抽取出来的那一部分代表的集合体。是从调查总体中按一定方式抽取出来的那一部分代表的集合体。现在学习的是第9页,共77页社会调查方法社会调查方法3.3.抽样(抽样(SamplingSampli

7、ng)是一种选择调查对象的程序与方法,即从总体中选取一部分代表的过程,也即从总体中按是一种选择调查对象的程序与方法,即从总体中选取一部分代表的过程,也即从总体中按一定方式选择或抽取样本的过程。一定方式选择或抽取样本的过程。如:从某省总数为如:从某省总数为1010万人的大学生总体中按照一定方式抽取出万人的大学生总体中按照一定方式抽取出10001000名大学生进行调查,名大学生进行调查,这这10001000名大学生就是构成总体的一个样本。(名大学生就是构成总体的一个样本。(从一个总体中可以抽取出若干个不同的样从一个总体中可以抽取出若干个不同的样本本)4.4.抽样单位抽样单位(Sampling Un

8、it)(Sampling Unit)一次直接的抽样所使用的基本单位。抽样单位和构成总体的元素有时相同,一次直接的抽样所使用的基本单位。抽样单位和构成总体的元素有时相同,有时不同。有时不同。5.5.抽样框抽样框(Sampling FrameSampling Frame)也称抽样范围,指抽取样本的所有抽样单位的名单。也称抽样范围,指抽取样本的所有抽样单位的名单。如:从某所大学全体学生中直接抽取如:从某所大学全体学生中直接抽取200200名学生作为样本名学生作为样本该校全体学生的名单该校全体学生的名单 从某一所大学所有班级中抽取从某一所大学所有班级中抽取3 3个班级作为样本个班级作为样本该校所有班级

9、的名单该校所有班级的名单现在学习的是第10页,共77页社会调查方法社会调查方法6.6.参数值参数值(Parameter)(Parameter)也称总体值,是关于总体中某一变量的综合描述。也称总体值,是关于总体中某一变量的综合描述。如:某厂职工的平均收入、平均年龄如:某厂职工的平均收入、平均年龄7.7.统计值统计值(StatisticStatistic)也称样本值,是关于样本中某一变量的综合描述。也称样本值,是关于样本中某一变量的综合描述。如:某厂职工中抽取出一部分,得到的平均收入、平均年龄如:某厂职工中抽取出一部分,得到的平均收入、平均年龄参数值与统计值之间的区别与联系:参数值与统计值之间的区

10、别与联系:(1)(1)参数值是确定不变的、唯一的,并且通常是未知的。参数值是确定不变的、唯一的,并且通常是未知的。(2)(2)统计值则是变化的,即对于同一个总体来说,不同样本所得到的统计值常常是有差别的;统计值则是变化的,即对于同一个总体来说,不同样本所得到的统计值常常是有差别的;对于某一个特定的样本来说,统计值是已知的,是可以通过计算得到的。对于某一个特定的样本来说,统计值是已知的,是可以通过计算得到的。(3)(3)联系:通过样本统计值可以推算总体参数值,从而达到调查部分以认识总体的目的。这就联系:通过样本统计值可以推算总体参数值,从而达到调查部分以认识总体的目的。这就是抽样调查的作用所在。

11、是抽样调查的作用所在。现在学习的是第11页,共77页社会调查方法社会调查方法8.8.抽样误差抽样误差(Sampling ErrorSampling Error)是指在用样本统计值去推估总体参数值时所存在的偏差。它是由抽样本身的是指在用样本统计值去推估总体参数值时所存在的偏差。它是由抽样本身的随机性引起的,是不可避免的。但是抽样误差的大小是控制的。随机性引起的,是不可避免的。但是抽样误差的大小是控制的。抽样误差的意义:是衡量样本代表性好坏的标准,抽样误差越小,说抽样误差的意义:是衡量样本代表性好坏的标准,抽样误差越小,说明样本的代表性越好,反之,则越不好。明样本的代表性越好,反之,则越不好。现在

12、学习的是第12页,共77页社会调查方法社会调查方法9.9.置信水平与置信区间置信水平与置信区间(1 1)置信水平()置信水平(Confidence LevelConfidence Level)也称置信度,指的是总体参数值落在样本统计值某一区间内的概率。也称置信度,指的是总体参数值落在样本统计值某一区间内的概率。(2 2)置信区间()置信区间(Confidence IntervalConfidence Interval)是指在一定范围的置信水平下,样本统计值与总体参数值之间的误差范围是指在一定范围的置信水平下,样本统计值与总体参数值之间的误差范围(3 3)置信水平与)置信水平与置信区间的关系的关

13、系置信水平反映的是抽样的可靠性程度,置信区间反映的是抽样的精确性程度。置信水平反映的是抽样的可靠性程度,置信区间反映的是抽样的精确性程度。在其他条件不变的情况下,置信水平越高,置信区间越大;置信水平越低,置信在其他条件不变的情况下,置信水平越高,置信区间越大;置信水平越低,置信区间越小。对抽样的可靠性程度要求越高,抽样的精确性程度将越低;对抽样的区间越小。对抽样的可靠性程度要求越高,抽样的精确性程度将越低;对抽样的可靠性程度要求越低,则抽样的精确性程度将越高。可靠性程度要求越低,则抽样的精确性程度将越高。现在学习的是第13页,共77页社会调查方法社会调查方法抽样的有关术语抽样的有关术语抽样的基

14、本程序抽样的基本程序抽样类型(方法)抽样类型(方法)样本规模与抽样误差样本规模与抽样误差1234现在学习的是第14页,共77页社会调查方法社会调查方法二、抽样的基本程序二、抽样的基本程序(一)界定总体(一)界定总体 即在具体抽样前,对从中抽取样本的总体范围作出明确的界定。即在具体抽样前,对从中抽取样本的总体范围作出明确的界定。为什么要对总体进行界定?为什么要对总体进行界定?原因之一:是由抽样调查的目的决定的,其目的是调查部分以反映原因之一:是由抽样调查的目的决定的,其目的是调查部分以反映总体。总体。原因之二:界定总体是达到良好的抽样效果的前提条件。原因之二:界定总体是达到良好的抽样效果的前提条

15、件。例如:例如:1936 1936年美国总统大选前文学文摘杂志的抽样年美国总统大选前文学文摘杂志的抽样 现在学习的是第15页,共77页社会调查方法社会调查方法思考思考 美国的文学文摘是一本美国的文学文摘是一本18901890年年19381938年间在美国发行颇为流行的新闻杂年间在美国发行颇为流行的新闻杂志。志。19201920年、年、19241924、19281928、19321932年的美国总统大选前都作出了准确的预测。年的美国总统大选前都作出了准确的预测。19361936,文学文摘进行了一次最具雄心的民意测验活动:选票寄给了从,文学文摘进行了一次最具雄心的民意测验活动:选票寄给了从电话簿电

16、话簿与车与车牌登记单中挑选出来的牌登记单中挑选出来的10001000万人。收到了万人。收到了200200万人以上的回应;结果显示,有万人以上的回应;结果显示,有57%57%人支持共产党候选人阿尔夫人支持共产党候选人阿尔夫兰登,而当时在任的美国总统富兰克林兰登,而当时在任的美国总统富兰克林罗斯福的罗斯福的支持率为支持率为43%43%。两个星期以后全民选举的结果出来了,罗斯福以历史上最大的优势两个星期以后全民选举的结果出来了,罗斯福以历史上最大的优势61%61%的得票率的得票率获得第二届任期。获得第二届任期。v思考:为什么文学文摘的预测会失败?思考:为什么文学文摘的预测会失败?现在学习的是第16页

17、,共77页社会调查方法社会调查方法(二)选择抽样的具体方法,确定抽样的精确性程度与样本规模(二)选择抽样的具体方法,确定抽样的精确性程度与样本规模如何确定抽样的精确性和样本规模(待)如何确定抽样的精确性和样本规模(待)(三)制作抽样框(回顾什么是抽样框)(三)制作抽样框(回顾什么是抽样框)当采用一次性抽样时,应依据已经明确界定的总体范围,收集总当采用一次性抽样时,应依据已经明确界定的总体范围,收集总体中全部抽样单位的名单,并对名单按随机原则进行统一编号,体中全部抽样单位的名单,并对名单按随机原则进行统一编号,建立起供抽样使用的抽样框。建立起供抽样使用的抽样框。例如:我们要在浙江工业大学进行一项

18、该校学生职业观的抽样例如:我们要在浙江工业大学进行一项该校学生职业观的抽样调查。调查。注意:当采取多级抽样时,则需制作多个抽样框。注意:当采取多级抽样时,则需制作多个抽样框。例如:为了了解某市小学生的学习情况,需要从全市例如:为了了解某市小学生的学习情况,需要从全市500500所小学中所小学中抽取抽取500500名小学生调查。名小学生调查。现在学习的是第17页,共77页社会调查方法社会调查方法准确的抽样框原则:准确的抽样框原则:1 1、完整性、完整性2 2、不重复性、不重复性 例如:例如:在城市居民户的抽样中,会经常出现一户有多处住房的情况,这样在城市居民户的抽样中,会经常出现一户有多处住房的

19、情况,这样很容易把一户重复列入抽样框,使得他们在抽样中的中选概率高于很容易把一户重复列入抽样框,使得他们在抽样中的中选概率高于其他居民,相反,许多城市居民居住条件比较差,很多居民同住在其他居民,相反,许多城市居民居住条件比较差,很多居民同住在一个门牌号中,因此很容易遗漏。两种情况均违背了随机抽样的等一个门牌号中,因此很容易遗漏。两种情况均违背了随机抽样的等概率原则。概率原则。现在学习的是第18页,共77页社会调查方法社会调查方法(四)实际抽取样本(四)实际抽取样本 即在前进几个步骤的基础上,严格按照所选定的抽样方法,从抽样框中抽取一个个抽即在前进几个步骤的基础上,严格按照所选定的抽样方法,从抽

20、样框中抽取一个个抽样单位,构成调查样本。样单位,构成调查样本。(五)评估样本质量(五)评估样本质量 所谓样本评估,就是对样本的质量、代表性、偏差等进行初步的检验和衡量,其目的所谓样本评估,就是对样本的质量、代表性、偏差等进行初步的检验和衡量,其目的是防止由于前面步骤中的失误而使样本偏差太大,进而导致整个调查的失误。是防止由于前面步骤中的失误而使样本偏差太大,进而导致整个调查的失误。评估样本的基本方法评估样本的基本方法:将可得到的反映总体中某些重要特征及其分布的资料与样本中的:将可得到的反映总体中某些重要特征及其分布的资料与样本中的同类指标的资料进行对比。若二者之间的差别很小,则可认为样本的质量

21、较高,代表性较同类指标的资料进行对比。若二者之间的差别很小,则可认为样本的质量较高,代表性较好;反之,若二者之间的差别十分明显,则表明样本的质量和代表性不可能高。因而需要好;反之,若二者之间的差别十分明显,则表明样本的质量和代表性不可能高。因而需要对前面的抽样步骤进行检查、修正,直到抽出质量较高、代表性较好的样本为止。对前面的抽样步骤进行检查、修正,直到抽出质量较高、代表性较好的样本为止。现在学习的是第19页,共77页社会调查方法社会调查方法例如:例如:从我从我校校30003000名学生中抽取名学生中抽取300300名学生作为样本。同时,我们从学名学生作为样本。同时,我们从学校校教务处或学生处

22、得到下列统计资料:全教务处或学生处得到下列统计资料:全校校男生男生占学生总数的占学生总数的53%53%,女生占,女生占47%47%;本市学生占本市学生占40%40%,外省学生占,外省学生占60%60%。那么,我。那么,我们可以对抽出的们可以对抽出的300300名学生进行这两方面分布情况的统计。假定样本名学生进行这两方面分布情况的统计。假定样本统计得到的结果是:统计得到的结果是:男生占男生占52%52%,女生占女生占48%48%;本市学生占本市学生占41%41%,外省外省学生占学生占59%59%。两相对比,可以发现二者之间的差距很小,这就。两相对比,可以发现二者之间的差距很小,这就在一定程度上说

23、明,样本的质量较高,代表性较好,从这样在一定程度上说明,样本的质量较高,代表性较好,从这样的样本中得到的结果往往能较好地反映和体现总体的情况。的样本中得到的结果往往能较好地反映和体现总体的情况。现在学习的是第20页,共77页社会调查方法社会调查方法抽样的有关术语抽样的有关术语抽样的基本程序抽样的基本程序抽样类型(方法)抽样类型(方法)样本规模与抽样误差样本规模与抽样误差1234现在学习的是第21页,共77页社会调查方法社会调查方法三、抽样类型 根据调查总体中每一个个体有无同等的机会入选样本,可以根据调查总体中每一个个体有无同等的机会入选样本,可以将抽样分为概率抽样与非概率抽样两大类。将抽样分为

24、概率抽样与非概率抽样两大类。概率抽样概率抽样是依据概率论的原理,按照是依据概率论的原理,按照等概率原则等概率原则进行的抽进行的抽样,因而它能够避免抽样过程中的人为误差,保证样本的代表性。样,因而它能够避免抽样过程中的人为误差,保证样本的代表性。此法在社会调查最常用。此法在社会调查最常用。非概率抽样非概率抽样主要是依据研究者的主观意愿、主观判断或是否主要是依据研究者的主观意愿、主观判断或是否方便等因素来抽取调查对象,它方便等因素来抽取调查对象,它不考虑抽样中是否等概率不考虑抽样中是否等概率,因而往,因而往往产生较大的误差,难以保证样本的代表性。此法在社会调查中用往产生较大的误差,难以保证样本的代

25、表性。此法在社会调查中用得较少。得较少。现在学习的是第22页,共77页社会调查方法社会调查方法根据抽取调查对象的具体方式的不同,又可分将概率抽样与非概率抽样分为若干小类,具体分类如下图所示。简单随机 系统抽样 概率抽样 分层抽样 整群抽样抽样方法 多段抽样 偶遇抽样 非概率抽样 判断抽样 定额抽样 雪球抽样 probability sample Non-probability sample sample现在学习的是第23页,共77页社会调查方法社会调查方法(一)概率抽样1 1、简单随机抽样(、简单随机抽样(Simple Random Sampling)概念:它是按等概率原则直接从含有概念:它是

26、按等概率原则直接从含有N N个个体的总体中抽取个个体的总体中抽取n n个个体组成样本(个个体组成样本(N N n n)。其典型就是抽签。)。其典型就是抽签。方法:一是抽签;二是利用随机数表来抽样。方法:一是抽签;二是利用随机数表来抽样。利用随机数表进行抽样的具体步骤是:利用随机数表进行抽样的具体步骤是:(1 1)先取得一份调查总体所有个体的名单(即抽样框);)先取得一份调查总体所有个体的名单(即抽样框);(2 2)将总体中所有个体一一按顺序编号;)将总体中所有个体一一按顺序编号;(3 3)根据总体规模是几位数来确定从随机数表中选几位数码;)根据总体规模是几位数来确定从随机数表中选几位数码;(4

27、 4)以总体规模为标准,对随机数表中的数码逐一进行衡量并决定取舍;)以总体规模为标准,对随机数表中的数码逐一进行衡量并决定取舍;(5 5)根据样本规模的要求选择出足够的数码个数;)根据样本规模的要求选择出足够的数码个数;(6 6)依据从随机数表中选出的数码,到抽样框中去找出它所对应的个体。这些个案的)依据从随机数表中选出的数码,到抽样框中去找出它所对应的个体。这些个案的集合就构成样本。集合就构成样本。适用范围:总体单位数目和所需样本数目都比较少。适用范围:总体单位数目和所需样本数目都比较少。例:某总体共例:某总体共60006000人,现需要从中抽取人,现需要从中抽取300300名作为样本进行调

28、查,运用随机数表法。名作为样本进行调查,运用随机数表法。现在学习的是第24页,共77页社会调查方法社会调查方法2 2、系统抽样(、系统抽样(Systematic Sampling)概念:是把总体中的个体进行随机编号并排序,再计算出某种间隔,然后按这一固定的间概念:是把总体中的个体进行随机编号并排序,再计算出某种间隔,然后按这一固定的间隔抽取个体的号码来组成样本的方法。隔抽取个体的号码来组成样本的方法。具体步骤:具体步骤:(1 1)给总体中的每一个个体随机编上号码并按号码排序,即制作抽样框;)给总体中的每一个个体随机编上号码并按号码排序,即制作抽样框;(2 2)计算出抽样间距,公式为:)计算出抽

29、样间距,公式为:K=N/n K=N/n(K K抽样间隔,抽样间隔,N N总体规模,总体规模,n n样本规模);样本规模);(3 3)在最前面的)在最前面的K K个个体中,随机抽取一个个体,并记号其编号(假定为个个体中,随机抽取一个个体,并记号其编号(假定为A A),作为),作为随机起点;随机起点;(4 4)在抽样框中,自)在抽样框中,自A A开始,每隔开始,每隔K K个个体抽取一个个体,即所抽取个体的编号分别个个体抽取一个个体,即所抽取个体的编号分别为为A A,A AK K,A A2K2K,A A(n n1 1)K K;(5 5)将这)将这n n个个体合起来,就构成了该总体的一个样本。个个体合

30、起来,就构成了该总体的一个样本。现在学习的是第25页,共77页社会调查方法社会调查方法v例如:例如:某某学院学院共有共有1 1000000名学生,要抽取一个容量为名学生,要抽取一个容量为100100的大学生样本,的大学生样本,使用系统抽样的方法如何抽取。使用系统抽样的方法如何抽取。v课堂练习:课堂练习:现要对某一产品的口味进行测试,需要从调查总体的现要对某一产品的口味进行测试,需要从调查总体的150150人中人中抽取抽取1212人进行测试,请使用系统抽样的方法抽取样本。人进行测试,请使用系统抽样的方法抽取样本。?思考:如果总体的个体数不能被样本容量整除时,如何处理?思考:如果总体的个体数不能被

31、样本容量整除时,如何处理?现在学习的是第26页,共77页社会调查方法社会调查方法001011021031091002012022032092003013023033093004014024034094005015025035095006016026.096007017027097008018028098009019029099010020030100现在学习的是第27页,共77页社会调查方法社会调查方法注意:一般不选用系统抽样方法的情况。注意:一般不选用系统抽样方法的情况。(1 1)在总体的名单中,个体的排列具有次序上的先后)在总体的名单中,个体的排列具有次序上的先后和等级上的高低的时候。和等

32、级上的高低的时候。(2 2)在总体名单中,个体的排列上有与抽样间隔相对应)在总体名单中,个体的排列上有与抽样间隔相对应的周期性分布的情况。的周期性分布的情况。适用范围:总体数量不大,个体排列无次序性和周期性。适用范围:总体数量不大,个体排列无次序性和周期性。现在学习的是第28页,共77页社会调查方法社会调查方法3 3、分层抽样、分层抽样(Stratified Sampling)概概念念:是是先先将将总总体体中中的的所所有有个个体体按按某某种种特特征征或或标标志志划划分分为为若若干干类类型型,然然后后再再在在各各类类型型中中采采用用简简单单随随机机抽抽样样或或系系统统抽抽样样的的方方法法抽抽取取

33、一一个个子子样样本本,最最后后将将这这些些子子样样本本合合起起来来构构成成总总体体的的一一个个样样本本。其中,其中,N N为总体,为总体,N Ni i为子总体,为子总体,n n为样本,为样本,n ni i为子样本为子样本现在学习的是第29页,共77页社会调查方法社会调查方法具体步骤:具体步骤:(1 1)确定分类标准,如性别、年龄、地区等。)确定分类标准,如性别、年龄、地区等。(2 2)按确定的标准将总体单位分为若干类型。)按确定的标准将总体单位分为若干类型。(3 3)计算各类型单位数量占总体单位数量的比重。)计算各类型单位数量占总体单位数量的比重。设设总体单位数为总体单位数为N N,各类型单位

34、数为,各类型单位数为NiNi,各类型各类型单位数占总体单位单位数占总体单位数的数的比重为比重为RiRi。公式:公式:Ri=Ni/N Ri=Ni/N(4 4)根据)根据RiRi计算出各类型中应抽取样本单位的数量。计算出各类型中应抽取样本单位的数量。设各类型的样本单位数为设各类型的样本单位数为nini,所需抽取的样本总数为,所需抽取的样本总数为n n。公式:公式:ni=nRi ni=nRi(5 5)按简单随机抽样或系统抽样方法从各类型中按比例抽取样本。)按简单随机抽样或系统抽样方法从各类型中按比例抽取样本。现在学习的是第30页,共77页社会调查方法社会调查方法分类分类随机随机抽样抽样总体总体样本样

35、本子群子群现在学习的是第31页,共77页社会调查方法社会调查方法例如:某省例如:某省10001000个乡,其中山区乡个乡,其中山区乡500500个,丘陵乡个,丘陵乡300300个,平原乡个,平原乡200200个,现在要抽取个,现在要抽取100100个乡进行调查,如何运用分层抽样来抽取样本?个乡进行调查,如何运用分层抽样来抽取样本?解:设山区解:设山区i=1,i=1,丘陵丘陵i=2,i=2,平原平原i=3i=3 R1=N1/N100 R1=N1/N100=500/1000100=500/1000100=50=50 R2=N2/N100 R2=N2/N100=300/1000100=300/100

36、0100=30=30 R3=N3/N100 R3=N3/N100=200/1000100=200/1000100=20=20 n1=R1n=50n1=R1n=50100=50100=50 n2=R2n=30 n2=R2n=30100=30100=30 n3=R3n=20 n3=R3n=20100=20100=20 即从即从500500个山区乡中抽取个山区乡中抽取5050个,从个,从300300个丘陵乡中抽取个丘陵乡中抽取3030个,从个,从200200个平原乡中抽取个平原乡中抽取2020个。个。其中各阶段均使用简单随机抽样的方法进行。其中各阶段均使用简单随机抽样的方法进行。现在学习的是第32页

37、,共77页社会调查方法社会调查方法课堂练习:课堂练习:某地共有居民某地共有居民2000020000户,其中高收入居民户,其中高收入居民40004000户,中等收户,中等收入居民入居民1200012000户,低收入居民户,低收入居民40004000户,现要从中抽取户,现要从中抽取500500户做户做购买力调查,如何运用分层抽样抽取样本?购买力调查,如何运用分层抽样抽取样本?现在学习的是第33页,共77页社会调查方法社会调查方法优点:优点:(1 1)可以在不增加样本规模的前提下,降低抽样误差,提高抽样的精度。)可以在不增加样本规模的前提下,降低抽样误差,提高抽样的精度。(2 2)便于了解总体内不同

38、层次的情况,便于对总体中不同层次和类别进行单独研究,或进行)便于了解总体内不同层次的情况,便于对总体中不同层次和类别进行单独研究,或进行比较。比较。注意:注意:(1 1)分层标准:)分层标准:A.A.以调查所要分析和研究的主要变量或相关的变量作为分层标准;以调查所要分析和研究的主要变量或相关的变量作为分层标准;B.B.以保证各层内部同质性强,各层之间异质性强、突出总体内在结构的变量作为分层标准;以保证各层内部同质性强,各层之间异质性强、突出总体内在结构的变量作为分层标准;C.C.以那些已有明显层次区分的变量作为分层变量。以那些已有明显层次区分的变量作为分层变量。现在学习的是第34页,共77页社

39、会调查方法社会调查方法(2)(2)分层比例:分层比例:A.A.按比例分层按比例分层B.B.不按比例分层不按比例分层在用样本资料去推断总体时,要调整样本在用样本资料去推断总体时,要调整样本中各层的比例,使数据资料恢复到总体中各层实际的比例结中各层的比例,使数据资料恢复到总体中各层实际的比例结构。构。例如:例如:某厂有工人某厂有工人600600人,按性别分层则有男工人,按性别分层则有男工500500人,女工人,女工100100人,现要抽人,现要抽取取6060人作为样本进行调查,分别按比例分层和不按比例分层抽样。人作为样本进行调查,分别按比例分层和不按比例分层抽样。适用范围:总体单位数量较多,单位之

40、间差异性较大适用范围:总体单位数量较多,单位之间差异性较大。现在学习的是第35页,共77页社会调查方法社会调查方法4 4、整群抽样(、整群抽样(Cluster Sampling)思考:思考:某高中有某高中有80008000名学生,分为名学生,分为200200个班级,每班有个班级,每班有4040名学生,现名学生,现在要从中抽取在要从中抽取400400名学生调查本校学生消费情况,问:使用简名学生调查本校学生消费情况,问:使用简单随机抽样方法和系统抽样方法分别如何抽取样本?除了使用单随机抽样方法和系统抽样方法分别如何抽取样本?除了使用以上方法,还能怎样抽取样本?以上方法,还能怎样抽取样本?现在学习的

41、是第36页,共77页社会调查方法社会调查方法N Nn nN1N1N2N2N3N3N4N4N5N5N6N6N2N2N6N6N3N3概概念念:是是从从总总体体中中随随机机抽抽取取一一些些小小群群体体,然然后后由由所所抽抽出出的的若若干干个个小小群群体体内内的的所所有有元元素素构构成成调调查查的的一一个个样样本本。其中,其中,N N为总体,为总体,NiNi为子总体,为子总体,n n为样本为样本现在学习的是第37页,共77页社会调查方法社会调查方法划分划分子群子群随机随机抽样抽样现在学习的是第38页,共77页社会调查方法社会调查方法整群抽样与前几种抽样方法的最大区别在于,它的抽样单位不是单个整群抽样与

42、前几种抽样方法的最大区别在于,它的抽样单位不是单个的个体,而是的个体,而是成群的个体成群的个体。具体步骤:具体步骤:1 1、将总体各单位按一定标准划分为若干群体。、将总体各单位按一定标准划分为若干群体。2 2、以群为单位,从整体中抽取部分群(数量确定)、以群为单位,从整体中抽取部分群(数量确定)3 3、将这些群中的、将这些群中的所有个体所有个体合起来,形成总体的一个样本。合起来,形成总体的一个样本。现在学习的是第39页,共77页社会调查方法社会调查方法特点:特点:(1 1)优点:可简化抽样的过程,降低调查中收集资料的费用,同时还能相)优点:可简化抽样的过程,降低调查中收集资料的费用,同时还能相

43、对地扩大抽样的应用范围。对地扩大抽样的应用范围。(2 2)缺点:是样本的分布面不广,样本对总体的代表性相对较差。)缺点:是样本的分布面不广,样本对总体的代表性相对较差。(解释:在(解释:在9595的置信度下,置信区间为的置信度下,置信区间为3 3这一范围,简单随机抽这一范围,简单随机抽样样500500个个体,整群抽样个个体,整群抽样800800个个体。)个个体。)整群抽样的应用范围较广,在简单随机抽样与系统抽样中,都要求整群抽样的应用范围较广,在简单随机抽样与系统抽样中,都要求有一份总体所有成员的名单,即抽样框。但在实际调查过程中,这有一份总体所有成员的名单,即抽样框。但在实际调查过程中,这样

44、的名单往往难获得,此时可采用整群抽样来解决问题。样的名单往往难获得,此时可采用整群抽样来解决问题。适用范围:总体规模较大,各群体之间差异性不大,而群体内部个体之间差适用范围:总体规模较大,各群体之间差异性不大,而群体内部个体之间差异性较大。异性较大。现在学习的是第40页,共77页社会调查方法社会调查方法思考:分层抽样与整群抽样的适用范围有何不同?为什么思考:分层抽样与整群抽样的适用范围有何不同?为什么?当群间同质性高,群内异质性高时,适合于采用整群抽样的方法当群间同质性高,群内异质性高时,适合于采用整群抽样的方法当群间异质性高,群内同质性高时,则适于采用分层抽样的方法当群间异质性高,群内同质性

45、高时,则适于采用分层抽样的方法现在学习的是第41页,共77页社会调查方法社会调查方法课堂练习:某中学有某中学有48004800名学生,分为名学生,分为4 4个年级,个年级,8080个班,现在要抽取个班,现在要抽取480480名学生进行学生身体健名学生进行学生身体健康状况调查,运用简单随机抽样、系统抽样、康状况调查,运用简单随机抽样、系统抽样、分层抽样和整群抽样的方法分别如何抽取样分层抽样和整群抽样的方法分别如何抽取样本?本?现在学习的是第42页,共77页社会调查方法社会调查方法5 5、多段抽样(、多段抽样(Multi-stage sampling)按抽样单位的隶属关系或层次关系,把抽样分为几个

46、阶段来进行。按抽样单位的隶属关系或层次关系,把抽样分为几个阶段来进行。例如:从全市例如:从全市300300所小学抽取所小学抽取300300名小学生调查,可以分为几个阶段来名小学生调查,可以分为几个阶段来进行?每个阶段的抽样单位分别是什么?进行?每个阶段的抽样单位分别是什么?优点:简化抽样过程。优点:简化抽样过程。缺点:抽样误差大。缺点:抽样误差大。在同等条件下,减少多段抽样误差的方法在同等条件下,减少多段抽样误差的方法是:是:适当增加开头阶段的样本数而相对减少后面阶段的样本数。适当增加开头阶段的样本数而相对减少后面阶段的样本数。现在学习的是第43页,共77页社会调查方法社会调查方法 例如:某地

47、有例如:某地有2.42.4万名教师,他们分布在全市万名教师,他们分布在全市1010个区的个区的200200所学校里,现在要抽取一个由所学校里,现在要抽取一个由12001200名教师名教师组成的样本,按照三级抽样的方法,有以下几种抽样方案:组成的样本,按照三级抽样的方法,有以下几种抽样方案:?思考:思考:1 1、哪一种方案最节省人力和经费?、哪一种方案最节省人力和经费?2 2、哪一种方案得到的样本精确度最高?、哪一种方案得到的样本精确度最高?3 3、考虑到实际情况,你在抽样中会选择哪种方案?为什么?、考虑到实际情况,你在抽样中会选择哪种方案?为什么?第一阶段第一阶段第二阶段第二阶段第三阶段第三阶

48、段方案方案1 11010个区个区每个区抽每个区抽4 4所学校所学校 每所学校抽每所学校抽3030名教师名教师 方案方案2 21010个区个区每个区抽每个区抽2020所学校所学校 每所学校抽每所学校抽6 6名教师名教师 方案方案3 3从从1010个区中抽个区中抽5 5个区个区 每个区抽每个区抽1212所学校所学校 每所学校抽每所学校抽2020名教师名教师 方案方案4 4从从1010个区中抽个区中抽3 3个区个区 每个区抽每个区抽1010所学校所学校 每所学校抽每所学校抽4040名教师名教师 方案方案5 5从从1010个区中抽个区中抽1 1个区个区 每个区抽每个区抽1212所学校所学校 每所学校抽

49、每所学校抽100100名教名教师师 现在学习的是第44页,共77页社会调查方法社会调查方法n假设我们的总体是全国所有城市的集合,我们要抽取一个规模为40个城市的样本。n若按简单随机抽样或系统抽样的方法,则首先需要弄到一份全国城市的名单,然后根据随机数表或通过计算抽样间距直接从抽样框中抽取城市;n若按分层抽样的方法,则可以先按城市规模将总体分为特大城市、大城市、中等城市和小城市四类,然后分别从每一类中抽取若干城市,并将这些城市合起来构成样本;n如果采用整群抽样的方法,则可以以省(自治区,直辖市)为抽样单位,从全国31个省(自治区、直辖市)中随机抽取三至五个省(自治区、直辖市),再以所抽中的这些省

50、(自治区、直辖市)中所包含的全部城市的集合作为样本。几种抽样方法的比较几种抽样方法的比较现在学习的是第45页,共77页社会调查方法社会调查方法五种概率抽样方法的图示比较简单随机抽样简单随机抽样现在学习的是第46页,共77页社会调查方法社会调查方法五种概率抽样方法的图示比较不按比例分层不按比例分层按比例分层按比例分层现在学习的是第47页,共77页社会调查方法社会调查方法五种概率抽样方法的图示比较整群抽样整群抽样现在学习的是第48页,共77页社会调查方法社会调查方法五种概率抽样方法的图示比较系统抽样系统抽样现在学习的是第49页,共77页社会调查方法社会调查方法五种概率抽样方法的图示比较多段抽样多段

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com