社会调查方法03抽样一.ppt

上传人:赵** 文档编号:65710308 上传时间:2022-12-06 格式:PPT 页数:69 大小:445KB
返回 下载 相关 举报
社会调查方法03抽样一.ppt_第1页
第1页 / 共69页
社会调查方法03抽样一.ppt_第2页
第2页 / 共69页
点击查看更多>>
资源描述

《社会调查方法03抽样一.ppt》由会员分享,可在线阅读,更多相关《社会调查方法03抽样一.ppt(69页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、 第二章第二章 抽抽 样样 第一节第一节 抽样概述抽样概述一.抽样的含义l抽样:从总体中按一定规则抽取部分单位的过程。二.抽样的分类l非概率抽样:依据调查目的和对调查对象的分析,主观有意识地在由研究对象构成的总体中选择样本。l概率抽样:依据概率理论计算抽样误差,按照随机原则选择样本,对总体进行推断,完全不带调查者的主观意识。三.抽样的基本术语l个体与抽样单位(Sampling Unit):个体是指一次直接的抽样所使用的基本单位,它往往与抽样单位相同,但并不完全等同;l总体(population):所有调查对象的集合体。它包括研究总体和调查总体,二者也不能完全等同;l总体规模:总体中含有的抽样单

2、位的数目(N)。l样本(Sample):从总体中抽取出的一部分抽样单位的集合体。l样本容量:样本中含有的抽样单位的数目(n)。抽抽抽抽样样样样框框框框(Sampling(Sampling Frame)Frame):一一一一次次次次抽抽抽抽样样样样时时时时总总总总体体体体中中中中所所所所有有有有抽抽抽抽样样样样单单单单位位位位的的的的名单。名单。名单。名单。总总总总体体体体参参参参数数数数值值值值(Parameter Parameter):关关关关于于于于总总总总体体体体中中中中某某某某一一一一变变变变量量量量取取取取值值值值的的的的综综综综合合合合描描描描述。述。述。述。样样样样本本本本统统统

3、统计计计计值值值值(Statistic)(Statistic):关关关关于于于于样样样样本本本本中中中中某某某某一一一一变变变变量量量量取取取取值值值值的的的的综综综综合合合合描描描描述。述。述。述。抽抽抽抽样样样样误误误误差差差差(sampling sampling errorerror):样样样样本本本本统统统统计计计计值值值值和和和和总总总总体体体体参参参参数数数数值值值值之之之之间间间间的差异。的差异。的差异。的差异。不可避免不可避免不可避免不可避免 置置置置信信信信水水水水平平平平(confidence confidence levellevel):总总总总体体体体参参参参数数数数值

4、值值值落落落落在在在在样样样样本本本本统统统统计计计计值值值值某某某某一正负区间的概率。一正负区间的概率。一正负区间的概率。一正负区间的概率。置置置置信信信信区区区区间间间间(confidence confidence intervalinterval):在在在在一一一一定定定定的的的的置置置置信信信信水水水水平平平平下下下下,样样样样本本本本统计值与总体参数值偏差的最大允许范围。统计值与总体参数值偏差的最大允许范围。统计值与总体参数值偏差的最大允许范围。统计值与总体参数值偏差的最大允许范围。?l为什么要知道一个人的血液情况,只需要抽一为什么要知道一个人的血液情况,只需要抽一点点血来化验就可以

5、了?点点血来化验就可以了?四.抽样的基本规律l随随机机原原则则(randomprinciple):在完全排除主观上人为选择的前提下,使总体中每一个单位有相同被抽中的机会。概率抽样?l一个新闻记者就市民关心的问题,在街头碰到一个新闻记者就市民关心的问题,在街头碰到谁调查谁,是不是遵循了随机原则。谁调查谁,是不是遵循了随机原则。四.抽样的基本规律l大大数数规规律律:大量重复观察的结果的平均数几乎接近某个确定的数值。试验者试验者抛硬币的次数抛硬币的次数N正面次数正面次数n出现正面的机会出现正面的机会n/N蒲丰蒲丰404020480.5069皮尔逊皮尔逊1200060190.5016皮尔逊皮尔逊240

6、00120120.5005大数规律的抛币实验五五.抽样的基本程序抽样的基本程序 l1.确定总体确定总体.l2.确定抽样框确定抽样框l3.设计和选取样本设计和选取样本l4.对样本进行评估对样本进行评估1.确定总体确定总体l根据调查目的,确定调查对象的范围,包括时间,地点,和人物。并排列调查总体中所有能找到的调查对象。美国美国文学摘要文学摘要的失败的失败2.确定抽样框确定抽样框操作层面操作层面对于不同类型的总体抽样框的形式也有多种。3.设计和选取样本设计和选取样本l确定样本的数量1.抽样误差2.调查成本l选择抽样的具体方法:不同的抽样方法产生的样本代表性不同。先抽好样本再调查 边抽部分样本边调查

7、4.对样本进行评估对样本进行评估l初步检查样本的代表性,避免因失误使样本偏差太大l收集若干容易得到的资料作为总体和样本之间的比较方法。五.抽样的特点 l1.更少投入l2.速度快,周期短l3.应用范围广l4.设置较多的较复杂的调查项目,并能集中时间和精力作详细的分析,可获得内容丰富的资料l5.准确性较高l6.由样本情况来推断总体情况抽样成功的依据l样本能代表总体l能判断抽样误差第二节概率抽样l概率抽样:总体内的所有个体具有相同的不为零被抽入样本的机会。l等概率抽样与不等概率抽样一一.简单随机抽样简单随机抽样(Simple Random Sampling)l1.特点l简单随机抽样对总体中的所有个体

8、按完全符合随机原则的特定方法抽取样本,即抽样时不进行任何分组,排列,使总体中的任何个体都同样有被抽取的平等机会。l要保证抽样框的充分性,如果某些个体被漏掉,它们就丧失了进入样本的机会,就破坏了随机原则。2.2.方法方法l 总体较小时:抓阄,抽签法l如果要你从3000总体中抽取100个,用抽签法如何?总体较大时:随机数字表l随机数法的步骤:l1.确定总体确定总体N,并编号(,并编号(N的位数决定所有号码的位数,的位数决定所有号码的位数,如如N=1000,编号为,编号为0001,00021000)l2.随意指出随即表上其中一个同位数码随意指出随即表上其中一个同位数码起点(如起点(如0556)l3.

9、确定选择规则(上确定选择规则(上-下,左下,左-右或其他规则),依次右或其他规则),依次选择足够样本选择足够样本规则一旦确定,就不变,碰到大于规则一旦确定,就不变,碰到大于总体的随机数和重复的随机数,跳过(舍去)总体的随机数和重复的随机数,跳过(舍去)2.2.评价评价优点:概率抽样的理想类型,无偏见,简单易行,能对总体进行推断,误差小。缺点:1.需要为总体每个要素编号,当总体所含个体的数目太多时采用这种方法费时费力;2.总体内分类明显时,这种抽样无法按类别特征自动分配样本数,若想保证样本的代表性,必须增大样本量,使工作量增大二.分层抽样(StratifiedSampling)l1.分层抽样的内

10、涵:l分层抽样是将总体N依照某一种或某几种特征分为几个子总体(层),然后从每一层中采取简单随机抽样或等距抽样方式抽取一个个子样本n1,n2将这些子样本合在一起即为总体样本n。使用什么分层变量?一般是选择与调查目标变量高度相关的变量。要协调层的数量和每层样本量 分层抽样适用于总体数目较多,异质,一个或多个变量可能影响调查结果的情况,且对所研究的总体有详细的名单。分层后,每层同质,层之间不同质,然后在每层按照比例抽。分分类类随机随机抽样抽样N10000N11800N23500N33000N41700n1 18n2 35n330n4 17n100总体总体层层(互不重(互不重叠)叠)子样本子样本样本样

11、本确定分层特征 2.分层抽样的种类:划分标准:各层子样本容量的确定方式(一)按比例分层抽样 按比例分层抽样要求:各子样本在总样本中所占比例=各层在总体中所占的比例简单便利,常用(二)非比例分层抽样(最优分层抽样)根据其他因素(如各层平均数或标准差的大小等),调整各层样本的单位数。各子样本在总样本中所占比例各层在总体中所占的比例,不同层的单位入样的概率不同,是不等概率抽样。对总体中规模太小的层作比较研究 不等概率抽样的后期统计一般要做特殊处理。l举例:举例:20000户居民,按经济收入高低分类,高收户居民,按经济收入高低分类,高收入居民入居民4000户,占总体户,占总体20%;中等收入;中等收入

12、12000户,户,占总体占总体60%;低收入户;低收入户4000户,占总体户,占总体20%,从中,从中抽取抽取200户,进行购买力调查。户,进行购买力调查。l等比例分层抽样等比例分层抽样高收入层样本数:高收入层样本数:200 20%=40户户中收入层样本数:中收入层样本数:200 60%=120户户低收入层样本数:低收入层样本数:200 20%=40户户分层抽样的适用性分层抽样的适用性l1当一个总体内部分层明显时,分层抽样能当一个总体内部分层明显时,分层抽样能够克服简单随机样和等距抽样的缺点。够克服简单随机样和等距抽样的缺点。l2分层抽样可以提高总体参数估计的精确度。分层抽样可以提高总体参数估

13、计的精确度。l3有些研究不仅要了解总体的情况,而且还有些研究不仅要了解总体的情况,而且还要了解某些类别的情况。要了解某些类别的情况。l4便于行政管理。同一层可看作一个总体,便于行政管理。同一层可看作一个总体,因此每层可由专人进行管理。因此每层可由专人进行管理。l某高一学生共某高一学生共500人,经调查,喜欢数学的学生占全体学生的人,经调查,喜欢数学的学生占全体学生的30,不喜欢数学的人数占不喜欢数学的人数占40,介于两者之间的学生占,介于两者之间的学生占30。为了考察。为了考察学生的期中考试的数学成绩,如何用分层抽样抽取一个容量为学生的期中考试的数学成绩,如何用分层抽样抽取一个容量为50的的样

14、本样本l某公司有某公司有500人,其中人,其中35岁以下的岁以下的125人,人,3549的的280人,人,50以上以上的的95人。为了调查员工的身体健康情况,从中抽取人。为了调查员工的身体健康情况,从中抽取100人,怎样用人,怎样用分层抽样抽?分层抽样抽?l某大学食堂为了了解新生的饮食习惯,以分层抽样方式从某大学食堂为了了解新生的饮食习惯,以分层抽样方式从1500名新名新生中抽取生中抽取200人进行调查,新生中南方学生人进行调查,新生中南方学生500人,北方学生人,北方学生800人,人,西部学生西部学生200人,如何抽?人,如何抽?l某市电视台在网上征集节目现场观众,报名的总人数某市电视台在网

15、上征集节目现场观众,报名的总人数12000人,来人,来自自4城区,东城区城区,东城区2400人,西城区人,西城区4605人,南城区人,南城区3795人,北城区人,北城区1200人。用分层抽样抽取人。用分层抽样抽取60人参加,如何抽?人参加,如何抽?三三.系统抽样系统抽样(Systematic Sampling)(等距抽样(等距抽样)(一)直线等距抽样(抽样间距K为整数)1.将总量的所有个体按一定顺序排列。2.计算抽样间距。抽样间距是由总体数目与样本数目决定的。如果总体数为N,样本数为n,则抽样间距应是:N K=n 3.在1K范围内,随机抽取一个起点数r 4.自r开始,每隔K个单位抽取一个单位,

16、依次抽取的单位号码为r,r+k,r+2k,r+(n-1)k特点:每一列被选中的概率相同(图)直线等距抽样练习题直线等距抽样练习题:某大学有12000名学生,欲了解其生活态度,决定采用系统抽样的方法从中抽查200名学生,用简单随机抽样的方法抽出第一名学生序号为12,请计算第十位,第十五位学生的序号是多少?l(二)循环等距抽样(k不为整数)方法1.1.将总体N首尾相连,N K=,取接近K的整数;2.随机起点r从1-N中随机抽取 n方法2.调整直线等距抽样1.将K的小数点后移,便为整数K2.确定整数的随机起点r,从10-K中选3.确定非整数的随机起点r,即将r的小数点移回来4.从r开始,每隔K各单位

17、抽取一个单位5.再将所有抽取的号码的小数点略去特点:所有单位有相同的中选概率1/K 等距抽样与简单随机抽样相比,样本分布更为等距抽样与简单随机抽样相比,样本分布更为均匀,抽样误差更小均匀,抽样误差更小 注意注意:等距抽样是以总体的随机排列为前提的,等距抽样是以总体的随机排列为前提的,如果总体的排列出现有规律的分布时,会使等距抽如果总体的排列出现有规律的分布时,会使等距抽样产生极大的误差样产生极大的误差,降低样本的代表性降低样本的代表性 等距抽样最适用于同质性较高的总体,当总体等距抽样最适用于同质性较高的总体,当总体内个体类别之间的数目悬殊过大时,样本的代表性内个体类别之间的数目悬殊过大时,样本

18、的代表性可能较差。在这种情况下应采用另一种分层抽样方可能较差。在这种情况下应采用另一种分层抽样方法。法。系统抽样练习系统抽样练习l某杂志对其订阅者进行一次邮寄访问,以更好某杂志对其订阅者进行一次邮寄访问,以更好地了解读者市场。地了解读者市场。N=150万(万(1500000),),n=1500。如何抽取样本?如何抽取样本?练习l从编号从编号1到到900的总体中用系统抽样的办法抽取的总体中用系统抽样的办法抽取9个样本个样本l某产品共有某产品共有2563件,产品按出厂顺序编号,号码件,产品按出厂顺序编号,号码从从1到到1563,检测员要从中抽取,检测员要从中抽取15件产品进行检件产品进行检测,请给

19、出一个系统抽样方案。测,请给出一个系统抽样方案。l要考察某商场要考察某商场2006年的日销售额,从一年时间中年的日销售额,从一年时间中抽取抽取52天的销售额作为样本,请给出你的系统抽天的销售额作为样本,请给出你的系统抽样方案,并说说你的抽样方案的优点和不足样方案,并说说你的抽样方案的优点和不足四四.整群随机抽样整群随机抽样(Cluster Sampling)l 将总体按照某种标准分为i个群(互不重叠),每个群作为一个抽样单位,用随机的办法从中抽取若干群,将抽出的群中所有个体合在一起作为总体的样本。l 整群抽样与分层抽样有相似之处,第一步都是按某种标准将总体划分为一些子群。l 但是分层抽样是在所

20、有子群中均抽取一个子样本,作为总体样本的一部分,而整群抽样是抽取若干子群,并将抽出的子群中全部个体作为样本,总体样本只分布在几个群中。所以整群抽样的分群标准要求群间异质性低,群内异质性高。适用于界定不清的总体。划分划分子群子群随机随机抽样抽样N5000R153R250R358R448R1 53R448R3352R98 50n250总体总体群群(互不重(互不重叠)叠)子群子群样本样本确定分群特征R11047R13045l整群抽样评价整群抽样评价l优点:优点:节省人力物力;节省人力物力;可以在没有总体名单即抽样框的条件下进行,可以在没有总体名单即抽样框的条件下进行,扩大抽样的范围。扩大抽样的范围。

21、l缺点:缺点:样本的代表性较差,与其他方法比,在样本样本的代表性较差,与其他方法比,在样本数量相同的情况下,抽样误差比较大。数量相同的情况下,抽样误差比较大。比较分层抽样和整群抽样比较分层抽样和整群抽样分层抽样整群抽样样本样本每层均要选取子样本作为总样每层均要选取子样本作为总样本的一部分本的一部分只选择某几个子群作为整只选择某几个子群作为整体的代表体的代表 层与层的关层与层的关系系层的划分具有较高的代表性,层的划分具有较高的代表性,即层之间异质性高即层之间异质性高 群间异质性低群间异质性低层内性质层内性质层内则尽可能同质层内则尽可能同质 群内异质性高群内异质性高变量选择变量选择研究变量的选择与

22、研究问题高研究变量的选择与研究问题高度相关度相关 研究变量与研究问题相关研究变量与研究问题相关思考和讨论思考和讨论l对北京市现住人口进行调查,由于流动人口的对北京市现住人口进行调查,由于流动人口的不确定性,很难得到现住人口的住户清单。不确定性,很难得到现住人口的住户清单。1.在这种条件下应该采取那种概率抽样方法?在这种条件下应该采取那种概率抽样方法?2.大概的思路应该如何?大概的思路应该如何?练习练习l调查城市居民的情况,拟抽取调查城市居民的情况,拟抽取1000样本。该城样本。该城市有市有500个居委会,每个居委会平均有个居委会,每个居委会平均有100户居户居民。民。l利用整群抽样如何操作?利

23、用整群抽样如何操作?五.多阶段抽样(MultistageSamlping)l在整群抽样中,当子群数和子群内部个体数目较多,而彼此间的差异性不太大时,常常采用更加经济的方法,既不将样本子群中的所有个体作为样本,而是再从中用随机抽样的方法抽出最终样本。因最终样本的获取经过两次抽样,我们称之为二阶段抽样,同样地可进行三阶段,四阶段,即多阶段的抽样。l通常在第一阶段使用严格的随机抽样方法,第二阶段起使用概率比例抽样,即根据每一群所含个体的多少分配样本额。某市某市2323个区,个区,714714万人,从中抽万人,从中抽10001000人的样本人的样本 将区作为初级抽样单位将区作为初级抽样单位 每区人数不

24、等,把每区人数的号码范围列出,东区是每区人数不等,把每区人数的号码范围列出,东区是1-1-120000120000号,西区是号,西区是120001-270000120001-270000号号一直排到一直排到71400007140000号号 从这些号码中用随机数字表确定从这些号码中用随机数字表确定1010个号码,这个号码,这1010个号码所落个号码所落入的区即为调查区。如抽中入的区即为调查区。如抽中340000340000号,它落在南区,则南区为号,它落在南区,则南区为调查区调查区从这从这1010个调查区中,每区再随机抽取个调查区中,每区再随机抽取100100人就构成最终样本人就构成最终样本多阶

25、段抽样举例多阶段抽样举例多阶段抽样多阶段抽样l优点:不需要总体的全部名单l适用:调查范围大,单位多,情况复杂的调查对象l缺点:在每一阶段抽样都会产生误差多阶段抽样要注意平衡类别和个体多阶段抽样要注意平衡类别和个体l举例:某市举例:某市2.4万教师,分布在万教师,分布在10个区个区200所学校,要抽所学校,要抽1200教师组成样本。三阶段抽样教师组成样本。三阶段抽样第一阶段第一阶段第二阶段第二阶段第三阶段第三阶段方案方案1抽抽10个区个区抽抽4所学校所学校每所学校抽每所学校抽30教师教师方案方案2抽抽2个区个区抽抽20所学校所学校每所学校抽每所学校抽30教师教师方案方案3抽抽10个区个区抽抽20

26、所学校所学校每所学校抽每所学校抽6教师教师方案方案4抽抽8个区个区抽抽15所学校所学校每所学校抽每所学校抽10教师教师方案方案5抽抽5个区个区抽抽12所学校所学校每所学校抽每所学校抽20教师教师方案方案6抽抽4个区个区抽抽10所学校所学校每所学校抽每所学校抽40教师教师方案方案7抽抽3个区个区抽抽10所学校所学校每所学校抽每所学校抽40教师教师方案方案8抽抽2个区个区抽抽10所学校所学校每所学校抽每所学校抽60教师教师方案方案9抽抽1个区个区抽抽12所学校所学校每所学校抽每所学校抽100教师教师选择选择标准标准l1.各个抽样阶段子总体的同质性程度各个抽样阶段子总体的同质性程度同质性程度高同质性

27、程度高样本规模小样本规模小l2.人力和经费,方案人力和经费,方案9最节约最节约l3.样本误差样本误差 一般,样本覆盖面越大,代表性越高一般,样本覆盖面越大,代表性越高 增加开头阶段的样本数,适当减少最后阶段增加开头阶段的样本数,适当减少最后阶段的样本数,减少误差的样本数,减少误差第三第三节节 样样本本规规模模l 样本规模:样本容量,样本中所含个体的多少l适当样本规模:既能有比较好的代表性,还考虑成本。统计学与社会调查的样本l统统计计学学中中通通常常以以3030为为界界,把把样样本本分分为为大大样样本本和和小小样样本本,之之所所以以这这样样区区分分,是是因因为为当当样样本本规规模模大大于于303

28、0时时,其其平平均均值值的的分分布布将将接接近近于于正正态态分分布布,从从而而许许多多统统计计学学的的公公式式就就可可以以运运用用,也也可可以以用用样样本本的的资资料料对总体进行推论对总体进行推论l社会研究样本规模至少不能少于社会研究样本规模至少不能少于100100个个确定样本规模应考虑的因素确定样本规模应考虑的因素 l(1)研究的精确度要求;)研究的精确度要求;l(2)总体的性质,包括总体规模和总体内异质程)总体的性质,包括总体规模和总体内异质程度;度;l(3)分析要求)分析要求l(4)抽样方法;)抽样方法;l(5)无回答情况)无回答情况l(6)可用于调查的人力、财力、物力。)可用于调查的人

29、力、财力、物力。抽样误差与样本规模l抽抽样样误误差差:用用样样本本值值(统统计计值值)去去估估计计总总体体值值(参参数值)时所出现的误差数值)时所出现的误差调调查查误误差差(登登记记误误差差或或工工作作误误差差):调调查查过过程程中中,因因记记录录、整整理理资资料料,被被调调查查者者回回答答问问题题与与真真实实情情况况不符以及问题本身含糊等出现的差错不符以及问题本身含糊等出现的差错代表性误差:代表性误差:样本不能代表总体所造成的误差样本不能代表总体所造成的误差样本规模与抽样误差密切相关样本规模与抽样误差密切相关l样本越小与总体差异越大,误差越大样本越小与总体差异越大,误差越大 样本的大小根据研

30、究所要求的精确度而定,对样样本的大小根据研究所要求的精确度而定,对样本的精确度要求越高所允许的误差则越小,样本就要本的精确度要求越高所允许的误差则越小,样本就要越大,反之亦然。越大,反之亦然。在一定的精确度要求下,总体越大则样本也应越在一定的精确度要求下,总体越大则样本也应越大,但是当总体增大到一定规模后,样本规模基本上大,但是当总体增大到一定规模后,样本规模基本上不再增加。不再增加。l一般研究的误差界限是一般研究的误差界限是5%经验确定的样本规模经验确定的样本规模l一般社会调查的样本数在一般社会调查的样本数在50-5000之间之间l精精确确的的抽抽样样调调查查需需要要抽抽样样专专家家和和专专

31、业业研研究究人人员员的指导的指导l一一般般的的社社会会调调查查,实实际际上上并并不不要要求求很很高高的的精精确确度度,查查人人员员一一般般是是凭凭经经验验确确定定样样本本数数目目的的大大致致范围范围第四第四节节 非概率抽非概率抽样样非概率抽样的适用l 1.很多情况下严格的概率抽样很难进行很多情况下严格的概率抽样很难进行l 2.调查目的仅仅是探索,不是由样本推论总体调查目的仅仅是探索,不是由样本推论总体l 3.物质和时间条件不允许概率抽样时物质和时间条件不允许概率抽样时 非概率抽样的特点l样本的取得基于调查者对总体的了解及调查目的样本的取得基于调查者对总体的了解及调查目的的主观判断的主观判断l总

32、体的每个单位没有相同的被选择机会总体的每个单位没有相同的被选择机会l样本的调查结果推断总体,可靠性不能正确估计样本的调查结果推断总体,可靠性不能正确估计一一.偶遇抽样偶遇抽样(Accidental or Convenience Sampling)l偶遇抽样(方便抽样):调查者根据实际情况,以:调查者根据实际情况,以自己方便的形式抽取偶然遇到的人作为样本,或者自己方便的形式抽取偶然遇到的人作为样本,或者仅仅选择那些离得最近的,最容易找到的人作为对仅仅选择那些离得最近的,最容易找到的人作为对象。象。l优点:方便省力,花费最小(经费和时间)方便省力,花费最小(经费和时间)l缺点:样本的代表性差,有很

33、大的偶然性,不能代样本的代表性差,有很大的偶然性,不能代表总体和推断总体,要谨慎对待调查结果。表总体和推断总体,要谨慎对待调查结果。二二.判断抽样判断抽样(Judgmental or Purposive Sampling)l 判断抽样(立意抽样):调查者根据研究目的和自己调查者根据研究目的和自己主观经验来选择和确定调查对象。主观经验来选择和确定调查对象。l作用:发现问题,提出假设(前测)发现问题,提出假设(前测)l适用:适用:1.1.总体结构差异较大,样本容量较小总体结构差异较大,样本容量较小 2.2.无法确定总体边界无法确定总体边界 3.3.研究者的时间和设备有限无法进行概率抽样研究者的时间

34、和设备有限无法进行概率抽样l优点:充分发挥调研人员的主观能动性,尤其是调充分发挥调研人员的主观能动性,尤其是调研人员对研究的情况比较熟悉,判断力比较强,研研人员对研究的情况比较熟悉,判断力比较强,研究方法和技术十分熟练,经验比较丰富时,此方法究方法和技术十分熟练,经验比较丰富时,此方法十分方便。十分方便。l缺点:缺点:受到的主观影响很大,若判断不准,误差极受到的主观影响很大,若判断不准,误差极大,代表性难以判断。大,代表性难以判断。二二.判断抽样判断抽样三三.配额抽样配额抽样(Quota Sampling)l按照调查对象的某种特征将总体中所有单位分成若干类或层,然后在各层中非随机抽取子样本,样

35、本中各层所占的比例与它们在总体中所占的比例一样。步骤:l1.按研究需要决定对总体进行分层或分类的标准l2.按照标准将总体细分为若干层,确定不同特征的总体单位在总体中的比例l3.依据上述比例,决定样本单位在各层中的配额l4.在各层中自由地选择总体单位进行调查性别独立控制配额抽样性别独立控制配额抽样性别性别样本样本男男99女女101总计总计200婚姻状况独立控制配额抽样婚姻状况独立控制配额抽样婚姻状况婚姻状况样本样本已婚已婚142未婚未婚58总计总计200举例:分层标准:性别、婚姻状况、年龄,举例:分层标准:性别、婚姻状况、年龄,n=200年龄独立控制配额抽样年龄独立控制配额抽样年龄年龄样本样本1

36、8308031506550以上以上55总计总计200举例:分层标准:性别、婚姻状况、年龄,举例:分层标准:性别、婚姻状况、年龄,n=200举例:分层标准:性别、婚姻状况、年龄,举例:分层标准:性别、婚姻状况、年龄,n=200交互控制配额抽样交互控制配额抽样 已婚已婚 未婚未婚 合计合计 男男 女女男男 女女 1830 20 2520 15 803150 25 228 10 6550以上以上 24 262 3 55小计小计 69 7330 28总计总计 142 58 200l缺点1.分层不可能兼顾总体的众多属性,只能考虑其中的分层不可能兼顾总体的众多属性,只能考虑其中的几种,不可能做出很细的分类

37、几种,不可能做出很细的分类2.总体分布变化的最新信息不容易得到,因而配额的总体分布变化的最新信息不容易得到,因而配额的合理性很难保证合理性很难保证3.主观性很大。如一个访问员会本能地避免访问难以主观性很大。如一个访问员会本能地避免访问难以找到的受访者。找到的受访者。四、滚雪球抽样四、滚雪球抽样(Snowball Sampling)l滚雪球抽样(推荐抽样):当我们无法了解总体情况时,可以从总体中少数成员入手,对他们进行调查,向他们询问还知道那些符合条件的人,再去找越来越多具有相同性质的群体成员。l适用:手头样本有限,被访者能提供对调查可能有用的别的回答着的名单时。优点l1.保证抽取的样本具有某总

38、体特征,抽样误差和成保证抽取的样本具有某总体特征,抽样误差和成本比较小本比较小l2.推荐获得的样本较好地满足抽样对样本的人口统推荐获得的样本较好地满足抽样对样本的人口统计学和心理统计学的要求,因为推荐人对这些特征计学和心理统计学的要求,因为推荐人对这些特征比随机情景更熟悉比随机情景更熟悉缺点l1.要求样本单位间必须有一定的联系并且愿意保持要求样本单位间必须有一定的联系并且愿意保持和提供这种联系和提供这种联系l2.最后仍有可能许多个体无法找到,还有些个体因最后仍有可能许多个体无法找到,还有些个体因某些原因被提供者故意漏掉。某些原因被提供者故意漏掉。非概率抽样非概率抽样l优点:操作方便,省钱省力,

39、统计上也比概率抽样简单,操作方便,省钱省力,统计上也比概率抽样简单,而且能对调查总体和调查对象有较好的了解,抽样也可获而且能对调查总体和调查对象有较好的了解,抽样也可获得较大的成功。得较大的成功。l缺点:由于排除不了调查者的主观影响,容易出现选择偏由于排除不了调查者的主观影响,容易出现选择偏差,以至无法说明样本是否体现了总体的结构,样本的代差,以至无法说明样本是否体现了总体的结构,样本的代表性较小,误差有时候相当大,而误差又无法估计。表性较小,误差有时候相当大,而误差又无法估计。l将非概率抽样的结论推论到总体时要极其慎重,否则就容将非概率抽样的结论推论到总体时要极其慎重,否则就容易出现以偏概全

40、的错误。易出现以偏概全的错误。美国美国文学摘要文学摘要抽样的失败抽样的失败1936年,美国进行总统选举,竞选的是民主党的罗思年,美国进行总统选举,竞选的是民主党的罗思福和共和党的兰登,罗思福是在任的总统。美国权威福和共和党的兰登,罗思福是在任的总统。美国权威的的文学摘要文学摘要杂志社,为了预测总统候选人谁能当杂志社,为了预测总统候选人谁能当选,采用了大规模的模拟选举,选,采用了大规模的模拟选举,他们以电话簿上的地他们以电话簿上的地址和俱乐部成员名单上的地址发出址和俱乐部成员名单上的地址发出1000万封信,收到万封信,收到回信回信200万封,这在调查史上,样本容量这么大是少见万封,这在调查史上,

41、样本容量这么大是少见的,的,杂志社花费了大量人力和物力,他们相信自己的杂志社花费了大量人力和物力,他们相信自己的调查统计结果,即兰登以调查统计结果,即兰登以57%对对43%的比例获胜,并的比例获胜,并大力进行宣传。最后选举结果却是,罗思福以大力进行宣传。最后选举结果却是,罗思福以62%对对38%的巨大优势获胜,连任总统。这个调查使的巨大优势获胜,连任总统。这个调查使文学文学摘要摘要杂志社威信扫地,不久,只得关门停刊。杂志社威信扫地,不久,只得关门停刊。试分析这次调查失败的原因。试分析这次调查失败的原因。抽样方法不正确。样本不是从总体(全体美国公民)中随机的抽取,1936年,美国有私人电话和参加

42、俱乐部的家庭,都是比较富裕的家庭。1929-1933年的世界经济危机,使美国经济遭到沉重打击,“罗思福新政”动用行政手段干预市场经济,损害了部分富人的利益,但广大的美国人民从中得到了好处。所以,从这部分富人中抽取的样本严重偏离了总体,导致样本不具备代表性。与此相对,当时有一位名不见经传的青年盖洛普,却大胆预言罗思福将连任总统,当时没有引起人们的重视,盖洛普采用的是分层抽样方法,注意到样本在性别、年龄、职业、收入、种族和文化层次等基本指标的分布同全国人口的结构一致这样的一个样本实际上是全国总人口的一个缩影,因而具有代表性,他每次虽然只对几千人进行调查统计,仍然能得到正确的预测。1936年到1984年期间。盖洛普民意测验所(又称“美国舆论研究所”)对美国十三届总统竞选进行预测,与实际结果相比,平均误差只有2.6%,精确程度是世界社会科学研究史上少有的。失败的原因失败的原因

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 高考资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com