抽样调查中的无应答替换与应答率(共5页).doc

上传人:飞****2 文档编号:19352320 上传时间:2022-06-06 格式:DOC 页数:5 大小:20KB
返回 下载 相关 举报
抽样调查中的无应答替换与应答率(共5页).doc_第1页
第1页 / 共5页
抽样调查中的无应答替换与应答率(共5页).doc_第2页
第2页 / 共5页
点击查看更多>>
资源描述

《抽样调查中的无应答替换与应答率(共5页).doc》由会员分享,可在线阅读,更多相关《抽样调查中的无应答替换与应答率(共5页).doc(5页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、精选优质文档-倾情为你奉上抽样调查中的无应答替换与应答率 抽样调查中的无应答替换与应答率【标题注释】基金项目:国家社会科学基金资助项目(07BSH017)【作 者】郝大海实际接触的住户数和访谈成功数,可以尝试采用事后估算方法来计算应答率。 下面通过一个调查执行的实际例子来说明如何事后估算应答率。表1是一项当面访谈调查执行过程中,要求调查员现场填写的访谈不成功情况记录表。通过分析访谈不成功情况记录表的内容,发现根据抽样地址是否是居民住户,以及抽样地址状态是否明确,可以将9种访谈不成功类型进一步归并为3种类型:(1)抽样地址为“非住户”(1号);(2)抽样地址为“住户状况未知”(2、3、4号);(

2、3)抽样地址为“住户”(5、6、7、8号)。其中“住户”不成功情况,又可进一步分为拒访、无法联系和问题户(语言、听力、疾病等问题)等三种情况。从调查执行的过程看,所谓“非住户”是指抽样中抽到的是非居民户、空户,即此时不存在“应答”之人。由于“应答”关注的是调查员与被调查者的应答过程,是以确有被调查者存在为前提的,所以“非住户”自然也就不应再记入应答率的计算之中,而是应将其记入抽样误差的计算之中。相反,“住户状况未知”、“拒访”、“无法联系”和“问题户”则是被调查者存在或可能存在的情况,因此在计算应答率时是需要考虑的。如果将应答率界定为已经完成的合格调查样本单位数(简记为“访谈数”)除以住户数,

3、那么由于调查执行中存在着“住户状况未知”的情况,因此,应答率实际上存在着一个值域区间(扎如,布莱尔,20072005,第216页)。应答率值域区间的上、下限计算公式分别为:应答率区间上限访谈数住户数下限访谈数(访谈数拒访数无联系数问题户数)(1)应答率区间下限访谈数住户数上限访谈数(住户数下限住户状况未知中的住户数)访谈数(住户数下限住户状况未知数住户比例)访谈数住户数下限住户状况未知数住户数下限(住户数下限非住户)(2)基于同样的考虑,如果将公式(1)、(2)中的访谈数换成拒访数、无联系数或问题户数,就可以相应地获得拒访率、无联系率、问题户率值域区间的上、下限。除了应答率,在调查执行中,合作

4、率也是需要报告的质量评估指标,它是接受调查的样本单位数与接受调查样本单位数和拒绝调查的样本单位数之和的百分比,表示调查在那些实际已经联系上了,且户内有合格的被调查人的户中完成的好坏(扎如,布莱尔,20072005,第166,216页)。在操作层次上,它与应答率区间上限值的区别在于分母不包括问题户。合作率的计算公式为: 合作率访谈数符合调查要求的住户数访谈数(访谈拒访无联系)(3)可以证明在无应答替换中,如果应答率保持不变的假设条件成立,那么按事后估算公式计算出的应答率估算值,在数值上与初始应答率是相等的。下面具体给出证明过程:设样本规模为n,初始应答单位数为a,初始无应答单位数为b。假设无应答

5、单位全都被替换,即100替换,则最终应答单位数为ab;进一步假设无应答单位由多轮替换完成,最终发生的无应答替换单位数为c,则实际发生的访谈数为ac,按事后估算公式,应答率的估算值为。如果假设在无应答替换中,应答率保持不变,即在每轮替换中,应答率都等于初始应答率an,则ac实际上是一个无穷递减等比级数之和,其数值为,代入估算公式后,可得:由此可见,如果假设每一轮替换时的应答率都保持初始应答率不变,按事后估算公式计算出的估算值,在数值上等于初始应答率。综上所述,在进行无应答替换的调查中,原则上应在全面保留替换记录的基础上,计算出初始应答率,并在确保替换样本与初始样本相似,或应答率保持不变的前提下,

6、以初始应答率代表调查应答率。另外,也可以利用实际发生的访谈数量和最终应答单位数计算出的估算值,对替换样本与初始样本间的相似性做出检验;如果估算值与初始应答率相差不大,说明替换样本与初始样本间相差不大,反之亦然。但如果没有全面保留替换记录,则在使用估算值来代表调查应答率时,就需要特别谨慎地进行无应答替换,以确保替换样本与初始样本间的相似性。不难看出,在用替换样本进行无应答替换的调查中,选取适当的样本替换方法也是计算调查应答率需要特别关注的一环。3无应答替换方法在抽样调查中,常用的单位无应答替换方法包括一下几类:明显替换、补充抽样和二重抽样等。首先,“明显替换”是采用总体中的其他单位(元素)来替换

7、样本中的无应答单位,目的是使最终的应答数量不低于样本规模,即抽样设计要求的样本的个数。这种替换方法的一个明显特征就是要求替换样本单位不属于初始抽样单位,故也称之为“冷”替换。替换样本的抽取既可以用随机方法,也可用非随机方法。随机方法就是按概率抽样方法,从初始样本以外的总体的其他单位中随机抽取替换样本。在随机抽取替换样本时,应特别注意分层原则,即尽可能地在那些与无应答单位同属一个层的总体单位中抽取替换样本。这样做的一个重要原因是希望尽可能降低有意识无应答单位数量,进而降低产生估计偏倚的可能性。与随机方法不同,非随机方法是按照一些预先制定的规则,从总体中初始样本以外的其他单位中选取替换样本。在入户

8、调查访问中,无应答住户的替换单位经常被规定为该住户的前(或后)一个住户;而在电话调查中,经常将无应答单位的电话号码尾数加1后作为替换单位的电话号码。与非随机方法相比,随机方法由于能够估计抽样误差,故具有能够对统计值进行统计评价的优点。其次,“补充抽样”是在对应答率进行估计的基础上,采用与抽取初始样本同样的方法独立地抽取数组替换样本,在执行调查过程中,不断地补充加入,直到最终应答单位数量达到样本规模为止。第三,“二重抽样”是指对初始无应答单位再进行一次随机抽样,然后对被抽中的无应答单位的第二重样本再次进行调查,最终利用第一重样本和第二重样本的应答数据来估计总体参数。这种方法与前两种方法不同,它并

9、不对无应答单位进行100的替换,而是进行部分替换。同时用来替换的替换样本也不是出自总体中第一重样本以外的单位,而是对那些初始无应答单位再进行一次随机抽样,获得一个第二重样本。该方法的操作步骤如下:首先,从总体中抽取一个规模较大的第一重样本,采用费用较低的调查方法(通常为邮寄问卷调查)对其进行调查,获得初步数据,这时一般会出现较高的无应答率。接下来,对这些无应答单位再进行一次随机抽样,获得一个规模较小的第二重样本,并采用当面调查的方式,派调查员对这个较小的第二重样本进行细致的调查,力求在较高应答率的情况下获得应答数据。最后将第一重样本的应答数据和第二重样本的应答数据结合起来,对总体参数做出估计。

10、需要说明是“二重抽样”方法产生了一种事后分层效果。通过第一重抽样得到了样本规模为的样本,而通过费用较低的调查方法(如邮寄问卷),则将样本分成“应答”和“无应答”两个层,同时一方面得到了两个层的权重估计值,另一方面也得到了应答层的观测值。接着再通过第二重抽样和当面调查方式,进一步获得了无应答层的观测值。由于进行了分层处理,故能够对总体参数做出比较精确的估计。采用“二重抽样”方法还要考虑二重抽样的最优配置,即在调查经费一定的前提下,合理配置第一重抽样规模和第二重抽样的抽样比,具体计算公式如下:其中,最终要求出的三个量分别是:总的调查经费C;第一重抽样的样本规模n;从无应答单位中进行二重抽样的抽样比

11、f(K1fm称为扩张系数,m为二重抽样的样本规模)。另外,是第一重样本每个单元的调查费用(如邮寄一份问卷的费用),是处理第一重样本每个回答单元的费用(如每份回答问卷的数据处理费用),是无应答单元第二重样本每个单元的调查和数据处理费用(如每份当面访问问卷的调查与数据处理费用),计算时这些费用都是事先给定的。、分别是第一重抽样的应答和无应答单位数量,、分别是应答率和无应答率,计算时(或)是预先给定的。是假设所抽取的第一重样本如果得到全部回答时其均值的方差,为该假设状态下的样本规模,计算时是预先给定的,为总体方差。例如,欲进行一次北京城8区范围的抽样调查,在没有无应答的假设条件下,按研究精度要求需要

12、抽取1000人,为计算方便,这里采用简单随机抽样方法。由于实际调查中存在着大约30的无应答率(),故希望采用“二重抽样”方法来处理无应答样本单位。设邮寄一份问卷的费用为2元(包括邮寄费和问卷印刷费),一份完成的邮寄问卷的数据处理费用为20元;当面访问中完成一份问卷时的调查员劳务和数据处理费用合计为100元。这时假设无应答层方差和总体方差相等,可按上述公式进行如下计算:即需要事先寄出n1328份问卷,预计会有13280.3398名被访者无应答,需要从中抽出190名,派出调查员进行当面访问。邮寄问卷和当面访问总的调查费用为:4结语通过以上分析不难看出,在对无应答单位进行替换的调查中。计算应答率时必

13、须考虑无应答替换的影响,而实现这一点的条件是全面保留无应答替换的相关资料。从目前国内由研究者自行主持的调查实践看,一些调查并未做到全面保留无应答替换的相关资料,以至于无法准确计算出调查应答率。希望此番有关应答率计算的讨论,能使众人对无应答替换现象引起足够的重视,在今后的调查中,制定出保留调查执行资料的程序,严格执行之。其次,有关无应答替换的讨论,还提示我们关注无应答现象产生偏差的可能性。在目前大多数调查中,“明显替换”是经常被采用的替换方法。由于替换无应答单位的替换样本是从总体中独立抽取来的,因此,在每一轮无应答替换中,总是用那些“应答单位”来代替那些“无应答单位”。此时,如果调查中的“应答单

14、位”和“无应答单位”在样本特征上存在着实质性的差异,那我们极有可能漏掉那些特征不同的“无应答单位”的答案,使参数估计出现偏差,特别是当无应答单位比例较高时更是如此。如何走出用“应答单位”替换“无应答单位”的困境,降低偏差出现的可能性,则是“二重抽样”和其他缺失值处理方案的努力方向。 最后,任何讨论抽样的文章都应该强调:社会调查应答率是由多种因素决定的,其中有宏观社会结构方面的因素(比如人口流动、犯罪率、社会信任等),也有地域社区层面的影响(碰到高层公寓,封闭式宿舍,等等),还有调查者研究方案设计和实施方面的因素。提高应答率的唯一办法就是尽可能完善设计与实施方案,想方设法克服那些能够被克服的困难

15、(通过与政府相关部门合作,提供适当的激励机制,想办法增加调查员与被访人之间的互信,等等),坦然面对那部分由于结构性因素产生的无应答。注释: 需要说明的是,这里的无应答现象主要是指单位无应答,除此之外,还有题项无应答,主要是被访者对问卷中的部分项目(问题)无应答,它主要影响有效应答率,这里不作进一步的讨论,读者可参考本文所列的有关抽样的参考文献。 由于这里主要是讨论应答率计算问题,故没有将利用修正缺失值方法来处理无应答的策略包括在其中。 这种估算只是一种事后估算,并不是从抽样设计的角度来计算应答率。 这里每轮替换应答率保持初始应答率不变的假设是计算得以成立的关键,在实践中,每轮替换可能会有一些偏差,但不应太大,否则替换样本与初始样本就可能存在偏差。【参考文献】1 杜子芳抽样技术及其应用M.北京:清华大学出版社,2005.2 樊鸿康抽样调查M.北京:高等教育出版社,2000.3 福勒(Floyd J. Fowlet. Jr)调查研究方法(第3版)M.重庆:重庆大学出版社,2004.4 金勇进,蒋研,李序颖抽样技术M.北京:中国人民大学出版社,2002.5 扎如(Ronald Czaja),布莱尔(Johnny Blair)抽样调查设计导论M.重庆:重庆大学出版社,2007.专心-专注-专业

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 教案示例

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com