样本含量的估计.pptx

上传人:莉*** 文档编号:88362559 上传时间:2023-04-25 格式:PPTX 页数:28 大小:248.46KB
返回 下载 相关 举报
样本含量的估计.pptx_第1页
第1页 / 共28页
样本含量的估计.pptx_第2页
第2页 / 共28页
点击查看更多>>
资源描述

《样本含量的估计.pptx》由会员分享,可在线阅读,更多相关《样本含量的估计.pptx(28页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、第一节第一节 样本含量估计的意义以及影响因素样本含量估计的意义以及影响因素一、样本含量估计的意义一、样本含量估计的意义 样本含量(样本含量(sample sizesample size),又称样本容量、),又称样本容量、样本大小,是指在实验研究和调查研究中,每个样样本大小,是指在实验研究和调查研究中,每个样本所包含的观察对象的数量。本所包含的观察对象的数量。它体现研究设计中重复性原则,其意义在于它体现研究设计中重复性原则,其意义在于估计研究中的误差,且抽样误差的大小与样本量有估计研究中的误差,且抽样误差的大小与样本量有关。足够的样本量也是实验研究中保证组间均衡性关。足够的样本量也是实验研究中保

2、证组间均衡性的基础。的基础。第1页/共28页 大样本得到的结论要比小样本得到的结论更为精确和可靠,但大样本意大样本得到的结论要比小样本得到的结论更为精确和可靠,但大样本意大样本得到的结论要比小样本得到的结论更为精确和可靠,但大样本意大样本得到的结论要比小样本得到的结论更为精确和可靠,但大样本意味着研究者要付出更多的时间、精力、人力和财力,有时还会导致浪费,样本味着研究者要付出更多的时间、精力、人力和财力,有时还会导致浪费,样本味着研究者要付出更多的时间、精力、人力和财力,有时还会导致浪费,样本味着研究者要付出更多的时间、精力、人力和财力,有时还会导致浪费,样本例数太少,就容易把偶然性或巧合的现

3、象当作必然的规律性现象,也不能正确例数太少,就容易把偶然性或巧合的现象当作必然的规律性现象,也不能正确例数太少,就容易把偶然性或巧合的现象当作必然的规律性现象,也不能正确例数太少,就容易把偶然性或巧合的现象当作必然的规律性现象,也不能正确地估计实验误差,地估计实验误差,地估计实验误差,地估计实验误差,第2页/共28页克服两种倾向:克服两种倾向:克服两种倾向:克服两种倾向:1 1、片面追求增大样本、片面追求增大样本 样本含量过大,不仅会增加实际工作中的困难,样本含量过大,不仅会增加实际工作中的困难,样本含量过大,不仅会增加实际工作中的困难,样本含量过大,不仅会增加实际工作中的困难,对质量的严格控

4、制也不易做到,还会造成人力、物对质量的严格控制也不易做到,还会造成人力、物对质量的严格控制也不易做到,还会造成人力、物对质量的严格控制也不易做到,还会造成人力、物力和时间上的不必要的浪费。此外,样本含量过大力和时间上的不必要的浪费。此外,样本含量过大力和时间上的不必要的浪费。此外,样本含量过大力和时间上的不必要的浪费。此外,样本含量过大还可能引入更多的混杂因素,对研究结果造成不良还可能引入更多的混杂因素,对研究结果造成不良还可能引入更多的混杂因素,对研究结果造成不良还可能引入更多的混杂因素,对研究结果造成不良影响。影响。影响。影响。第3页/共28页2 2、忽视应当保证足够的样本含量、忽视应当保

5、证足够的样本含量 样本例数过少,所得指标不够稳定,抽样误差样本例数过少,所得指标不够稳定,抽样误差样本例数过少,所得指标不够稳定,抽样误差样本例数过少,所得指标不够稳定,抽样误差大,结论的可靠性差,用于推断总体的精度差,检大,结论的可靠性差,用于推断总体的精度差,检大,结论的可靠性差,用于推断总体的精度差,检大,结论的可靠性差,用于推断总体的精度差,检验效能低,导致总体中存在的差异未能检验出来,验效能低,导致总体中存在的差异未能检验出来,验效能低,导致总体中存在的差异未能检验出来,验效能低,导致总体中存在的差异未能检验出来,出现假阴性出现假阴性出现假阴性出现假阴性(false negative

6、)(false negative)(false negative)(false negative)结果,这是当前医学研究结果,这是当前医学研究结果,这是当前医学研究结果,这是当前医学研究中值得注意的问题。中值得注意的问题。中值得注意的问题。中值得注意的问题。第4页/共28页二、样本含量估计的影响因素二、样本含量估计的影响因素 1.1.1.1.第一类错误概率大小第一类错误概率大小第一类错误概率大小第一类错误概率大小 (或置信度(或置信度(或置信度(或置信度1-1-1-1-),),),),越越越越小,所需要的样本含量越大,根据研究问题的性小,所需要的样本含量越大,根据研究问题的性小,所需要的样本含

7、量越大,根据研究问题的性小,所需要的样本含量越大,根据研究问题的性质和研究目的决定质和研究目的决定质和研究目的决定质和研究目的决定I I I I型错误的概率值,通常情况型错误的概率值,通常情况型错误的概率值,通常情况型错误的概率值,通常情况下,下,下,下,取取取取0.050.050.050.05,可取单侧或双侧。可取单侧或双侧。可取单侧或双侧。可取单侧或双侧。2.2.2.2.第二类错误概率大小第二类错误概率大小第二类错误概率大小第二类错误概率大小 ,越小,检验效能越小,检验效能越小,检验效能越小,检验效能1-1-1-1-越大,所需样本量也越大,一般要求检验效能不越大,所需样本量也越大,一般要求

8、检验效能不越大,所需样本量也越大,一般要求检验效能不越大,所需样本量也越大,一般要求检验效能不低于低于低于低于0.800.800.800.80。一般只取单侧。在参数估计的样本一般只取单侧。在参数估计的样本一般只取单侧。在参数估计的样本一般只取单侧。在参数估计的样本量估计中不涉及量估计中不涉及量估计中不涉及量估计中不涉及 ,在假设检验的样本量估计中,在假设检验的样本量估计中,在假设检验的样本量估计中,在假设检验的样本量估计中涉及涉及涉及涉及 。第5页/共28页 3.3.3.3.容许误差容许误差容许误差容许误差 ,是指研究者要求的或客观实际,是指研究者要求的或客观实际,是指研究者要求的或客观实际,

9、是指研究者要求的或客观实际存在的样本统计量与总体参数间或样本统计量存在的样本统计量与总体参数间或样本统计量存在的样本统计量与总体参数间或样本统计量存在的样本统计量与总体参数间或样本统计量间的差值,容许误差既可以用绝对误差来表示,间的差值,容许误差既可以用绝对误差来表示,间的差值,容许误差既可以用绝对误差来表示,间的差值,容许误差既可以用绝对误差来表示,也可用相对误差来表示,容许误差值越小,所也可用相对误差来表示,容许误差值越小,所也可用相对误差来表示,容许误差值越小,所也可用相对误差来表示,容许误差值越小,所需样本量越大。需样本量越大。需样本量越大。需样本量越大。4.4.4.4.总体标准差总体

10、标准差总体标准差总体标准差 或总体率或总体率或总体率或总体率 ,常根据预试验以及常根据预试验以及常根据预试验以及常根据预试验以及前人的研究结果或统计理论进行估计,前人的研究结果或统计理论进行估计,前人的研究结果或统计理论进行估计,前人的研究结果或统计理论进行估计,愈大愈大愈大愈大或或或或 愈远离愈远离愈远离愈远离0.50.50.50.5,所需样本量越大。,所需样本量越大。,所需样本量越大。,所需样本量越大。第6页/共28页一、单纯随机抽样的样本含量估计一、单纯随机抽样的样本含量估计一、单纯随机抽样的样本含量估计一、单纯随机抽样的样本含量估计 (一)估计总体均数时所需的样本大小(一)估计总体均数

11、时所需的样本大小(一)估计总体均数时所需的样本大小(一)估计总体均数时所需的样本大小式中式中式中式中S S S S 为样本标准差,为样本标准差,为样本标准差,为样本标准差,为容许误差,为容许误差,为容许误差,为容许误差,一般取双侧一般取双侧一般取双侧一般取双侧 0.050.050.050.05,第二节 参数估计中样本含量的估计第7页/共28页 例例例例18-1.18-1.18-1.18-1.拟用放射免疫法检测某人群(拟用放射免疫法检测某人群(拟用放射免疫法检测某人群(拟用放射免疫法检测某人群(5000500050005000人)血液归流脑特异免疫球蛋白含量,根人)血液归流脑特异免疫球蛋白含量,

12、根人)血液归流脑特异免疫球蛋白含量,根人)血液归流脑特异免疫球蛋白含量,根据文献报道,其样本标准差约为据文献报道,其样本标准差约为据文献报道,其样本标准差约为据文献报道,其样本标准差约为0.5mg/L0.5mg/L0.5mg/L0.5mg/L,允许误差为,允许误差为,允许误差为,允许误差为0.1mg/L0.1mg/L0.1mg/L0.1mg/L,试按单纯随机抽样,试按单纯随机抽样,试按单纯随机抽样,试按单纯随机抽样估计样本例数。估计样本例数。估计样本例数。估计样本例数。第8页/共28页(二)估计总体率(或比例)时所需(二)估计总体率(或比例)时所需(二)估计总体率(或比例)时所需(二)估计总体

13、率(或比例)时所需 的样本大的样本大的样本大的样本大小小小小 例例例例18-218-218-218-2:某城市欲调查:某城市欲调查:某城市欲调查:某城市欲调查10101010岁以上儿童参加岁以上儿童参加岁以上儿童参加岁以上儿童参加夏令营的比例,在预调查中这个比例是夏令营的比例,在预调查中这个比例是夏令营的比例,在预调查中这个比例是夏令营的比例,在预调查中这个比例是80%80%80%80%,要,要,要,要求正式调查得的样本率与未知实体率相差不超过求正式调查得的样本率与未知实体率相差不超过求正式调查得的样本率与未知实体率相差不超过求正式调查得的样本率与未知实体率相差不超过10%10%10%10%的

14、可能性不大于的可能性不大于的可能性不大于的可能性不大于0.050.050.050.05。如果用简单随机抽样,。如果用简单随机抽样,。如果用简单随机抽样,。如果用简单随机抽样,需要多少调查对象?需要多少调查对象?需要多少调查对象?需要多少调查对象?第9页/共28页二、分层随机抽样的样本含量的估计二、分层随机抽样的样本含量的估计二、分层随机抽样的样本含量的估计二、分层随机抽样的样本含量的估计按比例分配:最优分配:(均数的抽样)(均数的抽样)(率的抽样(率的抽样 )第10页/共28页 例例例例18-3.18-3.18-3.18-3.欲在欲在欲在欲在15151515万人口的居民中调查某病患万人口的居民

15、中调查某病患万人口的居民中调查某病患万人口的居民中调查某病患病率。居民区分病率。居民区分病率。居民区分病率。居民区分5 5 5 5层,样本总含量确定为层,样本总含量确定为层,样本总含量确定为层,样本总含量确定为1000100010001000人,人,人,人,根据按比例分配和最优分配分层抽样(以三年前根据按比例分配和最优分配分层抽样(以三年前根据按比例分配和最优分配分层抽样(以三年前根据按比例分配和最优分配分层抽样(以三年前各层患病率的数据作为参考),问各层分别应抽各层患病率的数据作为参考),问各层分别应抽各层患病率的数据作为参考),问各层分别应抽各层患病率的数据作为参考),问各层分别应抽取多少

16、人?取多少人?取多少人?取多少人?第11页/共28页第12页/共28页第13页/共28页 第三节第三节第三节第三节 假设检验中样本含量的估计方法假设检验中样本含量的估计方法假设检验中样本含量的估计方法假设检验中样本含量的估计方法(一)样本均数与总体均数比较(一)样本均数与总体均数比较(一)样本均数与总体均数比较(一)样本均数与总体均数比较 例例例例18-5.18-5.18-5.18-5.某药物研究所研究某新药治疗高血压某药物研究所研究某新药治疗高血压某药物研究所研究某新药治疗高血压某药物研究所研究某新药治疗高血压的疗效,若规定要求用药后舒张压下降的疗效,若规定要求用药后舒张压下降的疗效,若规定

17、要求用药后舒张压下降的疗效,若规定要求用药后舒张压下降1.6kpa1.6kpa1.6kpa1.6kpa,才,才,才,才说明该药有实际疗效。预试验结果:治疗后比治说明该药有实际疗效。预试验结果:治疗后比治说明该药有实际疗效。预试验结果:治疗后比治说明该药有实际疗效。预试验结果:治疗后比治疗前舒张压差值的标准差为疗前舒张压差值的标准差为疗前舒张压差值的标准差为疗前舒张压差值的标准差为3.0kpa3.0kpa3.0kpa3.0kpa。当。当。当。当 =0.05=0.05=0.05=0.05,检,检,检,检验效能验效能验效能验效能1-1-1-1-=0.8=0.8=0.8=0.8时,试估计需要多少病人进

18、行临床时,试估计需要多少病人进行临床时,试估计需要多少病人进行临床时,试估计需要多少病人进行临床试验?试验?试验?试验?第14页/共28页第15页/共28页(二)两样本均数比较时(二)两样本均数比较时 样本分配比或抽样比:样本分配比或抽样比:第16页/共28页 例例例例18-6.18-6.18-6.18-6.据文献报道:用磷酸咯定肌肉注射治疗间日疟,观察疟虫消失时间,据文献报道:用磷酸咯定肌肉注射治疗间日疟,观察疟虫消失时间,据文献报道:用磷酸咯定肌肉注射治疗间日疟,观察疟虫消失时间,据文献报道:用磷酸咯定肌肉注射治疗间日疟,观察疟虫消失时间,2mg/kg2mg/kg2mg/kg2mg/kg肌

19、注组,平均消失时间为肌注组,平均消失时间为肌注组,平均消失时间为肌注组,平均消失时间为48.548.548.548.5小时;小时;小时;小时;4mg/kg4mg/kg4mg/kg4mg/kg肌注组,平均消失时间为肌注组,平均消失时间为肌注组,平均消失时间为肌注组,平均消失时间为43.343.343.343.3小时。小时。小时。小时。两组平均时间的标准差估计为两组平均时间的标准差估计为两组平均时间的标准差估计为两组平均时间的标准差估计为13131313小时。欲得出两计量的疟原虫消失时间不同的结论在小时。欲得出两计量的疟原虫消失时间不同的结论在小时。欲得出两计量的疟原虫消失时间不同的结论在小时。欲

20、得出两计量的疟原虫消失时间不同的结论在 =0.05=0.05=0.05=0.05,=0.2=0.2=0.2=0.2的条件下至少需要观察多少例。的条件下至少需要观察多少例。的条件下至少需要观察多少例。的条件下至少需要观察多少例。第17页/共28页第18页/共28页(三)完全随机设计多个样本均数比较时三)完全随机设计多个样本均数比较时三)完全随机设计多个样本均数比较时三)完全随机设计多个样本均数比较时 是是k k个个 的平均值,的平均值,=0.05=0.05,=0.10=0.10 时,可查表可查表1919 第19页/共28页 例例例例18-718-718-718-7:某综合性医院用:某综合性医院用

21、:某综合性医院用:某综合性医院用3 3 3 3种方法治疗贫血患者,预试验结论为治疗后种方法治疗贫血患者,预试验结论为治疗后种方法治疗贫血患者,预试验结论为治疗后种方法治疗贫血患者,预试验结论为治疗后三组血红蛋白(三组血红蛋白(三组血红蛋白(三组血红蛋白(g/lg/lg/lg/l)增加分别为)增加分别为)增加分别为)增加分别为18181818,14141414,16161616,标准差分别为,标准差分别为,标准差分别为,标准差分别为9 9 9 9,8 8 8 8,7 7 7 7,设,设,设,设 =0.05=0.05=0.05=0.05,=0.10=0.10=0.10=0.10,问按完全随机设计方

22、案得出有差别的结论,每组需观察多,问按完全随机设计方案得出有差别的结论,每组需观察多,问按完全随机设计方案得出有差别的结论,每组需观察多,问按完全随机设计方案得出有差别的结论,每组需观察多少例?少例?少例?少例?第20页/共28页先以先以=0.05=0.05,=0.1=0.1,1 1=3-1=3-1,2 2=,查得,查得=2.52=2.52,将上述值代入公式(,将上述值代入公式(18-1218-12):):第21页/共28页 再以再以=0.05=0.05,=0.1=0.1,1 1=3-1=3-12 2,2 2=k(n(1)-1)=3=k(n(1)-1)=3(103-1103-1)=306=306,查,查表,表,近似得近似得=2.53=2.53,代入公式(,代入公式(18-1218-12):):第22页/共28页第23页/共28页第24页/共28页第25页/共28页第26页/共28页第27页/共28页感谢您的观看!第28页/共28页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > PPT文档

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com