抽样误差与假设检验.ppt

上传人:石*** 文档编号:47503973 上传时间:2022-10-02 格式:PPT 页数:24 大小:650KB
返回 下载 相关 举报
抽样误差与假设检验.ppt_第1页
第1页 / 共24页
抽样误差与假设检验.ppt_第2页
第2页 / 共24页
点击查看更多>>
资源描述

《抽样误差与假设检验.ppt》由会员分享,可在线阅读,更多相关《抽样误差与假设检验.ppt(24页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、关于抽样误差与假设检验现在学习的是第1页,共24页 第一节第一节 均数的抽样误差与标准误均数的抽样误差与标准误 一、均数的抽样误差一、均数的抽样误差 在医学研究中,在医学研究中,绝绝大多数情况是由大多数情况是由样样本信息研究本信息研究总总体。由于个体存在差异,因此通体。由于个体存在差异,因此通过样过样本推本推论总论总体体时时会存会存在一定的在一定的误误差,如差,如样样本均数本均数 往往不等于往往不等于总总体均数体均数 ,这这种由抽种由抽样样造成的造成的样样本均数与本均数与总总体均数的差异称体均数的差异称为为抽抽样误样误差差。对于抽样研究,抽样误差不可避免。对于抽样研究,抽样误差不可避免。现在学

2、习的是第2页,共24页 二、抽样误差的分布二、抽样误差的分布 理理论论上可以上可以证证明:若从正明:若从正态总态总体体 中,反复多次中,反复多次随机抽取随机抽取样样本含量固定本含量固定为为n 的的样样本,那么本,那么这这些些样样本均数本均数 也服从正也服从正态态分布,即分布,即 的的总总体均数仍体均数仍为为 ,样样本均数本均数的的标标准差准差为为 。抽样分布抽样分布 抽样分布示意图抽样分布示意图现在学习的是第3页,共24页 中心极限定理中心极限定理:当当样样本含量很大的情况下,无本含量很大的情况下,无论论原始原始测测量量变变量服从什量服从什么分布,么分布,的抽的抽样样分布分布均均近似正近似正态

3、态。抽样分布抽样分布 抽样分布示意图抽样分布示意图现在学习的是第4页,共24页 三、标准误(三、标准误(Standard ErrorStandard Error)样本均数的标准差称为标准误。样本均数的标准差称为标准误。样样本均数的本均数的变变异异越小越小说说明估明估计计越精确,越精确,因此可以用标准误表示抽因此可以用标准误表示抽样误差的大小:样误差的大小:实际中总体标准差实际中总体标准差 往往未知,故只能求得往往未知,故只能求得样本均数标准误的估计值样本均数标准误的估计值 :现在学习的是第5页,共24页 例例4.1 在在某某地地随随机机抽抽查查成成年年男男子子140人人,计计算算得得红红细细胞

4、胞均均数数4.771012/L,标标准准差差0.38 1012/L,试试计计算算均均数数的的标标准误。准误。标标准准误误是是抽抽样样分分布布的的重重要要特特征征之之一一,可可用用于于衡衡量量抽抽样样误误差差的的大大小小,更更重重要要的的是是可可以以用用于于参参数数的的区区间间估估计计和和对不同组之间的参数进行比较。对不同组之间的参数进行比较。现在学习的是第6页,共24页 第二节第二节 总体均数的估计总体均数的估计 一、可信区间的概念一、可信区间的概念(Confidence IntervalConfidence Interval)区间估计:区间估计:指按预先给定的概率,计算出一个区间,指按预先给

5、定的概率,计算出一个区间,使它能够包含未知的总体均数。事先给定的概率使它能够包含未知的总体均数。事先给定的概率 称为可信度,通常取称为可信度,通常取 。参数估计参数估计点估计:不考虑抽样误差,如点估计:不考虑抽样误差,如区间估计:考虑抽样误差区间估计:考虑抽样误差现在学习的是第7页,共24页二、可信区间的计算二、可信区间的计算(一)(一)已知已知一般情况一般情况其中其中 为标准正态分布的双侧界值。为标准正态分布的双侧界值。可信区间:可信区间:现在学习的是第8页,共24页标准正态分布(二)(二)未知未知 通常未知,这时可以用其估计量通常未知,这时可以用其估计量S 代替,但代替,但 已已不不再再服

6、服从从标标准准正正态态分分布布,而而是是服服从从著著名的名的 t 分布。分布。图图4-2 4-2 不同自由度的不同自由度的 t 分布图分布图 现在学习的是第9页,共24页 可信区间的计算可信区间的计算:计计算算可可信信区区间间的的原原理理与与前前完完全全相相同同,仅仅仅仅是是两两侧侧概概率率的界值有些差别。即的界值有些差别。即可信区间:可信区间:需需要要注注意意:在在小小样样本本情情况况下下,应应用用这这一一公公式式的的条条件件是是原原始始变变量量服服从从正正态态分分布布。在在大大样样本本情情况况下下(如如n100),100),也可以用也可以用 替换替换 近似计算。近似计算。现在学习的是第10

7、页,共24页 例例4.2 4.2 某某医医生生测测得得2525名名动动脉脉粥粥样样硬硬化化患患者者血血浆浆纤纤维维蛋蛋白白原原含含量量的的均均数数为为3.32 3.32 g/Lg/L,标标准准差差为为0.57 0.57 g/Lg/L,试试计计算算该种病人血浆纤维蛋白原含量总体均数的该种病人血浆纤维蛋白原含量总体均数的95%95%可信区间。可信区间。下限:下限:上限:上限:现在学习的是第11页,共24页 例例4.3 4.3 试试计计算算例例4.14.1中中该该地地成成年年男男子子红红细细胞胞总总体体均均数的数的95%95%可信区间。可信区间。本本例例属属于于大大样样本本,可可采采用用正正态态近近

8、似似的的方方法法计计算算可可信信区区间。因为间。因为 ,则,则95%95%可信区间为:可信区间为:下限:下限:上限:上限:现在学习的是第12页,共24页 三、模拟实验三、模拟实验 模拟抽样成年男子红细胞数。设定模拟抽样成年男子红细胞数。设定:产生产生100100个随机样本,分别计算其个随机样本,分别计算其95%95%的可信区间,结的可信区间,结果用图示的方法表示。从图可以看出:绝大多数可信果用图示的方法表示。从图可以看出:绝大多数可信区间包含总体参数区间包含总体参数 ,只有,只有6 6个可信区间没有包个可信区间没有包含总体参数(用星号标记)。含总体参数(用星号标记)。现在学习的是第13页,共2

9、4页 图图4-4-2 2 模拟抽样成年男子红细胞数模拟抽样成年男子红细胞数100100次的次的95%95%可信区间示意图可信区间示意图 *现在学习的是第14页,共24页 第三节第三节 假设检验的意义和步骤假设检验的意义和步骤 (H Hypothesis ypothesis T Test)est)统计统计推断的另一个重要内容,目的是推断的另一个重要内容,目的是通过样本数通过样本数据据比比较总较总体参数之体参数之间间有无差有无差别别。一、假一、假设检验设检验的基本思想的基本思想 例例4.4 4.4 使使用用黑黑加加仑仑油油软软胶胶囊囊治治疗疗高高脂脂血血症症,3030名名高高脂脂血血症症患患者者治

10、治疗疗前前后后血血清清甘甘油油三三酯酯检检测测结结果果的的差差值值为为1.380.76 1.380.76(g/L)g/L),问问治治疗疗后后血血清清甘甘油油三三酯酯是是否否有有所所改善?改善?现在学习的是第15页,共24页 样样 本本治疗前后甘油三治疗前后甘油三酯的变化(差值)酯的变化(差值)问题归纳:问题归纳:样本疗效样本疗效 药物作用药物作用+机遇机遇 对上面问题可以作如下考虑:对上面问题可以作如下考虑:问题:问题:究竟多大能够下究竟多大能够下“有效有效”的结论?的结论?现在学习的是第16页,共24页 假定治疗前后血清甘油三酯检测结果的差值服从正态分布,假定治疗前后血清甘油三酯检测结果的差

11、值服从正态分布,若若 则则 服从服从t t 分布。分布。根据根据 t 分布能够计算出有如此大差异的概率分布能够计算出有如此大差异的概率P P,如果,如果P P 值很小,值很小,即计算出的即计算出的t t 值超出了给定的界限,则倾向于拒绝值超出了给定的界限,则倾向于拒绝H0 0,认为治疗前认为治疗前后有差别。后有差别。图图4-4-3 3 利用利用t t 分布进行假设检验原理示意图分布进行假设检验原理示意图 现在学习的是第17页,共24页二、假设检验的基本步骤二、假设检验的基本步骤 1.1.建立假设和确定检验水准建立假设和确定检验水准 无无效效假假设设H0 0(null null hypothes

12、is)hypothesis)指指需需要要检检验验的的假假设设,备备择择假假设设H1 1(alternative alternative hypothesis)hypothesis)指指在在H0 0成成立立证证据据不不足足的的情情况况下下而而被被接接受受的的假假设设。例例如如建建立立治治疗疗前前后后血血清清甘油三酯疗效的无效假设和备择假设分别为甘油三酯疗效的无效假设和备择假设分别为 检验检验水准水准 是是预预先先规规定的拒定的拒绝绝域的概率域的概率值值,实际实际中一般取中一般取 。现在学习的是第18页,共24页 说明说明 :备择假设有双侧和单侧两种情况。双侧检验:备择假设有双侧和单侧两种情况。双

13、侧检验指不论正方向还是负方向的误差,若显著地超出检验水准指不论正方向还是负方向的误差,若显著地超出检验水准则拒绝则拒绝H0 0,即为双侧检验;单侧检验指仅在出即为双侧检验;单侧检验指仅在出现正方向或负方向误差超出规定的水准时则拒绝现正方向或负方向误差超出规定的水准时则拒绝H0 0 ,如如治疗后血清甘油三酯下降的假设可表示为治疗后血清甘油三酯下降的假设可表示为 双侧检验和单侧检验应如何选择,需根据研究目的和专业双侧检验和单侧检验应如何选择,需根据研究目的和专业知识而定。知识而定。一般情况下,双一般情况下,双侧检验侧检验更更为稳为稳妥,因妥,因为对为对相同的相同的样样本,双本,双侧检验侧检验得出有

14、得出有显显著性差著性差别别的的结论结论,单侧检验单侧检验也一定也一定是是显显著的。著的。现在学习的是第19页,共24页 2.2.选择检验方法和计算检验统计量选择检验方法和计算检验统计量 根根据据资资料料类类型型、研研究究设设计计方方案案和和统统计计推推断断的的目目的的,选选择择适适当当的的检检验验方方法法,不不同同检检验验方方法法各各有有其其相相应应的的检检验验统统计计量量及及计计算算公公式式。许许多多假假设设检检验验方方法法是是以以检检验验统统计计量量来来命命名名的的,如如 t 检验、检验、u检验、检验、F检验和检验和 检验检验等。等。3.3.确定确定P P 值并做出统计推断结论值并做出统计

15、推断结论 查查表表得得到到检检验验用用的的临临界界值值,然然后后将将算算得得的的统统计计量量与与拒拒绝绝域域的的临临界界值值作作比比较较,确确定定P 值值。如如对对双双侧侧 t 检检验验 ,则,则 ,按检验水准按检验水准 拒绝拒绝H0 0。现在学习的是第20页,共24页 小小 结结 1.1.总总体参数体参数值值在在现实现实中通常不能中通常不能获获得得,而是通而是通过过随机随机样样本来本来进进行估行估计计。由于个体存在差异,因此通。由于个体存在差异,因此通过样过样本推本推论总论总体体时时会存在一定的会存在一定的误误差,差,这这种由抽种由抽样样造成的造成的样样本均本均数与数与总总体均数的差异称体均

16、数的差异称为为抽抽样误样误差差。抽抽样误样误差差的大小可的大小可以用标准误进行衡量。以用标准误进行衡量。2.2.参数估参数估计计有点估有点估计计和区和区间间估估计计两种方式。点估两种方式。点估计计的重的重要表达方式是平均值;要表达方式是平均值;区区间间估估计计是指按是指按预预先先给给定的概率,定的概率,计计算出一个区算出一个区间间,使它能,使它能够够包含未知的包含未知的总总体均数。区体均数。区间间越越窄说明估计的准确度越高。窄说明估计的准确度越高。现在学习的是第21页,共24页 3.3.总总体均数可信区体均数可信区间间的的计计算公式可以利用算公式可以利用 的抽的抽样样分布分布获获得。得。一种重

17、要的方法是利用一种重要的方法是利用 t 分布计算区间两端的可信分布计算区间两端的可信限限 。单侧单侧可信区可信区间间只需将公式中的双只需将公式中的双侧侧界界值值换换成成单侧单侧界界值值。4.4.假假设检验设检验的的思想是,首先思想是,首先对对所需要比所需要比较较的的总总体提出体提出一个一个无差别的无差别的假假设设,然后通,然后通过样过样本数据去推断是否拒本数据去推断是否拒绝这绝这一假一假设设。其。其实质实质是判断是判断观观察到的察到的“差差别别”是抽是抽样误样误差差引起引起还还是是总总体上的不同,目的体上的不同,目的是评价两个不同的参数或是评价两个不同的参数或两种不同处理引起效应不同的证据有多

18、强,这种证据的两种不同处理引起效应不同的证据有多强,这种证据的强度强度用概率用概率P P 度量和表示。度量和表示。现在学习的是第22页,共24页 5.5.假假设检验设检验有三个有三个基本步基本步骤骤:建立假设和确定检验水准,通常选建立假设和确定检验水准,通常选 选择检验选择检验方法和方法和计计算算检验统计检验统计量量 确定确定P P 值值和做出和做出统计统计推断推断结论结论 所有的假设检验都按照这三个步骤进行,各种检所有的假设检验都按照这三个步骤进行,各种检验方法的差别在于第验方法的差别在于第步计算的检验统计量不同。步计算的检验统计量不同。现在学习的是第23页,共24页感谢大家观看现在学习的是第24页,共24页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 资格考试

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com