第三章抽样误差与假设检验课件.ppt

上传人:石*** 文档编号:50886679 上传时间:2022-10-16 格式:PPT 页数:34 大小:1.92MB
返回 下载 相关 举报
第三章抽样误差与假设检验课件.ppt_第1页
第1页 / 共34页
第三章抽样误差与假设检验课件.ppt_第2页
第2页 / 共34页
点击查看更多>>
资源描述

《第三章抽样误差与假设检验课件.ppt》由会员分享,可在线阅读,更多相关《第三章抽样误差与假设检验课件.ppt(34页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、笃学精业修德厚生笃学精业修德厚生1第1页,此课件共34页哦第三章第三章 抽样误差与假设检验抽样误差与假设检验掌握内容:掌握内容:1t分布的概念和特征分布的概念和特征 2总体均数的区间估计总体均数的区间估计 3假设检验的基本步骤假设检验的基本步骤 4假设检验的基本原理假设检验的基本原理5常用的数值型变量假设检验的方法常用的数值型变量假设检验的方法第2页,此课件共34页哦熟悉:熟悉:1、抽样误差的概念、抽样误差的概念2、引起抽样误差的原因、引起抽样误差的原因3、均数的标准误的计算、均数的标准误的计算4、标准差和标准误的区别、标准差和标准误的区别 第三章第三章 抽样误差与假设检验抽样误差与假设检验第

2、3页,此课件共34页哦第一节第一节 抽样分布与抽样误差抽样分布与抽样误差 一抽样研究一抽样研究(一)抽样研究的意义(一)抽样研究的意义样样本本总体总体第4页,此课件共34页哦(1)由于研究对象很多是无限总体,要直接研究总体由于研究对象很多是无限总体,要直接研究总体的情况是不可能的。的情况是不可能的。(2)即使对有限总体来说,若包含的观察单位数过多,即使对有限总体来说,若包含的观察单位数过多,需要耗费大量的人力、物力和时间,而且也不易组织,需要耗费大量的人力、物力和时间,而且也不易组织,难以保证工作的质量。难以保证工作的质量。(3)有的时候,观察的实质就是一种破坏性实验,根有的时候,观察的实质就

3、是一种破坏性实验,根本就不允许对总体中的每一个体逐一观察。本就不允许对总体中的每一个体逐一观察。为什么要做抽样研究?为什么要做抽样研究?第5页,此课件共34页哦目前抽样研究的理论与技术已发展成熟,目前抽样研究的理论与技术已发展成熟,只要严格按照有关抽样研究的要求去做,这只要严格按照有关抽样研究的要求去做,这是完全可行的。是完全可行的。目的:就是要用样本信息来推断总体特征,目的:就是要用样本信息来推断总体特征,这就叫统计推断(这就叫统计推断(statistical inference)第6页,此课件共34页哦(二)抽样研究和抽样误差(二)抽样研究和抽样误差 抽样研究是指从总体中按照随机化的原则,

4、抽抽样研究是指从总体中按照随机化的原则,抽取一定数量的个体组成样本进行研究,从而推断取一定数量的个体组成样本进行研究,从而推断总体的研究方法。总体的研究方法。在抽样研究中产生的样本在抽样研究中产生的样本统计量统计量与相应的总与相应的总体体参数参数间的差异,称为抽样误差(间的差异,称为抽样误差(sampling error),),第7页,此课件共34页哦 (三)、抽样误差的分布(三)、抽样误差的分布 理理论论上可以上可以证证明:若从正明:若从正态总态总体体 中,反复中,反复多次随机抽取多次随机抽取样样本含量固定本含量固定为为n 的的样样本,那么本,那么这这些些样样本均数本均数 也服从正也服从正态

5、态分布,即分布,即 的的总总体均数仍体均数仍为为 ,样样本均数的本均数的标标准差准差为为 。抽样分布抽样分布 抽样分布示意图抽样分布示意图第8页,此课件共34页哦 (三)、抽样误差的分布(三)、抽样误差的分布中心极限定理中心极限定理 当当样样本含量很大的情况下,无本含量很大的情况下,无论论原始原始测测量量变变量服从什么量服从什么分布,分布,的抽的抽样样分布分布均均近似正近似正态态。抽样分布抽样分布图图 抽样分布示意图抽样分布示意图第9页,此课件共34页哦二均数的抽样误差二均数的抽样误差 如上所述,数理统计研究表明,抽样误差如上所述,数理统计研究表明,抽样误差具有一定的规律性,可以用特定的指标来

6、描述。具有一定的规律性,可以用特定的指标来描述。这个指标称为这个指标称为标准误标准误(standard errorSE)。)。标准误除了反映样本统计量之间的离散标准误除了反映样本统计量之间的离散程度外,也反映样本统计量与相应总体参数程度外,也反映样本统计量与相应总体参数之间的差异,即之间的差异,即抽样误差大小抽样误差大小。第10页,此课件共34页哦意义意义:反映抽样误差的大小。标准误越小,抽样:反映抽样误差的大小。标准误越小,抽样误差越小,用样本均数估计总体均数的可靠性越误差越小,用样本均数估计总体均数的可靠性越大。大。与样本量的关系:与样本量的关系:S 一定,一定,n,标准误,标准误标准误的

7、计算公式:标准误的计算公式:第11页,此课件共34页哦 例例4.1 在在某某地地随随机机抽抽查查成成年年男男子子140人人,计计算算得得红红细细胞胞均均数数4.771012/L,标标准准差差0.38 1012/L,试计算均数的标准误。,试计算均数的标准误。第12页,此课件共34页哦均数标准误的用途均数标准误的用途1衡量样本均数的可靠性衡量样本均数的可靠性 由于均数标准由于均数标准误越小,均数的抽样误差越小,样本均误越小,均数的抽样误差越小,样本均数就越可靠,代表性越好。数就越可靠,代表性越好。2估计总体均数的可信区间。估计总体均数的可信区间。3用于均数的假设检验。用于均数的假设检验。第13页,

8、此课件共34页哦第二节第二节 t 分布分布 一一t 分布分布(t-distribution)(一)(一)Z分布分布 正态分布正态分布(normal distribution)常将一般的正态变量常将一般的正态变量X通过变换通过变换 转化成转化成标准正态变量标准正态变量Z,以使原来各种形态的正态分布都转,以使原来各种形态的正态分布都转换为换为=0,=1的标准正态分布(的标准正态分布(standard normal distribution),亦称亦称Z分布。分布。第14页,此课件共34页哦在正态分布总体中以固定在正态分布总体中以固定n(如(如n=10)抽取若干个样本时,样本均数的分布仍服)抽取若干

9、个样本时,样本均数的分布仍服从正态分布,即。所以,对样本从正态分布,即。所以,对样本均数的分布进行均数的分布进行Z变换变换,也可变换为标准正态分布也可变换为标准正态分布N(0,1)。第15页,此课件共34页哦由于在实际工作中,往往由于在实际工作中,往往是未知的,是未知的,常用常用s作为作为的估计值,为了与的估计值,为了与Z变换区别,变换区别,称为称为t 变换变换t=,统计量,统计量t 值的分布值的分布称为称为t 分布。分布。(二)(二)t分布分布 第16页,此课件共34页哦t分布有如下特征分布有如下特征 1以以0为中心,左右对称的单峰分布;为中心,左右对称的单峰分布;2t分布是一簇曲线,其形态

10、变化与分布是一簇曲线,其形态变化与n(确切地说与(确切地说与自由度自由度)大小有关。自由度)大小有关。自由度越小,越小,t分布曲线越低平;分布曲线越低平;自由度自由度越大,越大,t分布曲线越接近标准正态分布(分布曲线越接近标准正态分布(u分分布)曲线,如图布)曲线,如图4.1。图4.1 自由度为1、5、的t分布 第17页,此课件共34页哦t分布曲线下的面积与自由度分布曲线下的面积与自由度有关有关系。如系。如t 分布曲线下面积为分布曲线下面积为95%或或99%的的界值不是一个常量,而是随着自由度大小界值不是一个常量,而是随着自由度大小而变化的,分别用而变化的,分别用 和和 表示。表示。t 分布曲

11、线下面积分布曲线下面积第18页,此课件共34页哦第三节第三节 总体均数的估计总体均数的估计 统计推断包括两个重要的方面:统计推断包括两个重要的方面:参数估参数估计和假设检验计和假设检验。参数估计就是用样本指标(称为统计量,参数估计就是用样本指标(称为统计量,statistic)来估计总体指标(参数,)来估计总体指标(参数,parameter)。参数估计有两种方法:点估)。参数估计有两种方法:点估计和区间估计。计和区间估计。第19页,此课件共34页哦 第三节第三节 总体均数的估计总体均数的估计 一、可信区间的概念一、可信区间的概念(Confidence Interval(Confidence I

12、nterval)区间估计:区间估计:指按预先给定的概率,计算出一个区间,指按预先给定的概率,计算出一个区间,使它能够包含未知的总体均数。事先给定的概率使它能够包含未知的总体均数。事先给定的概率 称为可信度,通常取称为可信度,通常取 。参数估计参数估计点估计:不考虑抽样误差,如点估计:不考虑抽样误差,如区间估计:考虑抽样误差区间估计:考虑抽样误差第20页,此课件共34页哦1已知或已知或未知但未知但n(n50)足足够够大大时时,由,由Z分布可知分布可知:(1)已知:已知:即即写成区间形式:写成区间形式:二、可信区间的计算二、可信区间的计算 第21页,此课件共34页哦同理,单侧可信区间为:同理,单侧

13、可信区间为:或或(2)未知,但足够大:未知,但足够大:可信区间为:可信区间为:第22页,此课件共34页哦2未知,且未知,且n(n50)不不够够大大时时,按,按t分布原理得分布原理得到均数的可信区到均数的可信区间为间为:即:即:同理,单侧可信区间为:同理,单侧可信区间为:,第23页,此课件共34页哦(10.9-2.093*3.86/例例 对某人群随机抽取对某人群随机抽取20人,用某批号的结核菌素作人,用某批号的结核菌素作皮试,平均浸润直径为皮试,平均浸润直径为10.9cm,标准差为,标准差为3.86cm。问这批结核菌素在该人群中使用时,皮试的平均浸问这批结核菌素在该人群中使用时,皮试的平均浸润直

14、径的润直径的95%可信区间是多少?可信区间是多少?该例该例n=20,n较小,因此,可认为平均浸润直径服较小,因此,可认为平均浸润直径服从从t分布。自由度分布。自由度=20-1=19,查,查t 界值表,得界值表,得=2.093,10.9+2.093*3.86/即即(9.1,12.7)cm。)cm第24页,此课件共34页哦 图图4-2 4-2 模拟抽样成年男子红细胞数模拟抽样成年男子红细胞数100100次的次的95%95%可信区间示意图可信区间示意图 *三可信区间的注意问题三可信区间的注意问题 1可信区间的涵义可信区间的涵义第25页,此课件共34页哦准确度:反映在可信度的大小,即区间包含总准确度:

15、反映在可信度的大小,即区间包含总体均数的概率的大小,愈接近体均数的概率的大小,愈接近1愈好。愈好。精密度:反映在区间的长度,长度愈小愈精密度:反映在区间的长度,长度愈小愈好。好。三可信区间的注意问题三可信区间的注意问题2可信区间的两个要素可信区间的两个要素:准确度和精密度。准确度和精密度。第26页,此课件共34页哦3.均数的可信区间与参考值范围的区别均数的可信区间与参考值范围的区别表表 均数的可信区间与参考值范围的区别均数的可信区间与参考值范围的区别含含 义义计算公式计算公式用用 途途可信区间可信区间按预先给定的概率,按预先给定的概率,确定总体均数的可确定总体均数的可能范围;能范围;总体均数的

16、波动范总体均数的波动范围。围。未知,未知,已知或已知或n很大,很大,总体均数的总体均数的区间估计区间估计参考值参考值 范围范围正常人的解剖、生正常人的解剖、生理、生化某项指标理、生化某项指标的波动范围;个体的波动范围;个体值的波动范围。值的波动范围。正态分布,正态分布,偏态分布偏态分布绝大多数观绝大多数观察对象某项察对象某项指标的分布指标的分布范围范围第27页,此课件共34页哦第四节、假设检验的基本步骤第四节、假设检验的基本步骤 假设检验假设检验(hypothesis test)是用来判断是用来判断样本样本与样本与样本,样本与总体样本与总体的差异是由的差异是由抽样误差抽样误差引引起还是起还是本

17、质差别本质差别造成的造成的统计推断方法统计推断方法。假假设检验亦称差别有无统计学意义检验设检验亦称差别有无统计学意义检验(significance test)一、假设检验的基本思想一、假设检验的基本思想第28页,此课件共34页哦例:为研究某山区成年男子的脉搏均数是否高例:为研究某山区成年男子的脉搏均数是否高于一般成年男子的脉搏均数,如某医生在某山于一般成年男子的脉搏均数,如某医生在某山区随机测量了区随机测量了25名健康成年男子的脉搏,平均名健康成年男子的脉搏,平均次数为次数为74.2次分钟,标准差为次分钟,标准差为6.0次分钟,次分钟,但是根据医学常识,一般男子的平均脉搏次数但是根据医学常识,

18、一般男子的平均脉搏次数为为72次分钟,问该山区男子脉搏均数是否高于次分钟,问该山区男子脉搏均数是否高于一般男子的脉搏均数?一般男子的脉搏均数?结果是怎样呢?结果是怎样呢?一、假设检验的基本思想一、假设检验的基本思想第29页,此课件共34页哦1)由抽样误差所造成;由抽样误差所造成;2)该样本均数确实与正常成年男性脉该样本均数确实与正常成年男性脉搏数不同。搏数不同。两种可能:两种可能:一、假设检验的基本思想一、假设检验的基本思想第30页,此课件共34页哦先对总体的特征建立假设,然后判断此假设应先对总体的特征建立假设,然后判断此假设应该被拒绝或不被拒绝。该被拒绝或不被拒绝。假设检验的基本思想是小概率

19、假设检验的基本思想是小概率(P0.05)反证法思想反证法思想,是先提出假设是先提出假设(检验假设检验假设H0),再用适当的统计方法确,再用适当的统计方法确定假设成立的可能性大小,如可能性小定假设成立的可能性大小,如可能性小,则认为假设不则认为假设不成立,若可能性大,则还不能认为假设不成立。成立,若可能性大,则还不能认为假设不成立。一、假设检验的基本思想一、假设检验的基本思想第31页,此课件共34页哦二、假设检验的基本步骤二、假设检验的基本步骤l 零假设、无效假设零假设、无效假设(null hypothesis):假设样本来自假设样本来自同一总体,即其总体参数相等同一总体,即其总体参数相等(H0

20、)。l 备择假设备择假设(H1)(alternative hypothesis):作为拒绝作为拒绝检验假设时的备选假设;检验假设时的备选假设;l 检验水准检验水准(size of test),又称显著性水平,又称显著性水平(significance level)为拒绝检验假设是犯第一类错误为拒绝检验假设是犯第一类错误的概率,是预先设定的概率值。的概率,是预先设定的概率值。1、建立假设,确定检验水准。、建立假设,确定检验水准。第32页,此课件共34页哦 变量的分布类型不同、研究目的不同,变量的分布类型不同、研究目的不同,都决定着选择何种检验方法。因此需选择都决定着选择何种检验方法。因此需选择合适的检验方法,并计算统计量。合适的检验方法,并计算统计量。二、假设检验的基本步骤二、假设检验的基本步骤2、选择检验方法,并计算统计量、选择检验方法,并计算统计量第33页,此课件共34页哦 根据计算的统计量,查阅相应的统计表,根据计算的统计量,查阅相应的统计表,确定确定P P 值,以值,以P P 值与检验水准值与检验水准 比较,若比较,若 ,则拒绝,则拒绝 ,接受,接受 ;若;若 ,则不拒绝,则不拒绝 。3.根据统计量确定根据统计量确定P 值,作出统计推断值,作出统计推断二、假设检验的基本步骤二、假设检验的基本步骤第34页,此课件共34页哦

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com