医学统计学第讲抽样误差与分布幻灯片.ppt

上传人:石*** 文档编号:87264754 上传时间:2023-04-16 格式:PPT 页数:44 大小:2.82MB
返回 下载 相关 举报
医学统计学第讲抽样误差与分布幻灯片.ppt_第1页
第1页 / 共44页
医学统计学第讲抽样误差与分布幻灯片.ppt_第2页
第2页 / 共44页
点击查看更多>>
资源描述

《医学统计学第讲抽样误差与分布幻灯片.ppt》由会员分享,可在线阅读,更多相关《医学统计学第讲抽样误差与分布幻灯片.ppt(44页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、医学统计学第讲抽样误差与分布第1页,共44页,编辑于2022年,星期五如:总体均数如:总体均数 总体标准差总体标准差 如:样本均数如:样本均数 样本标准差样本标准差S 总体总体样本样本抽取部分观察单位抽取部分观察单位 统计量统计量统计量统计量参参参参 数数数数 统计推断统计推断第2页,共44页,编辑于2022年,星期五在医疗卫生实践和医学研究中,往往难以对所要研究在医疗卫生实践和医学研究中,往往难以对所要研究的总体进行全部观察,通常从总体中随机抽取样本进的总体进行全部观察,通常从总体中随机抽取样本进行观察,然后由样本的信息去推断总体特征,这种研行观察,然后由样本的信息去推断总体特征,这种研究方

2、法叫做究方法叫做抽样研究方法抽样研究方法。用样本的信息去推断总体特征,这种分析方法称为用样本的信息去推断总体特征,这种分析方法称为统统计推断计推断。基本手段基本手段直接推断(参数估计)直接推断(参数估计)间接推断(假设检验)间接推断(假设检验)第3页,共44页,编辑于2022年,星期五总体参数的估计均数的抽样误差 t分布 总体均数的估计第4页,共44页,编辑于2022年,星期五假如事先知道某地七岁男童的平均身高为假如事先知道某地七岁男童的平均身高为119.41cm。为了估计七。为了估计七岁男童的平均身高(总体均数),研究者从所有符合要求的七岁男童的平均身高(总体均数),研究者从所有符合要求的七

3、岁男童中每次抽取岁男童中每次抽取100人,共计抽取了三次。人,共计抽取了三次。119.41cm=4.38cm第5页,共44页,编辑于2022年,星期五三次抽样得到了不同的结果!原因何在?第6页,共44页,编辑于2022年,星期五如果没有个体变异如果没有个体变异No Variation!No Sampling Error!第7页,共44页,编辑于2022年,星期五No Random sampling!No Sampling Error!如果没有抽样研究如果没有抽样研究第8页,共44页,编辑于2022年,星期五三次抽样得到了不同的结果,原因何在?个体变异随机抽样不同男童的身高不同每次抽到的人几乎不

4、同抽样误差第9页,共44页,编辑于2022年,星期五【定义】由于个体变异的存在,在抽样研究中产生样本统计量和总体参数之间的差异,称为抽样误差(sampling error)。各种参数估计都有抽样误差,这里我们以各种参数估计都有抽样误差,这里我们以均数均数为为研究对象研究对象第10页,共44页,编辑于2022年,星期五抽样误差产生的条件抽样研究个体变异第11页,共44页,编辑于2022年,星期五抽样误差的表现样本均数和总体均数间的差别样本均数和样本均数间的差别抽样误差是不可避免的,可以通过保证总体的同抽样误差是不可避免的,可以通过保证总体的同质性及增大样本含量来缩小抽样误差。质性及增大样本含量来

5、缩小抽样误差。第12页,共44页,编辑于2022年,星期五 从从正态分布总体正态分布总体N N(5.00,0.505.00,0.502 2)中,每次随中,每次随机抽取样本含量机抽取样本含量n n5 5,并计算其均数与标准差;,并计算其均数与标准差;重复抽取重复抽取10001000次,获得次,获得10001000份样本;计算份样本;计算10001000份份样本的均数与标准差,并对样本的均数与标准差,并对10001000份样本的均数作份样本的均数作直方图。直方图。按上述方法再做样本含量按上述方法再做样本含量n n1010、样本含量、样本含量n n3030的抽样实验;比较计算结果。的抽样实验;比较计

6、算结果。抽样误差的规律性抽样误差的规律性正态分布抽样正态分布抽样正态分布抽样正态分布抽样第13页,共44页,编辑于2022年,星期五抽样试验(抽样试验(n n=5=5)第14页,共44页,编辑于2022年,星期五抽样试验(抽样试验(n n=10=10)第15页,共44页,编辑于2022年,星期五抽样试验(抽样试验(n n=30=30)第16页,共44页,编辑于2022年,星期五10001000份样本抽样计算结果份样本抽样计算结果总体的总体的均数均数总体标总体标准差准差 均数的均数的均数均数均数标准差均数标准差n n=5=55.005.000.500.504.994.990.22120.2212

7、0.22360.2236n n=10=105.005.000.500.505.005.000.15800.15800.15810.1581n n=30=305.005.000.500.505.005.000.09200.09200.09130.0913第17页,共44页,编辑于2022年,星期五3 3个抽样实验结果图示个抽样实验结果图示第18页,共44页,编辑于2022年,星期五非正态分布抽样非正态分布抽样分别从各总体中抽取分别从各总体中抽取10000个样本含量为个样本含量为n的样本,计算每个样本的均数,并绘制的样本,计算每个样本的均数,并绘制频数分布图。频数分布图。n分别取分别取2、4、10

8、、25。第19页,共44页,编辑于2022年,星期五偏三角分布抽样 第20页,共44页,编辑于2022年,星期五均匀分布第21页,共44页,编辑于2022年,星期五指数分布第22页,共44页,编辑于2022年,星期五双峰分布第23页,共44页,编辑于2022年,星期五从正态总体中随机抽样,其样本均数服从正态分布;从任意总体中随机抽样,当样本含量足够大时,其样本均数的分布逐渐逼近正态分布;样本均数之均数的位置始终在总体均数的附近;随着样本含量的增加,样本均数的离散程度越来越小,表现为样本均数的分布范围越来越窄,其高峰越来越尖。第24页,共44页,编辑于2022年,星期五从正态总体中随机抽取例数为

9、从正态总体中随机抽取例数为n的样本,样的样本,样本均数本均数x也服从正态分布,即使从偏态总体也服从正态分布,即使从偏态总体中抽样,只要样本例数足够大,如中抽样,只要样本例数足够大,如n50,样本均数样本均数x也近似正态分布。也近似正态分布。从均数为从均数为 ,标准差为,标准差为 的正态总体中随机的正态总体中随机抽取例数为抽取例数为n的样本,样本均数的总体均数的样本,样本均数的总体均数为为 ,标准差为,标准差为 x第25页,共44页,编辑于2022年,星期五中心极限定理中心极限定理第26页,共44页,编辑于2022年,星期五标准误的定义标准误的定义样本统计量(如均数)也服从一定的分布。与描述观测

10、值离散趋势的指标类似,样本统计量的标准差就反映了从某个总体中随机抽样所得样本之均数分布的离散程度。用样本统计量的标准差来反映抽样误差的大小。又称标准误(standard error)。第27页,共44页,编辑于2022年,星期五 x标准误标准误 x=/nsx=s/n第28页,共44页,编辑于2022年,星期五标准误的意义标准误的意义反映了样本统计量(样本均数,样本率)分布的离散程度,体现了抽样误差的大小。标准误越大,说明样本统计量(样本均数,样本率)的离散程度越大,即用样本统计量来直接估计总体参数越不可靠。反之亦然。标准误的大小与标准差有关,在例数n一定时,从标准差大的总体中抽样,标准误较大;

11、而当总体一定时,样本例数越多,标准误越小。说明我们可以通过增加样本含量来减少抽样误差的大小。第29页,共44页,编辑于2022年,星期五用途:用途:(1)衡量样本均值的可靠性(2)估计总体均值的可信区间(3)用于均数的假设检验第30页,共44页,编辑于2022年,星期五随机变量随机变量X XN N(,s s2 2)标准正态分布标准正态分布N N(0 0,1 12 2)u u变换变换标准正态分布标准正态分布N N(0 0,1 12 2)均数均数Student Student t t分布分布自由度自由度=n=n-1-1t变换变换第31页,共44页,编辑于2022年,星期五由W.S.Gosset提出

12、第32页,共44页,编辑于2022年,星期五 t=x-s/n对于不同的对于不同的n,有不同的有不同的t分布曲线。分布曲线。第33页,共44页,编辑于2022年,星期五 f(t)=(标准正态曲线)=5=10.10.2-4-3-2-1012340.3自由度分别为1、5、时的 t 分布第34页,共44页,编辑于2022年,星期五t t分布的特征:分布的特征:分布的特征:分布的特征:t分布为一簇单峰分布曲线。分布为一簇单峰分布曲线。t分布以分布以0为中心,左右对称。为中心,左右对称。t分布与自由度分布与自由度有关,自由度越小,有关,自由度越小,t分布的峰分布的峰越低,而两尾越高;自由度逐渐增大时,越低

13、,而两尾越高;自由度逐渐增大时,t分布逐渐逼分布逐渐逼近标准正态分布;当自由度为无穷大时,近标准正态分布;当自由度为无穷大时,t分布就是分布就是标准正态分布。标准正态分布。第35页,共44页,编辑于2022年,星期五t分布曲线下面积规律t分布曲线下总面积仍为1或100%t分布曲线下面积以0为中心左右对称由于t分布是一簇曲线,故t分布曲线下面积固定面积(如95%或99%)的界值不是一个常量,而是随自由度的大小而变化第36页,共44页,编辑于2022年,星期五其通式为 单侧:P(t-t,)=或P(tt,)=双侧:P(t-t/2,)+P(tt/2,)=图中非阴影部分面积的概率为,P(-t/2,tt/

14、2,)=1-第37页,共44页,编辑于2022年,星期五t分布的界值分布的界值t,检验水准检验水准(尾端概率尾端概率)自由度自由度 在在t 检验中很重要检验中很重要第38页,共44页,编辑于2022年,星期五t 界值表界值表 横标目:自由度,横标目:自由度,纵标目:尾端概率,纵标目:尾端概率,p,即曲线下阴影部分的面积即曲线下阴影部分的面积;表中的数字:相应的表中的数字:相应的|t|界值。界值。第39页,共44页,编辑于2022年,星期五附表2,t分布表的特点附表2的横标目为自由度,纵标目为概率P,表中数值为其相应的t界值,记作t,。附表2只列出正值,若计算的t值为负值时,可用其绝对值查表。附

15、表2右上附图的阴影部分表示t,以外尾部面积的概率。第40页,共44页,编辑于2022年,星期五单侧单侧t0.05,30=1.697,表示=30时,t1.697的概率或t-1.697的概率为0.05,记作P(t-1.697)=0.05或P(t 1.697)=0.05;双侧双侧t0.05,30=2.042,表示=30时,t2.042的概率和t-2.042的概率之和为0.05,记作P(t-2.042)+P(t 2.042)=0.05第41页,共44页,编辑于2022年,星期五图中非阴影部分面积的概率为:P(-/2,t t/2,)=1-从附表2中还可以看出,双侧概率P为单侧概率的两倍,如双侧t0.10

16、/2,30=单侧t0.05,30=1.697第42页,共44页,编辑于2022年,星期五区别区别 标准差标准差 s 标准误标准误 sx意义意义 个体变异个体变异 统计量的抽样误差统计量的抽样误差用途用途 正常值范围正常值范围 总体均数的可信区间总体均数的可信区间 (x1.96s)(xt ,s x)与与n关系关系 n s趋于稳定趋于稳定 n sx趋于趋于 0第43页,共44页,编辑于2022年,星期五联系联系 1.两者都是变异指标,说明个体之间的变异用标准差,说明统计量之间的变异用标准误。2.当样本含量不变时,标准差大,标准误亦大,均数的标准差与标准误成正比。第44页,共44页,编辑于2022年,星期五

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com