总体均数和总体率精选PPT.ppt

上传人:石*** 文档编号:47794243 上传时间:2022-10-03 格式:PPT 页数:62 大小:1.08MB
返回 下载 相关 举报
总体均数和总体率精选PPT.ppt_第1页
第1页 / 共62页
总体均数和总体率精选PPT.ppt_第2页
第2页 / 共62页
点击查看更多>>
资源描述

《总体均数和总体率精选PPT.ppt》由会员分享,可在线阅读,更多相关《总体均数和总体率精选PPT.ppt(62页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、关于总体均数和总体率第1页,讲稿共62张,创作于星期日第一节 均数抽样误差与t分布欲了解总体的特征,最直接的方法是对总体中的每个观察单位进行测量,通过整理分析得到总体参数,但这在医学研究实际中往往是不可能实现的。通常应用抽样研究,通过样本指标来了解总体特征。第2页,讲稿共62张,创作于星期日抽样研究所得样本均数会不会恰好等于未知的总体均数呢?如果固定样本含量n从同一总体中进行多次抽样,所得样本均数又会如何呢?第3页,讲稿共62张,创作于星期日假设已知某地30岁-40岁正常男性血清总胆固醇的均值为5.0mmol/L,标准差为0.6mmol/L。现从该总体中进行随机抽样,每次抽取30名正常男子,并

2、测得他们的血清总胆固醇水平,最终共抽取100份样本,并计算出每份样本的均数。第4页,讲稿共62张,创作于星期日第5页,讲稿共62张,创作于星期日由个体变异产生的,随机抽样引起的样本统计量与总体参数之间的差异称为抽样误差(sampling error)。抽样造成的样本均数与总体均数间的差异就称为均数的抽样误差。在抽样研究中,抽样误差是不可避免的,但抽样误差分布具有一定的规律性。第6页,讲稿共62张,创作于星期日图图3-1 从正从正态态分布分布总总体体N(5.0,0.62)中随机抽)中随机抽样样所得所得样样本均数的分布本均数的分布第7页,讲稿共62张,创作于星期日样本均数大部分分布在总体均数5.0

3、的左右,中间多、两边少,左右基本对称,服从正态分布,并且样本均数的变异范围比原变量的变异范围要小很多。第8页,讲稿共62张,创作于星期日样本均数的标准差称为均数的标准误,简称标准误,用符号 表示。均数的标准误说明各样本均数 围绕总体均数 的离散程度,可用来反映样本均数的抽样误差大小。第9页,讲稿共62张,创作于星期日中心极限定理从正态总体 N(,2)中,随机抽取例数为 n 的样本,样本均数也服从正态分布;即使从偏态总体随机抽样,当 n 足够大时(n 50),样本均数近似正态分布。第10页,讲稿共62张,创作于星期日从均数为,标准差为 的正态或偏态总体中,抽取例数为 n 的样本,样本均数的总体均

4、数也为 ,标准差与原标准差成正比,与样本例数的平方根成反比。第11页,讲稿共62张,创作于星期日第12页,讲稿共62张,创作于星期日 越大,样本均数的分布越分散,样本均数与总体均数的差别越大,抽样误差越大,由样本均数估计总体均数的可靠性越小。反之,越小,样本均数的分布越集中,样本均数与总体均数的差别越小,抽样误差越小,由样本均数估计总体均数的可靠性越大。第13页,讲稿共62张,创作于星期日 的大小与 成正比,与 成反比。当固定不变时,样本含量n增大,减小。因此,在实际工作中,可通过适当增加样本含量来减小抽样误差。第14页,讲稿共62张,创作于星期日 常未知,用 S 估计,因此均数标准误的估计值

5、为第15页,讲稿共62张,创作于星期日t 分布的演化第16页,讲稿共62张,创作于星期日 常未知,若用 ,这时对样本均数进行的不是 Z变换而是 t 变换 统计量 t 不再服从N(0,1)标准正态分布第17页,讲稿共62张,创作于星期日英国统计学家 W.S.Gosset 于1908年以“Student”笔名发表论文,证明统计量 t 服从v=n-1的t分布第18页,讲稿共62张,创作于星期日又称为Student t分布(Students t-distribution)第19页,讲稿共62张,创作于星期日t 分布的图形及特征第20页,讲稿共62张,创作于星期日t 分布的特征为:以0为中心,左右对称的

6、单峰分布 越小,t值越分散,峰越矮,尾越高 增大,t分布逐渐逼近Z分布,时,t分布即为Z分布第21页,讲稿共62张,创作于星期日t 界值表横标目:自由度纵标目:概率 P(曲线下面积)表中数字:自由度为,概率P 为时,所对应的 t 界值,记为t,第22页,讲稿共62张,创作于星期日单侧:或双侧:即第23页,讲稿共62张,创作于星期日在相同自由度时,t 的绝对值越大,P 越小在相同 P 值时,自由度越大所对应的 t 界值越小在相同 t 值时,双侧概率 P 为单侧概率 P 的两倍 时,t界值即为Z界值第24页,讲稿共62张,创作于星期日第二节 总体均数的点估计与区间估计点估计(point estim

7、ation):将样本统计量直接作为总体参数的估计值区间估计(interval estimation):按事先给定的概率,估计包含未知总体参数的一个可能范围第25页,讲稿共62张,创作于星期日区间估计的实质假设某个总体的均数为,需要找到两个量A和B,使得在一个比较高的可信度下(如95%),区间(A,B)能包含。即P(A 50)第30页,讲稿共62张,创作于星期日 例6-3中,因n=120,试求该地正常成年男性 血清胆固醇平均水平的95可信区间。即(3.55,4.17)mmol/L 第31页,讲稿共62张,创作于星期日例6-1 从某地随机抽取120名30岁-40岁正常男性,得其血清总胆固醇水平的均

8、数为4.95mmol/L,标准差为0.64mmol/L,试估计该地30岁-40岁正常男性血清总胆固醇平均水平的95%可信区间。第32页,讲稿共62张,创作于星期日因n=120,属于未知但n足够大,又均数为4.95mmol/L,标准差为0.64mmol/L,故该地30岁-40岁正常男性血清总胆固醇平均水平的95%可信区间为 即(4.84,5.06)mmol/L第33页,讲稿共62张,创作于星期日3.当未知n 较小-t/2,v 0 t/2,v 第34页,讲稿共62张,创作于星期日可信区间的涵义从总体中作随机抽样,每个样本可以算得一个可信区间。如95%可信区间意味着做100次抽样,算得100个可信区

9、间,平均有95个估计正确。在实际研究中,一般只进行一次抽样,算得一个可信区间,对于这个可信区间来说,我们就认为该区间包含了总体均数,把握度为95%。第35页,讲稿共62张,创作于星期日图6-5 从N(0,1)中随机抽样算得的100个95可信区间(n=10)第36页,讲稿共62张,创作于星期日可信区间的两个要素可信度:可靠性,即1-。一般取90%、95,可人为控制区间的宽度:区间的大小(区间的长度),越小越好必须二者兼顾第37页,讲稿共62张,创作于星期日均数的可信区间与参考值范围的区别均数的可信区间与参考值范围的区别第38页,讲稿共62张,创作于星期日第三节 总体率的点估计与区间估计第39页,

10、讲稿共62张,创作于星期日一、二项分布如某如某实验实验中小白鼠染毒后死亡概率中小白鼠染毒后死亡概率P为为0.8,则则生存概率生存概率为为=1-P=0.2,1、对对一只小白鼠一只小白鼠进进行行实验实验的的结结果果为为:死(概率:死(概率为为P)或生(概率)或生(概率为为1-P)2、对对二只小白鼠(甲乙)二只小白鼠(甲乙)进进行行实验实验的的结结果果为为:甲乙均死(概率:甲乙均死(概率为为P2)、甲死乙生)、甲死乙生概率概率为为P(1-P)、乙死甲生、乙死甲生概率概率为为(1-P)P或甲乙均生或甲乙均生概率概率为为(1-P)2,概率,概率相加得相加得P2+P(1-P)+(1-P)P+(1-P)2=

11、P+(1-P)23、依此、依此类类推,推,对对n只小白鼠只小白鼠进进行行实验实验,所有可能,所有可能结结果的概率相加得果的概率相加得Pn+cn1P(1-P)n-1+.+cnxPx(1-P)n-x+.+(1-P)x=P+(1-P)n 其中其中n为样为样本含量本含量,即事件即事件发发生生总总数,数,x为为某事件出某事件出现现次数次数,cnxPx(1-P)n-x为为二二项项式通式,式通式,cnx=n!/x!(n-x)!,P为总为总体率。体率。因此,二因此,二项项分布是分布是说说明明结结果只有两种情况的果只有两种情况的n次次实验实验中中发发生某种生某种结结果果为为x次的概率分布。其概率密度次的概率分布

12、。其概率密度为为:P(x)=cnxPx(1-P)n-x,x=0,1,.n。:。:第40页,讲稿共62张,创作于星期日二项分布的图形第41页,讲稿共62张,创作于星期日当=0.5时,分布对称;当 0.5,分布呈偏态;当0.5时分布呈负偏态;特别是当n值不是很大时,偏离0.5愈远,分布愈偏第42页,讲稿共62张,创作于星期日随着n的增大,二项分布逐渐逼近正态分布。如=0.30,n=5和n=10时,图形呈偏态,当n=30时,图形已接近正态分布。一般地说,如果n或n(1-)大于5时,常可用正态近似原理处理二项分布问题第43页,讲稿共62张,创作于星期日二项分布的性质:累积概率(1)二项分布的概率之和等

13、于1第44页,讲稿共62张,创作于星期日(2)单侧累积概率至多有m例阳性的概率(下侧累积概率)至少有m例阳性的概率(上侧累积概率)第45页,讲稿共62张,创作于星期日二项分布的性质:均数和方差阳性结果发生数X的总体均数总体方差总体标准差第46页,讲稿共62张,创作于星期日二项分布的抽样分布及其性质二项分布的随机抽样性质仍然被中心极限定理所反映在n足够大时,样本率近似服从正态分布样本率p的均数等于样本率p的标准差(率的标准误)第47页,讲稿共62张,创作于星期日二、Poisson 分布当二项分布中n很大,p很小时,二项分布就变为Poisson分布,Poisson分布实际上是二项分布的极限分布法国

14、数学家Simeon Denis Poisson(1781-1840)1837年在关于判断的概率之研究一文中提出的描述随机现象的一种常用分布 第48页,讲稿共62张,创作于星期日Poisson分布也是一种重要的离散型概率分布,用于研究单位时间、单位人群、单位空间内,某稀有事件发生次数的分布单位体积水中细菌数单位体积空气中粉尘数单位时间内放射性物质放射出的质点数单位空间中某些昆虫数一定人群中恶性肿瘤或罕见非传染性疾病患病数或死亡数第49页,讲稿共62张,创作于星期日可以认为满足以下三个条件的随机变量服从Poisson分布:平稳性:X的取值与观察单位的位置无关,只与观察单位的大小有关独立性:在某个观

15、察单位上X的取值与前面各观察单位上X的取值独立(无关)普通性:在充分小的观察单位上X的取值最多为1第50页,讲稿共62张,创作于星期日Poisson分布的概率函数若随机变量的概率函数为:则称此变量服从Poisson分布,记为第51页,讲稿共62张,创作于星期日Poisson分布的累计概率第52页,讲稿共62张,创作于星期日Poisson分布的图形第53页,讲稿共62张,创作于星期日Poisson分布的性质 均数和方差Poisson分布的均数和方差相等,均分布的均数和方差相等,均为为;即;即第54页,讲稿共62张,创作于星期日Poisson分布中均数的抽样分布及其性质在足够大时,Poisson分

16、布的平均计数近似正态分布平均计数的标准误n=1时(1个单位),第55页,讲稿共62张,创作于星期日三、总体率的估计根据样本率,也可以对总体率做出点估计和区间估计。我们用样本率p作为总体率的点估计值。总体率的点估计亦未考虑其抽样误差大小,而总体率的区间估计克服了点估计的缺陷。第56页,讲稿共62张,创作于星期日利用样本资料可估计二项分布总体率的1-可信区间,取0.05或0.01。对于 ,且 接近于0或1时,可直接查表得到总体率的(1-)可信区间。第57页,讲稿共62张,创作于星期日例6-6 某医院应用氨苄青霉素治疗呼吸道感染,45例患者中有2例发生过敏反应。试估计过敏反应发生率的95%可信区间。

17、p70对例6-6资料,查百分率的可信区间表,n=45 的行与X=2 的列交叉处的数值为1-15,即氨苄青霉素过敏反应发生率的95%可信区间为(1%,15%)。第58页,讲稿共62张,创作于星期日当n足够大,且p和1-p 均不太小,如np和n(1-p)均大于5时,的抽样分布逼近正态分布。此时,可根据正态分布的特性计算总体率的可信区间。第59页,讲稿共62张,创作于星期日例6-7 为了解某地18岁以上城市居民的高血压患病率,从社区中随机抽取500人进行调查,得高血压的患病率为32%,试估计该地18岁以上城市居民高血压患病率的95%可信区间。即该地18岁以上城市居民高血压患病率的95%可信区间为(28%,36%)。第60页,讲稿共62张,创作于星期日对于稀有事件发生率的可信区间可以根据Possion分布的性质进行估计。当 20时就可以用正态分布来近似地处理Poisson分布的问题,未知可以用X代替,估计单位时间或单位空间中稀有事件发生数的1-可信区间为第61页,讲稿共62张,创作于星期日2022/10/2感感谢谢大大家家观观看看第62页,讲稿共62张,创作于星期日

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 资格考试

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com