正态分布及抽样误差.pptx

上传人:莉*** 文档编号:88364801 上传时间:2023-04-25 格式:PPTX 页数:73 大小:641.03KB
返回 下载 相关 举报
正态分布及抽样误差.pptx_第1页
第1页 / 共73页
正态分布及抽样误差.pptx_第2页
第2页 / 共73页
点击查看更多>>
资源描述

《正态分布及抽样误差.pptx》由会员分享,可在线阅读,更多相关《正态分布及抽样误差.pptx(73页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、1第1页/共73页2p为什么如此摆放奖品?p平时,我们很少有人会去关心小球下落位置的规律性,人们可能不相信它是有规律的。高尔顿钉板试验高尔顿钉板试验 正态分布的背景一个街头赌博游戏第2页/共73页3Ox-8-7 -6 -5 -4 -3 -2 -1 1 2 3 4 5 6 7 8这条曲线就是我们将要介绍的正态分布曲线。正态分布的背景高尔顿钉板试验第3页/共73页412413214014815616400.100.200.300.40频率图 某市120名12岁男童身高(cm)的频数分布第4页/共73页组 段 频 数 频 率 12410.0083 12820.0167 132100.0833 136

2、220.1834 140370.3083 144260.2167 148150.1250 15240.0333 15620.0167 16016410.0083合 计1201.00005o极差=160.9-125.9=35o分10组,组距=极差/10=35/10=3.5,组距取 4o下界 124,上界164第5页/共73页6身高的分布第6页/共73页正态分布的概率密度函数 如果随机变量X的概率密度函数 则称X服从正态分布,记作XNN(,2),其中,为分布的均数,为分布的标准差。(-X+)第7页/共73页正态分布图示x0.1.2.3.4f(x)第8页/共73页方差相等、均数不等的正态分布图示31

3、2第9页/共73页均数相等、方差不等的正态分布图示213第10页/共73页正态分布的特征正态分布有两个参数(parameter),即位置参数(均数)和变异度参数(标准差)。高峰在均数处;均数两侧完全对称。正态曲线下的面积分布有一定的规律。第11页/共73页正态曲线下的面积规律X轴与正态曲线所夹面积恒等于1。对称区域面积相等。S(-,-X)S(+X,)S(-,-X)X第12页/共73页正态曲线下的面积规律对称区域面积相等。S(-x1,-x2)-x1 -x2 x2 x1S(x1,x2)=S(-x2,-x1)第13页/共73页正态曲线下的面积规律 -4 -3 -2 -1 0 1 2 3 4-3 -2

4、 -+2 +3 S(-,-3)=0.0013S(-,-2)=0.0228S(-,-1)=0.1587S(-,)=0.5S(-,+3)=0.9987S(-,+2)=0.9772S(-,+1)=0.8413S(-,)=1第14页/共73页正态曲线下的面积规律 -4 -3 -2 -1 0 1 2 3 4-3 -2 -+2 +3 1-S(-3 ,+3)=0.00261-S(-2 ,+2)=0.04561-S(-,+)=0.3174第15页/共73页正态曲线下的面积规律-3 -2 -+2 +3 S(-,-3)=0.0013S(-,-2)=0.0228S(-,-1)=0.1587S(-,-0)=0.5S(

5、-3,-2)=0.0215S(-2,-1)=0.1359S(-1,)=0.3413 -4 -3 -2 -1 0 1 2 3 4 第16页/共73页正态曲线下的面积规律-1.96+1.962.5%2.5%95%第17页/共73页正态曲线下的面积规律-1.64+1.645%5%90%第18页/共73页正态曲线下的面积规律-2.58+2.580.5%0.5%99%第19页/共73页S(-1.96,+1.64)=?思考第20页/共73页正态曲线下的面积规律正态曲线下面积总和为1;正态曲线关于均数对称;对称的区域内面积相等;对任意正态曲线,按标准差为单位,对应的面积相等;-1.64+1.64内面积为90

6、%;-1.96+1.96内面积为95%;-2.58+2.58内面积为99%。小于-3的面积为 0.13%;小于-2的面积为 2.28%;小于-的面积为15.87%。第21页/共73页标准正态分布标准正态分布(standard normal distribution)是均数为0,标准差为1的正态分布。记为N(0,1)。标准正态分布是一条曲线。概率密度函数:(-u+)第22页/共73页正态分布转换为标准正态分布若 X XNN(,2),作变换:则u服从标准正态分布。u称为标准正态离差(standard normal deviate)第23页/共73页标准正态分布曲线下面积(u)u 0.00 0.02

7、 0.04 0.06 0.08-3.00.0013 0.0013 0.0012 0.0011 0.0010-2.50.0062 0.0059 0.0055 0.0052 0.0049-2.00.0228 0.0217 0.0207 0.0197 0.0188-1.90.0287 0.0274 0.0262 0.0250 0.0239-1.60.0548 0.0526 0.0505 0.0485 0.0465-1.00.1587 0.1539 0.1492 0.1446 0.1401-0.50.3085 0.3015 0.2946 0.2877 0.2810 00.5000 0.4920 0.4

8、840 0.4761 0.46810u第24页/共73页正态分布的应用估计频数分布质量控制确定临床参考值范围第25页/共73页估计频数分布某项目研究婴儿的出生体重服从正态分布,其均数为3150g,标准差为350g。若以2500g作为低体重儿,试估计低体重儿的比例。首先计算标准离差:查标准正态分布表:(-1.86)=0.0314(-1.86)=0.0314结果:估计低体重儿的比例为3.14%.3.14%.第26页/共73页质量控制质量控制的意义 监控日常工作、科研过程、生产过程中 误差的变化,分析变化的趋势是否出现异常,从而引起警觉和注意,以便分析原因,并及时采取措施。第27页/共73页参考值范

9、围(reference interval)参考值范围又称正常值范围(normal range)。什么是参考值范围:是绝大多数正常人的某观察指标所在的范围。绝大多数:90%,95%,99%等等。确定参考值范围的意义:用于判断正常与异常。“正常人”的定义:排除了影响所研究的指标的疾病和有关因素的同质的人群。第28页/共73页参考值范围确定的原则选定同质的正常人作为研究对象 控制检测误差判断是否分组(性别,年龄组)选择百分界值(90%,95%)确定可疑范围单、双侧问题 第29页/共73页单侧与双侧参考值范围根据医学专业知识确定!双侧:白细胞计数,血清总胆固醇,单侧:上限:转氨酶,尿铅,发汞 下限:肺

10、活量,IQ,第30页/共73页参考值范围的估计方法方法双侧 单侧下限单侧上限正态分布法第31页/共73页例20 29岁正常成年男子尿酸浓度求双侧95%的参考值范围:下限上限第32页/共73页总结正态分布是描述个体变异的重要分布之一,也是统计学理论中的重要分布之一;正态分布是一簇分布,由两个参数决定:均数和标准差;正态分布曲线下的面积是有规律的,且与标准正态分布曲线下的面积对应(以标准正态离差为单位)。第33页/共73页需要掌握的内容正态分布的性质正态曲线下面积的分布规律参考值范围确定的原则和方法第34页/共73页抽样误差及其规律性Sampling variability and its att

11、ributes第35页/共73页从一个例子来谈抽样误差假如事先知道某地七岁男童的平均身高为119.41cm。研究者从所有符合要求的七岁男童中每次抽取100人,共计抽取了五次。36第36页/共73页122.7121.0118.1108.3124.5121.1115.8120.9117.937=119.4cm=4.38cm =118.4cm S=4.41cm119.4u第37页/共73页38119.41cm=4.38cm第38页/共73页导致总体均数与样本均数、样本均数之间有差别的可能原因是?39第39页/共73页抽样误差的定义五次抽样得到了不同的结果,原因何在?40个体变异随机抽样不同男童的身高

12、不同每次抽到的人几乎不同抽样误差第40页/共73页抽样误差的表现41抽样误差的表现样本均数和总体均数间的差别样本均数和样本均数间的差别第41页/共73页抽样误差定义:由于个体变异的存在,由抽样引起的样本统计量与总体参数间的差别。原因:个体变异抽样表现:不同样本统计量间的差别样本统计量与总体参数间的差别抽样误差是不可避免的!抽样误差是不可避免的!抽样误差是有规律的!抽样误差是有规律的!42 第42页/共73页均数的抽样误差之特点各样本均数未必等于总体均数;样本均数间存在差异;样本均数的分布很有规律;43第43页/共73页中心极限定理(central limit theorem)Case 1:从正

13、态分布总体N(,)中随机抽样(每个样本的含量为n如10),可得无限多个样本如1000次,每个样本计算样本均数,则样本均数也服从正态分布。样本均数的均数为 ;样本均数的标准差为 。44第44页/共73页中心极限定理(central limit theorem)Case 2:从非正态分布总体(均数为,方差为)中随机抽样(每个样本的含量为n),可得无限多个样本,每个样本计算样本均数,则只要抽样次数足够大(n50),样本均数也近似服从正态分布。样本均数的均数为 ;样本均数的标准差为 。45第45页/共73页标准误(standard error)样本统计量的标准差称为标准误。样本均数的标准差称为均数的标

14、准误。均数的标准误表示样本均数的变异度。前者称为理论标准误,后者称为样本标准误。46这个公式是怎这个公式是怎么来的?么来的?第46页/共73页已知变量x的方差V(x)=S2,则2x的方差为?已知变量x1的方差V(x1)=S12,变量x2的方差V(x2)=S22,则x1+x2的方差为?47第47页/共73页标准误与标准差(标准误与标准差(1 1)联系:都表示变异的大小;样本含量一定时,标准差越大,标准误越大。第48页/共73页标准误与标准差(标准误与标准差(2 2)标准差含义:一组变量值离散程度;标准差越小,均数的代表性越好;应用:估计参考值范围;与n的关系:样本含量越大,标准差越稳定,n 很大

15、时,标准差趋向于总体标准差。第49页/共73页标准误与标准差(标准误与标准差(3 3)标准误含义:样本统计量的离散程度;标准误越小,用样本均数来反映总体均数越可靠;应用:计算可信区间;与n的关系:样本含量越大,均数的标准误越小,n很大时,标准误趋向于0。第50页/共73页51 Sampling Distributionof sample meansSampling Distributionof sample means Sampling Distributionof sample meansPopulation BX XPopulation C XPopulation DXPopulation

16、 An=10n=4n=25n=2Sampling Distributionof sample means样本均数的抽样分布 第51页/共73页与样本含量的关系n 越大,均数的均数就越接近总体均数;n 越大,变异越小,分布越窄;对称分布接近正态分布的速度,大于非对称分布。分布越偏,接近正态分布所需样本含量就越大。52第52页/共73页抽样误差的规律性抽样误差的规律性(1)均数的抽样误差规律:在样本含量足够大时,无论总体分布如何,其均数的分布趋于正态分布53第53页/共73页54 f(t)(标准正态曲线标准正态曲线)=30.10.2-4-3-2-1012340.3如果样本含量较小时均数的抽样分布如

17、果样本含量较小时均数的抽样分布?第54页/共73页t 分布55第55页/共73页正态分布的标准化变化若 X N(,2),则则 。56n因 ,则 。第56页/共73页t 分布的概念实际工作中,总体方差未知。所以,用样本方差代替总体方差,且当样本含量较小时 的分布如何?57第57页/共73页t分布起源58第58页/共73页t 分布的概念用样本方差代替总体方差,此时不服从正态分布。而服从 t 分布。记为:59第59页/共73页60 f(t)=(标准正态曲线标准正态曲线)=5=10.10.2-4-3-2-1012340.3自由度分别为自由度分别为1、5、时的时的 t 分布分布第60页/共73页t 分布

18、的性质t分布为一簇单峰分布曲线。t分布以0为中心,左右对称。分布的高峰位置比 u u 分布低,尾部高。即相同的尾部面积对应的界值,比 u u 分布大。例如:P P=0.05=0.05,u u=1.64=1.64,而自由度为3 3的 t t分布界值,t t=3.182=3.182。t分布与自由度有关,自由度越小,t分布的峰越低,而两侧尾部翘得越高;自由度逐渐增大时,t分布逐渐逼近标准正态分布;当自由度为无穷大时,t分布就是标准正态分布。每一自由度下的t分布曲线都有其自身分布规律。t界值表。第61页/共73页t t界值表单侧:P(t=t,)=双侧:P(t=t,)=即:P(-t,t t,)=1-例

19、查t界值表得t值表达式 t 0.05,10=2.228 (双侧)t 0.05,10=1.812 (单侧)-tt0第62页/共73页t t 分布曲线下面积双侧:t0.05,10=2.228 表明,从正态分布总体中抽取样本含量为n=11的样本,由该样本计算的t值大与等于2.228的概率为0.025,小于等于-2.228的概率亦为0.025 P(t-2.228)+P(t2.228)=0.05 或:P(-2.228t2.228)=0.95第63页/共73页样本统计量的抽样分布任何一个样本统计量均有其分布规律。从正态分布总体中抽样:均数的抽样分布为正态分布;样本方差的分布服从2分布;样本方差之比服从F分

20、布;t 值服从 t 分布;第64页/共73页研究抽样分布的目的样本统计量的抽样分布规律是统计推断(statistical inference)的理论基础。只有了解抽样分布规律,才能深刻理解统计推断的内涵。65第65页/共73页需要掌握的内容抽样误差的概念、产生的原因及其表现中心极限定理的涵义标准误的涵义、标准误与标准差的区别和联系t分布的性质第66页/共73页 表示总体均数的标准误。()表示样本均数的标准误。()同一批数值变量资料的标准差不会比标准误大。()即使变量X偏离正态分布,只要每次抽样的样本数足够大,样本均数也近似服从正态分布。()67第67页/共73页 表示()A 总体标准差B 样本

21、标准差C 抽样分布均数的理论标准差D 抽样分布均数的估计标准差68第68页/共73页 表示()A 总体均数的离散程度B 总体标准差的离散程度C 样本均数的离散程度D 样本标准差的离散程度69第69页/共73页从连续性变量X中反复随机抽样,随样本含量n增大,将趋于()A X的原始分布 B 正态分布 C 均数的抽样分布 D 标准正态分布70第70页/共73页下面关于标准误的四种说法中,哪一种最不正确()A 标准误是样本统计量的标准差B 标准误反映了样本统计量的变异C 标准误反映了总体参数的变异D 标准误反映了抽样误差的大小71第71页/共73页简答题请简述标准差与标准误的区别和联系。区别:联系:72第72页/共73页谢谢您的观看!第73页/共73页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > PPT文档

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com