抽样误差与区间估计.ppt

上传人:wuy****n92 文档编号:73410426 上传时间:2023-02-18 格式:PPT 页数:28 大小:382.50KB
返回 下载 相关 举报
抽样误差与区间估计.ppt_第1页
第1页 / 共28页
抽样误差与区间估计.ppt_第2页
第2页 / 共28页
点击查看更多>>
资源描述

《抽样误差与区间估计.ppt》由会员分享,可在线阅读,更多相关《抽样误差与区间估计.ppt(28页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、第三章第三章 总体均数的估计与假设检验总体均数的估计与假设检验第一节第一节 均数的抽样误差与标准误均数的抽样误差与标准误n抽样误差抽样误差(sampling error):由个体变异:由个体变异产生的、抽样造成的样本统计量与样本统产生的、抽样造成的样本统计量与样本统计量之间、样本统计量与总体参数的差异。计量之间、样本统计量与总体参数的差异。无倾向性、不可避免无倾向性、不可避免100份样本的均数和标准差将将这这100100份份样样本本的的均均数数看看成成新新变变量量值值,按按第第二二章章的的频频数数分分布布方方法法,得得到到这这100100个个样样本本均均数数得得直直方方图图见见图图3-13-1

2、。图图3-1 随机抽样所得随机抽样所得100个样本均数的分布个样本均数的分布100个样本均数的抽样分布特点:样本均数的抽样分布特点:=4.83 100个样样本本均均数数中中,各各样样本本均均数数间间存存在在差差异异,但但各样本均数在总体均数周围波动。各样本均数在总体均数周围波动。样样本本均均数数的的分分布布曲曲线线为为中中间间高高,两两边边低低,左右对称,近似服从左右对称,近似服从正态分布正态分布。样本均数的标准差明显变小:样本均数的标准差明显变小:即即样样本本均均数数的的标标准准差差,可可用用于于衡衡量量抽抽样样误误差的大小。差的大小。因通常因通常未知,计算标准误采用下式:未知,计算标准误采

3、用下式:标准误(standard error,SE)通过增加样本通过增加样本含量含量n来降低抽来降低抽样误差。样误差。3 3个抽样实验结果图示个抽样实验结果图示抽样实验小结抽样实验小结 均数的均数均数的均数围绕总体均数上下波动。围绕总体均数上下波动。均数的标准差均数的标准差即即标准误标准误 与总体标准与总体标准差差 相差一个常数的倍数,即相差一个常数的倍数,即 从正态总体从正态总体N N(m m,s s2 2)中抽取样本,获得均数中抽取样本,获得均数的分布仍近似呈的分布仍近似呈正态分布正态分布N(m m,s s2/n)。标准差与标准误的区别与联系标准差与标准误的区别与联系1、概念不同:标准差是

4、描述样本中个体值的变异程度的、概念不同:标准差是描述样本中个体值的变异程度的指标,其值越小,表示变量值围绕均数的波动越小;指标,其值越小,表示变量值围绕均数的波动越小;标准误是描述样本均数间变异度的指标,其值越小,表标准误是描述样本均数间变异度的指标,其值越小,表示样本均数围绕总体均数波动越小。示样本均数围绕总体均数波动越小。2、用途不同:标准差用于表示变量值对均数波动的大小,、用途不同:标准差用于表示变量值对均数波动的大小,当资料呈正态分布时,与均数结合可估计正常值范围,当资料呈正态分布时,与均数结合可估计正常值范围,计算变异系数等;标准误用于表示样本统计量(样本计算变异系数等;标准误用于表

5、示样本统计量(样本均数、样本率)对总体参数(总体均数、总体率)的均数、样本率)对总体参数(总体均数、总体率)的波动情况,可估计参数的可信区间,进行假设检验。波动情况,可估计参数的可信区间,进行假设检验。3、与样本例数关系不同:样本量足够大时,标、与样本例数关系不同:样本量足够大时,标准差趋向稳定,标准误随例数增加而减小,甚准差趋向稳定,标准误随例数增加而减小,甚至趋近于至趋近于0,若样本量趋向总例数,则标准误,若样本量趋向总例数,则标准误接近接近0;4、二者联系:均为变异指标,若把总体中各样、二者联系:均为变异指标,若把总体中各样本均数看作一个变量,则标准误可称为样本均本均数看作一个变量,则标

6、准误可称为样本均数的标准差,当样本量不变时,均数的标准误数的标准差,当样本量不变时,均数的标准误与标准差成正比。二者均可与均数结合运用,与标准差成正比。二者均可与均数结合运用,但描述的内容各不相同。但描述的内容各不相同。第二节第二节 t t 分布分布(t-distribution)随机变量随机变量X XN N(m m,s s2 2)标准正态分布标准正态分布N N(0 0,1 12 2)Z变换均数均数标准正态分布标准正态分布N N(0 0,1 12 2)Student Student t t分布分布自由度:自由度:n n-1-1t分布的特征 以以0为中心,左右对称的单峰分布;为中心,左右对称的单

7、峰分布;t 分布曲线是一簇曲线,其形态变化与自由度的分布曲线是一簇曲线,其形态变化与自由度的大小有关。大小有关。自由度越小,则自由度越小,则t 值越分散,曲线越低平;值越分散,曲线越低平;自由度逐渐增大时,自由度逐渐增大时,t 分布逐渐逼近分布逐渐逼近Z 分布分布(标标准正态分布准正态分布);当趋于;当趋于时,时,t 分布趋近分布趋近Z 分布,分布,Z 分布是分布是t 分布的特例。分布的特例。图4-2 不同自由度下的t 分布图t 界值表界值表1.8122.228-2.228tf(t)=10=10的的t t分布图分布图t0.05/2,10=t0.025,10=2.228t界值表中的变化规律界值表

8、中的变化规律 n相同自由度时,相同自由度时,t 值越大,概率值越大,概率P 越小;越小;n在相同在相同 t 值时,同一自由度的双侧概率是值时,同一自由度的双侧概率是单侧概率的两倍,单侧概率的两倍,t0.05/2,10=t0.025,10。参数估计:用样本指标值(参数估计:用样本指标值(统计量统计量)推断)推断总体指标值(总体指标值(参数参数)。)。包括包括点估计点估计和和区间估计区间估计第三节第三节 总体均数的可信区间估计总体均数的可信区间估计 总体均数的点估计(总体均数的点估计(point estimationpoint estimation)与区间估计)与区间估计(interval est

9、imationinterval estimation)参数的估计参数的估计点估计点估计:由样本统计量:由样本统计量 直接估计直接估计 总体参数总体参数区间估计区间估计:在一定:在一定可信度可信度(Confidence level)下,下,同时考虑抽样误差同时考虑抽样误差 按预先给定的概率按预先给定的概率(1 ),确定一个包含未知总体参数的,确定一个包含未知总体参数的范围。这一范围称为参数的可信区间或置信区间范围。这一范围称为参数的可信区间或置信区间(confidence interval,CI)(1 )称为可信度或置信度称为可信度或置信度(confidence level),常取),常取95。

10、置信区间通常两个数值即置信限置信区间通常两个数值即置信限(confidence limit,CL)构成,构成,较小的称为置信下限(较小的称为置信下限(lower limit,L),),较大的称为置信上限(较大的称为置信上限(upper limit,U),),一、置信区间的有关概念一、置信区间的有关概念二、总体均数置信区间的计算二、总体均数置信区间的计算s s未知,且未知,且n 较小,按较小,按t分布分布s s已知,或已知,或s s未知但未知但n足够大,按足够大,按Z分布分布中心极限定理中心极限定理n设从均值为设从均值为,方差为,方差为 的一个任意总体的一个任意总体中抽取容量为中抽取容量为n的样

11、本,当的样本,当n充分大(通常充分大(通常n50),样本均值的抽样分布服从均数为),样本均值的抽样分布服从均数为,方差为,方差为 /n 的正态分布。的正态分布。单一总体均数的置信区间单一总体均数的置信区间 n例例3-2 已知某地已知某地27名健康成年男子血红蛋白含量名健康成年男子血红蛋白含量 =125g/L,S=15g/L,试估计该地健康成年男子血红蛋白平均含量的,试估计该地健康成年男子血红蛋白平均含量的95%和和99%置信区间。置信区间。n=27,=27-1=26,查,查t界表界表,=0.05,t0.05/2,26=2.056,=0.01,t0.01/2,26=2.779,按公式计算,按公式

12、计算Z0.05/2=1.96Z0.05=1.645总体均数总体均数的单侧(的单侧(1-)置信区间为)置信区间为:-Z -Z +Z三、置信区间的确切含义三、置信区间的确切含义n如果能够进行重复抽样试验,平均有(如果能够进行重复抽样试验,平均有(1-)的可信区间包含了总体参数,而不是总)的可信区间包含了总体参数,而不是总体参数落在该范围的可能性为(体参数落在该范围的可能性为(1-)。)。n在实际工作中,只能根据一次试验结果计在实际工作中,只能根据一次试验结果计算一个可信区间,就认为该区间包括了相算一个可信区间,就认为该区间包括了相应的总体参数,该结论错误的概率为应的总体参数,该结论错误的概率为。n

13、可信区间一旦形成,它要么包含总体参数,可信区间一旦形成,它要么包含总体参数,要么不包含总体参数,二者必居其一,无要么不包含总体参数,二者必居其一,无概率可言,可信度是事前规定的。概率可言,可信度是事前规定的。四、可信区间估计的优劣四、可信区间估计的优劣一一是是可可信信度度1 (准准确确度度),愈愈接接近近1愈愈好,如好,如99%的可信度比的可信度比95%的可信度要好;的可信度要好;二二是是区区间间的的宽宽度度(精精密密度度),区区间间愈愈窄窄愈愈好。当样本含量为定值时,上述两者互相矛盾。好。当样本含量为定值时,上述两者互相矛盾。在在可可信信度度确确定定的的情情况况下下,增增加加样样本本含含量量可可减小区间宽度。减小区间宽度。五、总体均数可信区间与参考值范围的区别五、总体均数可信区间与参考值范围的区别

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com