2-置信区间.ppt

上传人:s****8 文档编号:66150184 上传时间:2022-12-14 格式:PPT 页数:46 大小:926KB
返回 下载 相关 举报
2-置信区间.ppt_第1页
第1页 / 共46页
2-置信区间.ppt_第2页
第2页 / 共46页
点击查看更多>>
资源描述

《2-置信区间.ppt》由会员分享,可在线阅读,更多相关《2-置信区间.ppt(46页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、第四节第四节 正态总体均值与方差的区间估计正态总体均值与方差的区间估计单个总体单个总体 的情况的情况两个总体两个总体 的情况的情况课堂练习课堂练习小结小结 布置作业布置作业一、单个总体一、单个总体 的情况的情况并设并设 为来自总体的为来自总体的 样本样本,分别为样本均值和样本方差分别为样本均值和样本方差.均值均值 的置信区间的置信区间为已知为已知可得到可得到 的的置信水平为置信水平为 的置信区间的置信区间为为或或为未知为未知可得到可得到 的的置信水平为置信水平为 的置信区间的置信区间为为此分布不依赖于此分布不依赖于任何未知参数任何未知参数由由或或案例2 斯切尔公司对培训企业维修工的计算机辅助斯

2、切尔公司对培训企业维修工的计算机辅助程序感兴趣程序感兴趣.为了了解这种计算机辅助程序能缩短为了了解这种计算机辅助程序能缩短多少培训时间多少培训时间,需要评估这种程序在需要评估这种程序在95%置信水平置信水平下培训时间平均值的置信区间。已知培训时间总体下培训时间平均值的置信区间。已知培训时间总体是正态分布,管理者对是正态分布,管理者对15名维修工进行了测试,所名维修工进行了测试,所得培训时间如表得培训时间如表1所示,试估计所示,试估计95%置信水平下总置信水平下总体均值的置信区间。体均值的置信区间。维修工编号 123456789101112131415培训天数 5244 554445595054

3、62465458606263表表 1 15名维修工的培训天数名维修工的培训天数 解:解:已知总体是正态分布,但总体方差已知总体是正态分布,但总体方差 未知,应未知,应用前式进行计算,首先计算样本均值和样本方差用前式进行计算,首先计算样本均值和样本方差.置信水平为置信水平为95%,则,则 ,自由度为自由度为 ,查表得查表得所以边际误差所以边际误差:因而由(因而由(8.17)式在应用辅助程序后该公司)式在应用辅助程序后该公司培训维修工时间在培训维修工时间在95%置信度下的置信区间置信度下的置信区间为为即:即:例例1 有一大批糖果有一大批糖果.现从中随机地取现从中随机地取 16 袋袋,称得重量称得重

4、量(以克计以克计)如下如下:506 508 499 503 504 510 497 512 514 505 493 496 506 502 509 496设袋装糖果的重量近似地服从正态分布设袋装糖果的重量近似地服从正态分布,试求总试求总体均值体均值 的置信水平的置信水平0.95为的置信区间为的置信区间.解解 这里这里于是得到于是得到 的的置信水平为置信水平为 的置信区间的置信区间为为即即方差方差 的置信区间的置信区间由由可得到可得到 的的置信水平为置信水平为 的置信区间的置信区间为为由由可得到标准差可得到标准差 的的置信水平为置信水平为 的置信区间的置信区间为为 例例2 有一大批糖果有一大批糖

5、果.现从中随机地取现从中随机地取 16 袋袋,称得重量称得重量(以克计以克计)如下如下:506 508 499 503 504 510 497 512 514 505 493 496 506 502 509 496设袋装糖果的重量近似地服从正态分布设袋装糖果的重量近似地服从正态分布,试求总试求总体标准差体标准差 的置信水平的置信水平0.95为的置信区间为的置信区间.解解 这里这里于是得到于是得到 的的置信水平为置信水平为 的置信区间为的置信区间为即即案例3 表表2列出了选取列出了选取36名投保人组成的简单随机名投保人组成的简单随机样本的年龄数据。在样本的年龄数据。在90%置信水平下,求总体年龄

6、置信水平下,求总体年龄均值的置信区间。均值的置信区间。表表2 投保人样本的年龄投保人样本的年龄解:解:总体分布未知,但样本量为总体分布未知,但样本量为 ,大于,大于30。近似看成正态分布处理。由于总体的方。近似看成正态分布处理。由于总体的方差未知,所以应用前式来求总体的置信区间差未知,所以应用前式来求总体的置信区间 从表从表2中通过计算可得,样本均值为中通过计算可得,样本均值为39.5岁,这是岁,这是总体均值的点估计。总体均值的点估计。在置信度为在置信度为90%时时:另可算得样本标准差另可算得样本标准差:所所以以在在90%的的置置信信度度下下,总总体体年年龄龄均均值值的的置置信信区区间为,间为

7、,即:即:案例4 纽约时报纽约时报1988年年鉴年年鉴公布了各行业每人公布了各行业每人每周的平均工作收入。在服务行业,假如由每周的平均工作收入。在服务行业,假如由36名服名服务业人士组成的样本的个人周收入均值为务业人士组成的样本的个人周收入均值为369美元,美元,样本标准差为样本标准差为50美元。计算服务业人士周收入总体美元。计算服务业人士周收入总体均值的均值的95%置信区间。置信区间。解:解:总体分布未知,样本容量总体分布未知,样本容量 ,可近似为,可近似为正态分布抽样。由于总体方差未知正态分布抽样。由于总体方差未知置信度为置信度为95%,自由度自由度 所以服务业人士总体均值的所以服务业人士

8、总体均值的95%置信区间为置信区间为 即(即(352.0825,385.9175).二、两个总体二、两个总体 的情况的情况设已给定置信水平为设已给定置信水平为 ,并并设设 是来自第一个总体的样本是来自第一个总体的样本,是来自第二是来自第二个总体的样本个总体的样本,这两个样本相互独立这两个样本相互独立.且设且设 分分别别为第一、二个总体的样本均值为第一、二个总体的样本均值,为第一、二为第一、二个总体的样本方差个总体的样本方差.两个总体均值差两个总体均值差 的置信区间的置信区间为已知为已知因为因为 相互独立相互独立,所以所以 相互独立相互独立.故故或或于是得到于是得到 的的置信水平为置信水平为 的

9、置信区间的置信区间为为为已知为已知其中其中 定理定理 4(两总体样本均值差、样本方差比的分布两总体样本均值差、样本方差比的分布)分别是这两个样本的分别是这两个样本的且且X与与Y独立独立,X1,X2,是来自是来自X的样本的样本,是取自是取自Y的样本的样本,这两个样本的样本方差这两个样本的样本方差,则有则有Y1,Y2,样本均值,样本均值,分别是分别是于是得到于是得到 的的置信水平为置信水平为 的置信区间的置信区间为为其中其中 例例3 为比较为比较 I,两种型号步枪子弹的枪口两种型号步枪子弹的枪口速度速度,随机地取随机地取 I 型子弹型子弹 10 发发,得到枪口速度的平得到枪口速度的平 均值均值 为

10、为 标准差标准差 随随机地取机地取 型子弹型子弹 20 发发,得到枪口速度的平均值为得到枪口速度的平均值为 标准差标准差 假设两总假设两总体都可认为近似地服从正态分布体都可认为近似地服从正态分布.且生产过程可认且生产过程可认为方差相等为方差相等.求两总体均值差求两总体均值差 的的置信水平为置信水平为 0.95 的置信区间的置信区间.解解 依题意依题意,可认为分别来自两总体的样本可认为分别来自两总体的样本是相互独立的是相互独立的.又因为由假设两总体的又因为由假设两总体的方差相等方差相等,但但数值未知数值未知,故两总体均值差故两总体均值差 的的置信水平为置信水平为的置信区间的置信区间为为其中其中这

11、里这里故两总体均值差故两总体均值差 的的置信水平为置信水平为0.95 的置信区的置信区间间为为即即 (3.07,4.93).两个总体方差比两个总体方差比 的置信区间的置信区间(为已知为已知)由由即即可得到可得到 的的置信水平为置信水平为 的置信区间为的置信区间为 例例4 研究由机器研究由机器 A 和机器和机器 B 生产的钢管的内生产的钢管的内径径,随机地抽取机器随机地抽取机器 A生产的钢管生产的钢管18只只,测得样本测得样本方差方差 随机地取机器随机地取机器 B 生产的钢管生产的钢管13只只,测得样本方差测得样本方差 设两样本相互设两样本相互独立独立,且设由机器且设由机器 A 和机器和机器 B

12、 生产的钢管的内径生产的钢管的内径分别服从正态分布分别服从正态分布 这里这里 (i=1,2)均未知均未知.试求方差比试求方差比 的的置信水平为置信水平为 0.90 的置信区间的置信区间.这里这里即即 (0.45,2.79).解解故两总体方差比故两总体方差比 的的置信水平为置信水平为0.90 的置信区的置信区间间为为 某单位要估计平均每天职工的总医疗费,观察某单位要估计平均每天职工的总医疗费,观察了了30天天,其总金额的平均值是其总金额的平均值是170元元,标准差为标准差为30元,元,试决定职工每天总医疗费用平均值的区间估计(置试决定职工每天总医疗费用平均值的区间估计(置信水平为信水平为0.95

13、).解解 设每天职工的总医疗费为设每天职工的总医疗费为X,近似服从正态分布近似服从正态分布由中心极限定理,由中心极限定理,E(X)=,D(X)=则有则有三、课堂练习三、课堂练习近似近似 N(0,1)分布分布 使使得均值得均值 的置信水平为的置信水平为 的区间估计的区间估计为为未知,用样本标准差未知,用样本标准差S近似代替近似代替.将将 =170,S=30,=1.96,n=30代入得代入得,的置信水平为的置信水平为0.95的置信区间是的置信区间是 159.27,180.74得均值得均值 的置信水平为的置信水平为 的区间估计为的区间估计为三、总体比率的区间估计(大样本)我们可以通过样本比率我们可以

14、通过样本比率 在一定置信度下确定在一定置信度下确定总体比率总体比率 的置信区间。的置信区间。例6 在在案例案例2中,我们对斯切尔公司职工培训时间中,我们对斯切尔公司职工培训时间的均值进行了区间估计。为了从多角度评估该项目,的均值进行了区间估计。为了从多角度评估该项目,需进一步对培训质量进行评估,对需进一步对培训质量进行评估,对45人的样本进行人的样本进行了测试,了测试,结果有结果有36人通过了考核。本次测试的通人通过了考核。本次测试的通过率为过率为80%。但再进行测试时,通过率可能就不一。但再进行测试时,通过率可能就不一定正好是定正好是80%,可能是其它的数据。那么总体通过,可能是其它的数据。

15、那么总体通过测试的比率该在什么范围内呢?测试的比率该在什么范围内呢?可以证明,样本比率可以证明,样本比率 是总体比率是总体比率 的无偏估的无偏估计,并且在大样本(样本容量计,并且在大样本(样本容量=30)的情形下)的情形下 的分布近似服从正态分布。在置信水平的分布近似服从正态分布。在置信水平 下,下,用样本比率用样本比率 估计总体比率估计总体比率 产生的边际误产生的边际误差为差为:所以总体比率的置信区间为所以总体比率的置信区间为其中其中 为标准正态分布的双侧为标准正态分布的双侧 分位点。分位点。例7 接着讨论接着讨论引例引例2中斯切尔公司的培训质量,已中斯切尔公司的培训质量,已知知45培训维修

16、工中有培训维修工中有36人通过了考试。在人通过了考试。在95%的置的置信水平下求总体培训合格比率的置信区间。信水平下求总体培训合格比率的置信区间。解:解:由于样本容量由于样本容量 ,近似将抽样分布看成,近似将抽样分布看成正态分布,样本比率正态分布,样本比率 .置信水平为置信水平为0.95,所以,所以 ,由(由(8.20)式,总体培训合格率的置信区间为)式,总体培训合格率的置信区间为 ,即(,即(0.68,0.92)四、正态总体在对均值的区间估计中所需四、正态总体在对均值的区间估计中所需的样本容量的样本容量在对方差已知的正态分布总体均值进行区间在对方差已知的正态分布总体均值进行区间估计时,允许误

17、差为估计时,允许误差为 和样本容量和样本容量 共同确定了极限误差。共同确定了极限误差。一旦确定了置信水平一旦确定了置信水平 ,也就确定了,也就确定了 。此时影响极限误差的唯一因素就是样本容量此时影响极限误差的唯一因素就是样本容量 。如果对极限误差水平(用。如果对极限误差水平(用 表示)有约定,表示)有约定,则需要的样本容量则需要的样本容量 也就唯一确定了。也就唯一确定了。两个未两个未知变量知变量样本容量样本容量 的公式推导如下:的公式推导如下:令令 代表希望的极限误差代表希望的极限误差解出样本容量解出样本容量 的表达式的表达式 在给定的置信水平下,该样本容量满足所希在给定的置信水平下,该样本容

18、量满足所希望的极限误差。望的极限误差。例例8 在在案例案例2所述斯切尔公司的培训安排中,计所述斯切尔公司的培训安排中,计划总体标准差为划总体标准差为 。如果希望的允许误差。如果希望的允许误差为为2天,置信度为天,置信度为95%,样本容量应该为多大?,样本容量应该为多大?解:由题意知由题意知:则则 。查表得。查表得 ,代入(代入(8.21)式有:)式有:所以,应该抽取至少所以,应该抽取至少45个样本个样本。例例9 在华尔街日报的纽约股票交易所(New York Stock Exchange)版面上,给出了每支股票52周以来每股最高价、最低价、分红率、价格/收益(P/E)比率、日成交量、日最高价、

19、日最低价、收盘价等信息。每支股票的P/E比率由公司最近四个季度公布的每股收益除价格得到。在一次大样本的抽查中,样本方差 (the Wall Street Joural,1998.3.19)。假定我们要求对纽约股票交易列示的所有股票P/E比率的总体均值进行估计,要求95%置信度下的允许误差,则样本容量应包含多少支股票?解:解:由于是大样本抽样,可将总体视为正态分布。由于是大样本抽样,可将总体视为正态分布。总体标准差未知,用样本标准差代替,即总体标准差未知,用样本标准差代替,即 。置信度。置信度 则则 ,通过查表得,通过查表得 ,代入(,代入(8.21)式有:)式有:所以按要求,样本容量应包含所以

20、按要求,样本容量应包含26支股票。支股票。五、正态总体在对总体比率的区间估计中所需的样本容量现在考虑在给定极限误差下,应选用的多大的样本现在考虑在给定极限误差下,应选用的多大的样本容量来估计总体比率。前面已知用样本比率容量来估计总体比率。前面已知用样本比率 估估计总体比率估计的极限误差计总体比率估计的极限误差解得解得 (8.22)其中,其中,是事先给定的边际误差。是事先给定的边际误差。为标准为标准正态分布的双侧正态分布的双侧 分位点。分位点。例10 仍回到斯切尔公司的仍回到斯切尔公司的案例案例2中去,我们要对中去,我们要对培训项目测验的总体比率进行估计。在测试中的培训项目测验的总体比率进行估计

21、。在测试中的45名维修工中有名维修工中有36名通过了测试名通过了测试,如果斯切尔公司的如果斯切尔公司的生产主管在生产主管在95%置信水平和极限误差为置信水平和极限误差为0.10的条件的条件下对总体比率进行区间估计。那么你建议抽取多少下对总体比率进行区间估计。那么你建议抽取多少样本?样本?解:对总体比率评估的样本量的确定应用对总体比率评估的样本量的确定应用(8.22)式式,已知样本比率为已知样本比率为 ,希望的边际误差为希望的边际误差为 ,置信度为置信度为95%,查表得查表得样本量为整数样本量为整数,所以应取所以应取62个样本个样本.由由(8.22)式式,样本容量:样本容量:例.把一片树叶放在一

22、个边长为 的正方形内,然后向正方形内随机投点,使正方形内任一处都有同等机会有落点。此过程可在计算机上实现,在投了 个点后得知有 个点落在树叶上,按大数定律,只要 充分大,可得树叶的面积近似为 。如今要求绝对误差不超过千分之一,保证概率不低于0.99,则至少要投多少个点才能达到此精度。例、设某地居民每户每月粮食平均需要量又服从例、设某地居民每户每月粮食平均需要量又服从正态分布,随机抽取正态分布,随机抽取10户,需要量户,需要量(单位:公斤单位:公斤)为:为:45,38,5047,44,33,42,40,39,40,已知该地有已知该地有1500户居民为保证至少有户居民为保证至少有95的把的把握能满足居民的需求,粮店每月最少应进多少粮握能满足居民的需求,粮店每月最少应进多少粮食食?解:设设 则:则:总体均值总体均值 的置信度的置信度0.95的置信区间为:的置信区间为:为保证至少有为保证至少有95的把握能满足居民的需求,粮的把握能满足居民的需求,粮店每月最少应进店每月最少应进453 150067950公斤公斤

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 技术资料 > 施工组织

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com