概率论与数理统计浙大四版第七章第七章3讲.ppt

上传人:wuy****n92 文档编号:80490529 上传时间:2023-03-23 格式:PPT 页数:85 大小:1.45MB
返回 下载 相关 举报
概率论与数理统计浙大四版第七章第七章3讲.ppt_第1页
第1页 / 共85页
概率论与数理统计浙大四版第七章第七章3讲.ppt_第2页
第2页 / 共85页
点击查看更多>>
资源描述

《概率论与数理统计浙大四版第七章第七章3讲.ppt》由会员分享,可在线阅读,更多相关《概率论与数理统计浙大四版第七章第七章3讲.ppt(85页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、第四节 区间估计区间估计 引言引言 前面,我们讨论了参数点估计前面,我们讨论了参数点估计.它它是用样本算得的一个值去估计未知参数是用样本算得的一个值去估计未知参数.但是,点估计值仅仅是未知参数的一个但是,点估计值仅仅是未知参数的一个近似值,它没有反映出这个近似值的误近似值,它没有反映出这个近似值的误差范围,使用起来把握不大差范围,使用起来把握不大.区间估计区间估计正好弥补了点估计的这个缺陷正好弥补了点估计的这个缺陷.也就是说,我们希望确定一个区间,使我也就是说,我们希望确定一个区间,使我们能以比较高的们能以比较高的可靠程度可靠程度相信它包含真参相信它包含真参数值数值.湖中鱼数的真值湖中鱼数的真

2、值 这里所说的这里所说的“可靠程度可靠程度”是用概率来度量的,是用概率来度量的,称为置信概率,置信度或置信水平称为置信概率,置信度或置信水平.习惯上把置信水平记作习惯上把置信水平记作,这里,这里 是一个是一个很小的正数很小的正数.置信水平的大小是根据实际需要选定的置信水平的大小是根据实际需要选定的.例如,通常可取置信水平例如,通常可取置信水平 =0.95或或0.9等等.根据一个实际样本,由给定的置信水平,我根据一个实际样本,由给定的置信水平,我小的区间小的区间 ,使,使们求出一个尽可能们求出一个尽可能置信区间置信区间.称区间称区间 为为 的的置信水平为置信水平为 的的 寻找置信区间的方法寻找置

3、信区间的方法,一般是从确定一般是从确定误差限误差限入手入手.使得使得称称 为为 与与 之间的误差限之间的误差限.我我们们选选取取未未知知参参数数的的某某个个估估计计量量 ,根根据置信水平据置信水平 ,可以找到一个正数,可以找到一个正数 ,只要知道只要知道 的概率分布,确定误差限并不难的概率分布,确定误差限并不难.下面我们就来正式给出置信区间的定义下面我们就来正式给出置信区间的定义,并通过例子说明求置信区间的方法并通过例子说明求置信区间的方法.由不等式由不等式可以解出可以解出 :这个不等式就是我们所求的置信区间这个不等式就是我们所求的置信区间.一、一、置信区间定义:置信区间定义:满足满足设设 是

4、是 一个待估参数,给定一个待估参数,给定若由样本若由样本X1,X2,Xn确定的两个统计量确定的两个统计量则称区间则称区间 是是 的的置信水平置信水平(置信度、(置信度、置信概率)为置信概率)为 的置信区间的置信区间.分别称为置信下限和置信上限分别称为置信下限和置信上限.一旦有了样本,就把一旦有了样本,就把 估计在区间估计在区间内内.这里有两个要求这里有两个要求:可见,可见,对参数对参数 作区间估计,就是要设法找出作区间估计,就是要设法找出两个只依赖于样本的界限两个只依赖于样本的界限(构造统计量构造统计量)(X1,Xn)(X1,Xn)2.估计的精度要尽可能的高估计的精度要尽可能的高.如要求区间如

5、要求区间长度长度 尽可能短,或能体现该要求的其尽可能短,或能体现该要求的其它准则它准则.1.要求要求 以很大的可能被包含在区间以很大的可能被包含在区间内,就是说,概率内,就是说,概率 要尽可能大要尽可能大.即要求估计尽量可靠即要求估计尽量可靠.可靠度与精度是一对矛盾,可靠度与精度是一对矛盾,一般是在保证可靠度的条件下一般是在保证可靠度的条件下尽可能提高精度尽可能提高精度.关于定义的说明关于定义的说明若反复抽样多次若反复抽样多次(各次得到的样本容量相等各次得到的样本容量相等,都是都是n)按按伯努利大数定理伯努利大数定理,在这样多的区间中在这样多的区间中,例如例如N(0,1)选选 的点估计为的点估

6、计为求参数求参数 的置信度为的置信度为 的置信区间的置信区间.例例1 设设X1,Xn是取自是取自 的样本,的样本,二、置信区间的求法二、置信区间的求法明确问题明确问题,是求什么参数的置信区间是求什么参数的置信区间?置信水平是多少?置信水平是多少?寻找未知参数的寻找未知参数的一个良好估计一个良好估计.解:解:寻找一个待估参数和寻找一个待估参数和估计量的函数估计量的函数,要求,要求其分布为已知其分布为已知.有了分布,就可以求出有了分布,就可以求出U取值于任意区间的概率取值于任意区间的概率.对给定的置信水平对给定的置信水平查正态分布表得查正态分布表得对于给定的置信水平对于给定的置信水平(大概率大概率

7、),根据根据U的分布,的分布,确定一个区间确定一个区间,使得使得U取值于该区间的概率为取值于该区间的概率为置信水平置信水平.使使为什么为什么这样取这样取?对给定的置信水平对给定的置信水平查正态分布表得查正态分布表得使使从中解得从中解得也可简记为也可简记为于是所求于是所求 的的 置信区间为置信区间为 从例从例1解题的过程,我们归纳出求置解题的过程,我们归纳出求置信区间的一般步骤如下信区间的一般步骤如下:1.明确问题明确问题,是求什么参数的置信区间是求什么参数的置信区间?置信水平置信水平 是多少是多少?2.寻找参数寻找参数 的一个良好的点估计的一个良好的点估计T(X1,X2,Xn)称称S(T,)为

8、为枢轴量枢轴量.3.寻找一个待估参数寻找一个待估参数 和估计量和估计量T的函数的函数 S(T,),且其分布为已知且其分布为已知.4.对于给定的置信水平对于给定的置信水平 ,根据,根据S(T,)的分布,确定常数的分布,确定常数a,b,使得,使得 P(a S(T,)b)=5.对对“aS(T,)b”作等价变形作等价变形,得到如得到如下下形式形式:则则 就是就是 的的100()的置信区间的置信区间.可见,确定区间估计很关键的是要寻找可见,确定区间估计很关键的是要寻找一个待估参数一个待估参数 和估计量和估计量T 的函数的函数S(T,),且且S(T,)的分布为已知的分布为已知,不依赖于任何未知不依赖于任何

9、未知参数参数(这样我们才能确定一个大概率区间这样我们才能确定一个大概率区间).而这与总体分布有关,所以,而这与总体分布有关,所以,总体分布的总体分布的形式是否已知,是怎样的类型,至关重要形式是否已知,是怎样的类型,至关重要.这里,我们主要讨论总体分布为这里,我们主要讨论总体分布为正态正态的情形的情形.若样本容量很大,即使总体分布若样本容量很大,即使总体分布未知,应用中心极限定理,可得总体的近未知,应用中心极限定理,可得总体的近似分布,于是也可以近似求得参数的区间似分布,于是也可以近似求得参数的区间估计估计.教材上讨论了以下几种情形:教材上讨论了以下几种情形:单个正态总体均值单个正态总体均值 和

10、方差和方差 的区间估计的区间估计.两个正态总体均值差两个正态总体均值差 和方差比和方差比 的区间估计的区间估计.比例比例 p 的区间估计的区间估计.教材教材180页已经给出了概率分布的上侧分位数页已经给出了概率分布的上侧分位数(分位点)的定义,为便于应用,这里我们(分位点)的定义,为便于应用,这里我们再简要介绍一下再简要介绍一下.在求置信区间时,要查表求分位数在求置信区间时,要查表求分位数.设设0 1,对随机变量对随机变量X,称满足,称满足的点的点 为为X的概率分布的上的概率分布的上 分位数分位数.例如例如:设设0 1,对随机变量对随机变量X,称满足,称满足的点的点 为为X的概率分布的上的概率

11、分布的上 分位数分位数.标准正态分布的标准正态分布的上上 分位数分位数例如例如:设设0 1,对随机变量对随机变量X,称满足,称满足的点的点 为为X的概率分布的上的概率分布的上 分位数分位数.分布的上分布的上 分位数分位数自由度为自由度为n的的 设设0 1,对随机变量对随机变量X,称满足,称满足的点的点 为为X的概率分布的上的概率分布的上 分位数分位数.F分布的上分布的上 分分位数位数自由度为自由度为n1,n2的的 书书末末附附有有 分分布布、t 分分布布、F分分布布的的上上侧侧分分位位数数表表,供供使使用用.需需要要注注意意的的事事项项在在教教材上有说明材上有说明.至于如何由标准正态分布函数表

12、查表至于如何由标准正态分布函数表查表求得分位数,若你对分布函数定义熟悉的求得分位数,若你对分布函数定义熟悉的话,这个问题不难解决话,这个问题不难解决.一、单个总体 的情况由例由例1可知可知:1.包糖机某日开工包了包糖机某日开工包了1212包糖包糖,称得质量称得质量(单单位位:克克)分别为分别为506,500,495,488,504,486,505,506,500,495,488,504,486,505,513,521,520,512,485.513,521,520,512,485.假设重量服从正态分布假设重量服从正态分布,解解.新建文件夹新建文件夹42-1.ppt42-1.ppt2-12-1例

13、例2附表附表2-22-2查表得查表得推导过程如下推导过程如下:解解 有一大批糖果有一大批糖果,现从中随机地取现从中随机地取16袋袋,称得称得重量重量(克克)如下如下:设袋装糖果的重量服从正态分布设袋装糖果的重量服从正态分布,试求总体均值试求总体均值附表附表3-13-1例例3就是说估计袋装糖果重量的均值在就是说估计袋装糖果重量的均值在500.4克与克与507.1克之间克之间,这个估计的可信程度为这个估计的可信程度为95%.这个误差的可信度为这个误差的可信度为95%.推导过程如下推导过程如下:根据第六章第二节定理二知根据第六章第二节定理二知进一步可得进一步可得:注意注意:在密度函数不对称时在密度函

14、数不对称时,习惯上仍取对称的分位点来习惯上仍取对称的分位点来确定置信区间确定置信区间(如图如图).(续例续例2)求例求例2 2中总体标准差中总体标准差 的置信度为的置信度为0.950.95的置信区间的置信区间.解解代入公式得标准差的置信区间代入公式得标准差的置信区间附表附表4-14-1附表附表4-24-2例例4休息片刻继续休息片刻继续例例5 已知某地区新生婴儿的体重已知某地区新生婴儿的体重X随机抽查随机抽查100个婴儿个婴儿得得100个体重数据个体重数据X1,X2,X100 的区间估计的区间估计求求和和(置信水平为(置信水平为1-).解:这是单总体均值和方差的估计解:这是单总体均值和方差的估计

15、已知已知先求均值先求均值 的区间估计的区间估计.因方差未知,取因方差未知,取 对给定的置信度对给定的置信度 ,确定分位数确定分位数使使即即均值均值 的置信水平为的置信水平为 的区间估计的区间估计.即为即为从中解得从中解得取枢轴量取枢轴量从中解得从中解得再求方差再求方差 的置信水平为的置信水平为 的区间估计的区间估计.对给定的置信度对给定的置信度 ,确定分位数确定分位数 使使于是于是 即为所求即为所求.需要指出的是,给定样本,给定置信水需要指出的是,给定样本,给定置信水平,平,置信区间也置信区间也不是唯一不是唯一的的.对同一个参数,我们可以构造许多置信区间对同一个参数,我们可以构造许多置信区间.

16、N(0,1)取枢轴量取枢轴量由标准正态分布表,对任意由标准正态分布表,对任意a、b,我们可我们可以求得以求得P(aUb).例如,设例如,设X1,Xn是取自是取自 的样本,的样本,求参数求参数 的置信水平为的置信水平为 的的 置信区间置信区间.N(0,1)例如,由例如,由P(-1.96U1.96)=0.95我们得到我们得到 均值均值 的置信水平为的置信水平为的的置信区间为置信区间为由由 P(-1.75U2.33)=0.95这个区间比前面一个要长一些这个区间比前面一个要长一些.置信区间为置信区间为我们得到我们得到 均值均值 的置信水平为的置信水平为的的我们总是希望置信区间尽可能短我们总是希望置信区

17、间尽可能短.类似地,我们可得到若干个不同的置信类似地,我们可得到若干个不同的置信区间区间.任意两个数任意两个数a和和b,只要它们的纵标包含,只要它们的纵标包含f(u)下下95%的面积,就确定一个的面积,就确定一个95%的置信的置信区间区间.在概率密度为单峰且对称的情形,当在概率密度为单峰且对称的情形,当a=-b时时求得的置信区间的长度为最短求得的置信区间的长度为最短.a=-b 即使在概率密度不对称的情形,如即使在概率密度不对称的情形,如 分布分布,F分布分布,习惯上仍取对称的分位点来,习惯上仍取对称的分位点来计算未知参数的置信区间计算未知参数的置信区间.我们可以得到未知参数的的任何我们可以得到

18、未知参数的的任何置信水置信水平小于平小于1的的置信区间,并且置信区间,并且置信水平越高,置信水平越高,相应的相应的置信区间置信区间平均长度平均长度越长越长.也就是说,要想得到的区间估计可靠也就是说,要想得到的区间估计可靠度高,区间长度就长,估计的精度就差度高,区间长度就长,估计的精度就差.这是一对矛盾这是一对矛盾.实用中应在保证足够可靠的前提下,尽实用中应在保证足够可靠的前提下,尽量使得区间的长度短一些量使得区间的长度短一些.二、两个总体 的情况讨论两个总体均值差和方差比的估计问题讨论两个总体均值差和方差比的估计问题.推导过程如下推导过程如下:1.例例7为比较为比较,两种型号步枪子弹的枪口速度

19、两种型号步枪子弹的枪口速度,随机地取随机地取型子弹型子弹10发发,得到枪口速度的平均值为得到枪口速度的平均值为随机地取随机地取型子弹型子弹20发发,得枪口速度平均值为得枪口速度平均值为假设两总体都可认为近似假设两总体都可认为近似地服从正态分布地服从正态分布,且由生产过程可认为它们的方差且由生产过程可认为它们的方差相等相等,求两总体均值差求两总体均值差信区间信区间.解解 由题意由题意,两总体样本独立且方差相等两总体样本独立且方差相等(但未知但未知),解解 由题意由题意,两总体样本独立且方差相等两总体样本独立且方差相等(但未知但未知),例例8为提高某一化学生产过程的得率为提高某一化学生产过程的得率

20、,试图采用试图采用一种新的催化剂一种新的催化剂,为慎重起见为慎重起见,在试验工厂先进在试验工厂先进行行体都可认为近似地服从正态分布体都可认为近似地服从正态分布,且方差相等且方差相等,求求两总体均值差两总体均值差试验试验.设采用原来的催化剂进行了设采用原来的催化剂进行了次试验次试验,得到得率的平均值得到得率的平均值又采用新的催化剂进行了又采用新的催化剂进行了次试验次试验,得到得率得到得率的平均值的平均值假设两总假设两总推导过程如下推导过程如下:2.根据根据F分布的定义分布的定义,知知解解例例9 研究由机器研究由机器 A 和机器和机器 B 生产的钢管内径生产的钢管内径,随随机抽取机器机抽取机器 A

21、 生产的管子生产的管子 18 只只,测得样本方差测得样本方差为为均未知均未知,求方差比求方差比区间区间.设两样本相互独设两样本相互独抽取机器抽取机器B生产的管子生产的管子 13 只只,测测得样本方差为得样本方差为立立,且设由机器且设由机器 A 和机器和机器 B 生产的钢管内径分别服生产的钢管内径分别服从正态分布从正态分布信信解解例例10甲、乙两台机床加工同一种零件甲、乙两台机床加工同一种零件,在机床甲在机床甲加工的零件中抽取加工的零件中抽取9个样品个样品,在机床乙加工的零件在机床乙加工的零件信区间信区间.假定测量值都服从正态分布假定测量值都服从正态分布,方差分别方差分别为为的置的置在置信度在置

22、信度由所给数据算得由所给数据算得0.98下下,试求这两台机床加工精度之比试求这两台机床加工精度之比中抽取中抽取6个样品个样品,并分别测得它们的长度并分别测得它们的长度(单位单位:mm),一个正态总体未知参数的置信区间一个正态总体未知参数的置信区间待估参数待估参数随机变量随机变量随机变量随机变量的分布的分布双侧置信区间的上、下限双侧置信区间的上、下限两个正态总体未知参数的置信区间(一)两个正态总体未知参数的置信区间(一)待估参数待估参数随机变量随机变量随机变量随机变量的分布的分布双侧置信区间的上、下限双侧置信区间的上、下限两个正态总体未知参数的置信区间(二)两个正态总体未知参数的置信区间(二)待

23、估待估参数参数随机变量随机变量随机变量随机变量的分布的分布 双侧置信区间的上、下限双侧置信区间的上、下限三、单侧置信区间三、单侧置信区间 上述置信区间中置信限都是双侧的,但上述置信区间中置信限都是双侧的,但对于有些实际问题,人们关心的只是参数在对于有些实际问题,人们关心的只是参数在一个方向的界限一个方向的界限.例如对于设备、元件的使用寿命来说,平均例如对于设备、元件的使用寿命来说,平均寿命过长没什么问题,过短就有问题了寿命过长没什么问题,过短就有问题了.这时,可将置信上限取这时,可将置信上限取为为+,而只着眼于置信下,而只着眼于置信下限,这样求得的置信区间叫限,这样求得的置信区间叫单侧置信区间

24、单侧置信区间.于是引入单侧置信区间和置信限的定义:于是引入单侧置信区间和置信限的定义:满足满足设设 是是 一个待估参数,给定一个待估参数,给定 若由样本若由样本X1,X2,Xn确定的统计量确定的统计量则称区间则称区间 是是 的置信水平为的置信水平为 的的单侧置信区间单侧置信区间.称为单侧置信下限称为单侧置信下限.又若统计量又若统计量 满足满足则称区间则称区间 是是 的置信水平为的置信水平为 的的单侧置信区间单侧置信区间.称为单侧置信上限称为单侧置信上限.单个单个正态总体均值与方差的单侧置信区间正态总体均值与方差的单侧置信区间设灯泡寿命服从正态分布设灯泡寿命服从正态分布.求灯泡寿命均求灯泡寿命均

25、值值 的置信水平为的置信水平为0.95的单侧置信下限的单侧置信下限.例例11从一批灯泡中随机抽取从一批灯泡中随机抽取5只作寿命试只作寿命试验,测得寿命验,测得寿命X(单位:小时)如下:(单位:小时)如下:1050,1100,1120,1250,1280由于方差由于方差 未知,取枢轴量未知,取枢轴量解:解:的点估计取为样本均值的点估计取为样本均值 对给定的置信水平对给定的置信水平 ,确定分位数,确定分位数使使即即于是得到于是得到 的置信水平为的置信水平为 的单侧置的单侧置信区间为信区间为 将样本值代入得将样本值代入得的置信水平为的置信水平为0.95的单侧置信下限是的单侧置信下限是1065小时小时

26、的置信水平为的置信水平为 的单侧置信下限为的单侧置信下限为即即 同学们可通过练习,掌握各种求未知同学们可通过练习,掌握各种求未知参数的参数的 置信区间的具体方法置信区间的具体方法.这一讲,我们介绍了区间估计这一讲,我们介绍了区间估计.数学奖菲尔兹奖与阿贝尔奖,沃尔夫奖 为什么诺贝尔在以他名字命名的奖项中不设立数学奖?这个问题曾经引起许多猜测。比较流行的说法有两种:一个传说是诺贝尔本人认为数学与人类的进步没有直接的关联,因而不值得为数学设立专门奖项;另一个更为广泛的说法是,当时瑞典的领头数学家莱夫勒,他是诺贝尔的情敌,如果设立诺贝尔数学奖,则很可能非莱夫勒莫属。当然,事实真相究竟如何,现在已经难

27、以精确地考证,但诺贝尔部设立数学奖却早已成为不争的事实,引起数学界的普遍抱怨。菲尔兹是加拿大的数学家,热心倡导数学国际交流活动,曾成功组织了多伦多举办的第7届国际数学大会。菲尔兹是莱夫勒的好朋友,他对诺贝尔不设立数学奖颇有不满,于是他提议将第7届国际数学大会剩余经费用来设立一个数学奖。在他去世前,菲尔兹又把自己的财产中的一大笔钱捐献出来,以增加数学奖的费用。在1932年苏黎世举行的第9届数学大会上,大会组织成员决定把这个数学奖命名为“菲尔兹奖”。菲尔兹奖用来奖励年龄不超过40岁的年轻数学家,每次获奖者不超过4人,每位获奖者可得到一枚纯金奖章和一笔数额不大的奖金。1982年华裔美国数学家丘成桐获得了菲尔兹奖,成为目前唯一获此殊荣的华人。菲尔兹奖每4年颁发一次,且奖金数量远远不能和诺贝尔奖相比较。2002年,挪威政府宣布将于2003年开始颁发“阿贝尔奖”,以纪念挪威天才的青年数学家阿贝尔诞辰200周年。这项奖金每年一次,奖金约50万美元。这足可以和诺贝尔奖金相比较。菲尔兹奖面向的是青年数学家,而诺贝尔奖获得者往往超过了40岁。在数学界还有以色列政府颁发的“沃尔夫奖”,该奖项没有年龄限制。我国数学家陈省身就是一名获奖者。有人称赞费尔兹奖为“青年数学奖”,把沃尔夫奖称为数学的“终身成就奖”,由此,可以看出两个奖项在数学界地位相当。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com