0203单样本置信区间和假设检验.ppt

上传人:hyn****60 文档编号:71604154 上传时间:2023-02-03 格式:PPT 页数:34 大小:294.50KB
返回 下载 相关 举报
0203单样本置信区间和假设检验.ppt_第1页
第1页 / 共34页
0203单样本置信区间和假设检验.ppt_第2页
第2页 / 共34页
点击查看更多>>
资源描述

《0203单样本置信区间和假设检验.ppt》由会员分享,可在线阅读,更多相关《0203单样本置信区间和假设检验.ppt(34页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、单样本单样本CI和假设检验和假设检验修订版10 1999年1月11日GE Appliances Copyright 19993.3.1 1第第3部分部分:单样本单样本置信区间置信区间和和假设检验假设检验单样本单样本CI和假设检验和假设检验修订版10 1999年1月11日GE Appliances Copyright 19993.3.2 2第第3部分:部分:单样本置信区间和单样本置信区间和假设检验假设检验目的目的:这一部分的目的是介绍连续数据的置信区间和假设检验。目标目标:了解假设检验和置信区间的基本原理-确定所观测的差异是真实的,还是偶然因素引起的。计算样本平均值的置信区间,并将这一平均值与期

2、望(或目标)平均值相比较。使用单样本置信区间和假设检验,将平均值与目标值相比较。单样本单样本CI和假设检验和假设检验修订版10 1999年1月11日GE Appliances Copyright 19993.3.3 3举例举例洗衣机传动装置的总高度将影响制动性能。项目项目Y是是总高度总高度,目标值=5.394,加工这种部件时所使用的固定架共有8个。您想了解什么?使用第三个固定架生产出的部件的平均使用第三个固定架生产出的部件的平均高度与目标值是否一致?高度与目标值是否一致?分析步骤:1.将数据绘制成图2.使用假设检验和置信区间来确定所观测到的差异是否真实。3.得出结论。单样本单样本CI和假设检验

3、和假设检验修订版10 1999年1月11日GE Appliances Copyright 19993.3.4 4设备3 的10 个部件的高度用图形来表示数据用图形来表示数据设备设备33中中1010个个部件的高度部件的高度5.3945.3945.3945.3945.3935.3935.3945.3945.3945.3945.3955.3955.3965.3965.3975.3975.3955.3955.3955.3955.3935.3945.3955.3965.397设备 3高度(英寸)目标值=5.394英寸n=10n=10 x=5.3947x=5.3947=0.00116=0.00116总体平

4、均值的最可能的范围是多少?x(5.3947)与目标值(5.394)之间的差异是由于偶然因素造成的吗?单样本单样本CI和假设检验和假设检验修订版10 1999年1月11日GE Appliances Copyright 19993.3.5 5置信区间置信区间设备3所制造的所有部件的平均值最可能的取值范围是什么?让我们来计算一下置信区间,以便找出该值!单个平均值的置信区间单个平均值的置信区间置信区间下限值1-22x 置信区间上限值(1-)100%置信度,真正的总体均值置信度,真正的总体均值包含在置信区间内。包含在置信区间内。单样本单样本CI和假设检验和假设检验修订版10 1999年1月11日GE A

5、ppliances Copyright 19993.3.6 6什么是什么是t分布?分布?类似于正态分布(z)正态分布正态分布(z):已知总体标准差,t分布分布(t):估计的标准差,s用于提供有关平均值的结论(置信区间和假设检验)我们将需要使用我们将需要使用t分布分布 z=(x-)n t=(x-)/(s/n)3210-1-2-30.40.30.20.10.0YztN-单样本单样本CI和假设检验和假设检验修订版10 1999年1月11日GE Appliances Copyright 19993.3.7 7置信区间置信区间其中:x=样本平均值t=t表格中的t统计结果=风险df=自由度=n-1s=样本

6、标准差n=样本中的数据点数量置信区间上限值=x+t(/2,df)ns置信区间下限值=x-t(/2,df)ns用所给出的有关部件的数据代入以上公式单样本单样本CI和假设检验和假设检验修订版10 1999年1月11日GE Appliances Copyright 19993.3.8 8置信区间置信区间计算利用设备3所生产的传输设备平均高度的置信区间使用=0.05(95%的置信区间)x=5.3947s=0.00116n=10df=n-1=9t(a/2,df)取自t表格。t(0.025,9)=2.262 区间下限=x-t(/2,df)ns=-()=区间上限=x+t(/2,df)ns=+()=单样本单样

7、本CI和假设检验和假设检验修订版10 1999年1月11日GE Appliances Copyright 19993.3.9 9 t表格表格自由度为9=.05/2=.025单样本单样本CI和假设检验和假设检验修订版10 1999年1月11日GE Appliances Copyright 19993.3.1010范例范例-续续设备设备3所制造部件的平均值是否在目标范围之内?所制造部件的平均值是否在目标范围之内?设备3生产出的部件总体的平均值最有可能是5.3947,但实际值可能比该值大一点或小一点。5.3935.3945.3955.3965.397设备3高度(英寸)目标值=5.394英寸 平均值的

8、平均值的95%95%置信置信区间区间置信区间上限值=5.3955英寸置信区间下限值=5.3939 英寸设备设备设备设备33所生产的部件的总体平均值最可能的取值所生产的部件的总体平均值最可能的取值所生产的部件的总体平均值最可能的取值所生产的部件的总体平均值最可能的取值范围为范围为范围为范围为5.39395.3939到到到到5.39555.3955。单样本单样本CI和假设检验和假设检验修订版10 1999年1月11日GE Appliances Copyright 19993.3.1111举例举例-续续置信区间说明置信区间说明以这种方式构成的区间的95%是正确的(包含真正的总体平均值),以此构成的区

9、间的5%是不正确的。目标值5.394包含在此区间内。统计评价统计评价:没有证据证明设备3所制造部件的平均高度不在目标范围之内。实际评价实际评价:目标值刚好在置信区间内。计算时只用到10 个数据点,并且=0.05。您可以使用置信区间来进一步调查设备3获得更多样本(如果是实际的)并计算置信区间使用不同的值来计算置信区间置信区间量化了数据的不定性。置信区间量化了数据的不定性。置信区间量化了数据的不定性。置信区间量化了数据的不定性。单样本单样本CI和假设检验和假设检验修订版10 1999年1月11日GE Appliances Copyright 19993.3.1212样本大小对置信区间的影响样本大小

10、对置信区间的影响让我们取20个以上的样本(总数 n=30),看一看对95%的置信区间有何影响。假设平均值和标准差保持不变:x=5.3947 和 s=0.00116。置信区间上限值=x+t(/2,df)ns置信区间下限值=x-t(/2,df)ns=-()=+()=单样本单样本CI和假设检验和假设检验修订版10 1999年1月11日GE Appliances Copyright 19993.3.1313样本大小对置信区间的影响样本大小对置信区间的影响-续续通过增加样本,可以证明设备3所制造部件的平均高度不在目标范围内。目标值=5.394英寸 n=10的95%置信区间为5.3939-5.3955。n

11、=30的95%置信区间为5.3943-5.3951。唯一改变的是n。5.3975.3965.3955.3945.3935.392设备3高度(英寸)平均值的平均值的9595%置置信区间信区间置信上限=5.3951英寸置信下限=5.3943英寸n=10 的95%置信区间为5.3939-5.3955.n=30的95%置信区间为 5.3943-5.3951.唯一改变的是 n。置信区间随样本容量的增加而减小置信区间随样本容量的增加而减小置信区间随样本容量的增加而减小置信区间随样本容量的增加而减小。单样本单样本CI和假设检验和假设检验修订版10 1999年1月11日GE Appliances Copyri

12、ght 19993.3.1414 对置信区间的影响对置信区间的影响计算设备3所制造传送装置的平均高度的90%置信区间。取 n=10(x=5.3947,s=0.00116)计算设备3所制造传送装置的平均高度的99%置信区间。取 n=10(x=5.3947,s=0.00116)对置信区间有何影响?单样本单样本CI和假设检验和假设检验修订版10 1999年1月11日GE Appliances Copyright 19993.3.1515 对置信区间的影响对置信区间的影响高度(英寸)5.3935.3945.3955.3965.397设备3平均值平均值90%90%的置信区的置信区间间平均值平均值99%9

13、9%的置信的置信区间区间唯一改变的是唯一改变的是 。我们能够能够以90%置信度置信度来说明设备3所制造的部件不在目标范围内我们不能不能以99%的置信度的置信度说来说明设备3所制造的部件不在目标范围内。置信区间置信区间置信区间置信区间随着随着随着随着 值的增大而增大。值的增大而增大。值的增大而增大。值的增大而增大。单样本单样本CI和假设检验和假设检验修订版10 1999年1月11日GE Appliances Copyright 19993.3.1616另一种确定是否存在差异的方法:另一种确定是否存在差异的方法:另一种确定是否存在差异的方法:另一种确定是否存在差异的方法:假设检验假设检验置信区间置

14、信区间给出了总体值(参数)的最可能的取值范围最可能的取值范围。假设检验假设检验用于确定所观测的差异是确实存在确实存在,还是偶偶然产生然产生的。我们可以量化确实存在差异的置信程度。所有 潜在“X”关键少数关键少数关键少数关键少数“X”X”单样本单样本CI和假设检验和假设检验修订版10 1999年1月11日GE Appliances Copyright 19993.3.1717定义假设:定义假设:Ho 和和 HaHo假设检验的起点是零假设-H0。H0是相同相同或没有差异没有差异假设。举例:总体均值等于检验均值。Ha第二条假设是Ha-备择假设,即差异差异假设。举例:总体均值不等于检验均值。您通常想表

15、明差异是确实存在的您通常想表明差异是确实存在的(Ha)。通过假定相等通过假定相等(Ho)开始开始。如果数据表明它们不相等,则它们一定存在差异如果数据表明它们不相等,则它们一定存在差异(Ha)。单样本单样本CI和假设检验和假设检验修订版10 1999年1月11日GE Appliances Copyright 19993.3.1818和和风险风险风险风险:当H0为真时,拒绝Ho-有时称为厂商风险风险风险:当H0为假时,接受Ho-有时称为消费者风险实际实际决定决定Ho,=Ha,非=Ho,=Ha,非=第1类错误 第2类错误 正确的正确的决定决定正确的正确的决定决定单样本单样本CI和假设检验和假设检验修

16、订版10 1999年1月11日GE Appliances Copyright 19993.3.1919 t 检验检验 t检验可用来检验:目标值(或检验均值)与计算的样本均值的对比-单样本单样本t检检验验,或者两个计算的样本均值之间的对比-双样本双样本t检验检验(将在第4部分进行讨论)让我们使用Minitab来执行单样本t检验。将设备3的平均值与目标值5.394进行比较。假设检验Ho:=5.394Ha:不等于5.394在Minitab中打开文件“lth”L:6sigmaMinitabTrainingMinitabSession 2lth.mtw单样本单样本CI和假设检验和假设检验修订版10 19

17、99年1月11日GE Appliances Copyright 19993.3.2020点击“图形”双击“确定”按钮运行单样本检验单样本检验单样本检验单样本检验 t-t-检验检验检验检验-利用利用利用利用MinitabMinitab 选择:Stat Basic Statistics 1-Sample t点击两次点击两次“OK”,运行运行键入目标键入目标键入目标键入目标平均值平均值平均值平均值选择选择 Ha单击单击“Graphs”单击单击“Boxplot of data”单样本单样本CI和假设检验和假设检验修订版10 1999年1月11日GE Appliances Copyright 19993

18、.3.2121置信区间指出了总体平均值的近似值范围。Hmmmm 5.394刚好在置信区间内。我们可能会进一步调查。按目标均值进行设备按目标均值进行设备3的单样本的单样本t检验检验Ho 和和 Ha的假设的假设置信区间指出置信区间指出置信区间指出置信区间指出总体均值的最可能的总体均值的最可能的总体均值的最可能的总体均值的最可能的取值范围。取值范围。取值范围。取值范围。P值 0.05;不能拒绝 Ho5.394刚刚落在置信区间内。也许我们需要进一步调查。请注意请注意请注意请注意 不得将假设检验用作不得将假设检验用作不得将假设检验用作不得将假设检验用作“行行行行/不行不行不行不行”检检检检验。验。验。验

19、。所存在的差异是否真的很重要?所存在的差异是否真的很重要?所存在的差异是否真的很重要?所存在的差异是否真的很重要?x-/nt=计算平均值的平均值的T-检验检验Test of mu=5.39400 vs mu not=5.39400Variable N Mean StDev SE Mean T Pfix 3 10 5.39470 0.00116 0.00037 1.91 0.089单样本单样本CI和假设检验和假设检验修订版10 1999年1月11日GE Appliances Copyright 19993.3.2222有关差异的统计决策的三种方法有关差异的统计决策的三种方法方法1如果计算值大于(

20、)表格(关键)值,则拒绝Ho,接受存在差异。方法2如果计算的p值小于(),则拒绝Ho,接受存在差异。方法3如果检验值(目标值)不在置信区间内,则拒绝Ho,接受存在差异。这这3种方法将得出相同的结论种方法将得出相同的结论。单样本单样本CI和假设检验和假设检验修订版10 1999年1月11日GE Appliances Copyright 19993.3.2323何谓何谓p值?值?p值的统计定义观察到的显著水平。当不存在差异时,接受Ha,即接受存在差异的概率导致拒绝零假设的最小值。这些都是很好的这些都是很好的统计统计定义,但定义,但 我如何利用它?我如何利用它?如果 p ,则差异具有统计显著性。拒绝

21、零假设,接受存在差异。将(1-p)看作存在差异的置信度。举例举例1:p=0.001,则(1-p)=0.999或99.9%。您可以将99.9%看成是存在差异的置信度。举例举例2:p=0.25,则(1-p)=0.75或75%您可以将75%看成是存在差异的置信度。单样本单样本CI和假设检验和假设检验修订版10 1999年1月11日GE Appliances Copyright 19993.3.2424单样本单样本 t-课堂练习课堂练习3.写出有关设备3的平均值的结论。设备设备11的的1010个个部件的高度部件的高度5.3905.3905.3895.3895.3905.3905.3895.3895.3

22、885.3885.3915.3915.3915.3915.3915.3915.3915.3915.3895.3891.计算设备1的95%置信区间的平均值。n=_ x=_ s=_df=_置信下限 =_置信上限 =_2.进行假设检验,以确定平均值是否显著地不同于目标值5.394Ho:_Ha:_单样本单样本CI和假设检验和假设检验修订版10 1999年1月11日GE Appliances Copyright 19993.3.2525正态分布对有关平均值的命题有多重要?根据中心极限定理中心极限定理,平均值趋于正态分布,即使单个变量并不具备正态分布特征。只要样本不是太小,而且没有极端值,正态分布这个前提

23、对于平均值平均值的置信区间和假设检验正态分布通常不成问题。单样本单样本CI和假设检验和假设检验修订版10 1999年1月11日GE Appliances Copyright 19993.3.2626关键概念关键概念关键概念关键概念:-第第第第3 3部分部分部分部分置信区间与假设检验置信区间与假设检验1.假设假设Ho:事物相同Ha:事物不同2.置信区间置信区间:总体参数最可能的取值范围(与数据一致的值)。3.平均值平均值 t检验是一种假设检验,用于将样本的平均值与目标值或与其它样本的平均值相比较。单样本t检验用于将样本平均值与目标平均值相比较。单样本单样本CI和假设检验和假设检验修订版10 19

24、99年1月11日GE Appliances Copyright 19993.3.2727关键概念关键概念关键概念关键概念:-第第第第3 3部分部分部分部分置信区间与假设检验置信区间与假设检验统计风险错误:将实际上相同的事物说成不同(在装配线上拒绝合格的部件)风险:出现错误的风险-习惯上,风险为5%(或=0.05)p值:所观察到的显著水平。在总体参数相同的情况下,观察到显著差异的概率。如果观察到的显著水平(“p”)小于可接受的风险(“”),则接受接受 Ha(否定Ho)。如果观察到的显著水平(“p”)大于可接受的风险(“”),则拒绝拒绝 Ha(不拒绝Ho)。单样本单样本CI和假设检验和假设检验修订

25、版10 1999年1月11日GE Appliances Copyright 19993.3.2828附录附录单样本单样本CI和假设检验和假设检验修订版10 1999年1月11日GE Appliances Copyright 19993.3.2929定义假设定义假设零假设假定总体/样本相同。公式选择公式选择实际应用实际应用Ho:1=假定设备相同假定设备相同Ho:1-2=0Ho:1=2=3=.nHo:1=2Ho:1=2=3=.n备择假设假定总体/样本之间存在差异。公式选择公式选择Ha:1=2 双边双边检验检验Ha:1 2Ha:1-2=0 双边双边检验检验Ha:1-2 0 Ha:1=2 双边双边检验

26、检验Ha:1 2单边检验单边检验单边检验单边检验单边检验单边检验实际应用实际应用用以确定用以确定一台设备是比其它的好、坏一台设备是比其它的好、坏,或与其它设备不同。或与其它设备不同。Ha是可以得到证明的唯一假设!单样本单样本CI和假设检验和假设检验修订版10 1999年1月11日GE Appliances Copyright 19993.3.3030假设检验的九个步骤假设检验的九个步骤1.定义问题/陈述检验的目的2.建立假设-Ho和 Ha 陈述零假设(Ho):总体的参数相同相同 陈述备择假设(Ha):总体的参数不同不同3.确定适当的统计检验(假设的概率分布:t、F、或x2)。4.陈述可接受的风

27、险和风险水平:风险:通常为通常为 5%风险:通常为通常为 10-20%在进行任何假设检验之前,必须确定这四个方面单样本单样本CI和假设检验和假设检验修订版10 1999年1月11日GE Appliances Copyright 19993.3.3131假设检验中的九个步骤假设检验中的九个步骤(续续)5.使用检验灵敏度(/)确定样本大小6.制定抽样计划和收集样本7.根据数据计算检验统计值(t、F或x2)8.确定所计算的检验统计值由于偶然因素引发的概率(p值):如果概率(p),则拒绝Ho并接受 Ha 如果概率(p),则不能拒绝Ho(无法得出结论)9.复制结果,并将统计结论转换为实际解决方案。在每个

28、假设检验中,我们在每个假设检验中,我们都在努力证明都在努力证明Ha单样本单样本CI和假设检验和假设检验修订版10 1999年1月11日GE Appliances Copyright 19993.3.3232有关假设的注解有关假设的注解假设代表了实际问题向统计问题的转换。在这种方法中,以各种术语来表述实际问题,以使其适于科学检验和检测。实质上,假设就是与给定概率分布的参数相关的命题;如平均值和/或方差。换句话说,假设是这样一些命题:使我们能够在进行调查之前提出所有可能的结果。在统计调查之后,我们只需接受或拒绝每个假设,反过来,这些假设又为我们制定现实生活中的实际决策奠定了坚实的基础。当以零假设表

29、述时,假设通常的含义与偶发事件的分布相关。这种特殊的假设经常被称为“零假设”,并以“Ho”表示。通常,它被称为“名义上的假设。”其意思非常简单-调查的全体参数相等;也就是说,我们所关心的所有参数(平均值和/或偏差)之间没有差异。直接与零假设相对的是备择假设(Ha)。这类假设一般与非偶发事件的分布相关,因而,被称之为“统计显著地不同”于偶发事件的分布,也就是说,观察到的存在于所调查的样本参数之间的差异不是源于样本的随机偏差。如果观测到的样本的差异不是偶发原因所致,我们可以得出结论,从一个或多个方面来说,样本不同于我们所调查的总体。因此,我们接受不相同的备择假设,并认为样本是从其它总体、而不是从我

30、们所调查的总体中 抽取的。当接受或拒绝零假设和备择假设时,我们冒已知程度的风险、具有一定的置信度。为此,我们规定(在调查之前)了可接受的决策风险的大小(、)和检验灵敏度(/)。一旦选择完毕,我们就拥有了所需的信息来确定“合理”的样本大小。用于计算的数学等式确实存在;然而,我们必须将这些计算值与成本、时间和可用资源的实际限制范围相平衡,以便得出“合理的”抽样计划。单样本单样本CI和假设检验和假设检验修订版10 1999年1月11日GE Appliances Copyright 19993.3.3333 t分布的性质分布的性质如果总体分布为未知,我们可以通过随机取样来进行估计。当样本为无穷大时,则

31、不存在估算误差;因此,我们可以应用正态(z)分布来发现偶发事件的概率。然而,随着样本大小的降低,我们的不确定性也不断提高;因此,对于同一概率,我们必须扩大预测的范围。换句话说,我们必须纠正我们必须纠正z来弥补自来弥补自由度的损失由度的损失。5%df=无穷大无穷大单件测量的 分布z=x 5%df=4t=x nz =1.645t=2.132x 由自由度的改变而引起的差异平均值的标准差 观察值-预期值单件测量的 分布单样本单样本CI和假设检验和假设检验修订版10 1999年1月11日GE Appliances Copyright 19993.3.3434均值的标准差即为平均值的范围。标准差除以样本大小的平方根就得出了均值的标准差(这一除法即是根据样本大小调整曲线)平均值的标准差平均值的标准差平均值的标准差平均值的标准差 平均值曲线平均值的标准差大约在 5至10个点之后稳定X=Xn抽样平均值的分布XXCopyright 1995 Six Sigma Academy Inc.B14.7样本大小(n)

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 生活常识

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com