假设检验完整.pptx

上传人:一*** 文档编号:71934027 上传时间:2023-02-07 格式:PPTX 页数:105 大小:1.69MB
返回 下载 相关 举报
假设检验完整.pptx_第1页
第1页 / 共105页
假设检验完整.pptx_第2页
第2页 / 共105页
点击查看更多>>
资源描述

《假设检验完整.pptx》由会员分享,可在线阅读,更多相关《假设检验完整.pptx(105页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、假设检验假设检验第一节、假设检验概述第一节、假设检验概述第二节、总体平均数的假设检验(第二节、总体平均数的假设检验(Z、T)第三节、总体比率的假设检验(第三节、总体比率的假设检验(P)第四节、总体方差的假设检验(卡方、第四节、总体方差的假设检验(卡方、F)第1页/共105页第一节第一节 假设检验概述假设检验概述1、假设检验的基本思想、假设检验的基本思想2、假设检验的步骤、假设检验的步骤3、两类错误和假设检验的规则、两类错误和假设检验的规则第2页/共105页 Ronald Ronald Aylmer Fisher,Aylmer Fisher,英国著名的统英国著名的统计学家,遗传学家,现代数理统计

2、的奠基计学家,遗传学家,现代数理统计的奠基人之一。人之一。他在抽样分布理论、相关回归分析、多他在抽样分布理论、相关回归分析、多元统计分析、最大似然估计理论,方差分元统计分析、最大似然估计理论,方差分析和假设检验有很多的建树。析和假设检验有很多的建树。第3页/共105页女士品茶女士品茶20世纪20年代后期在英国剑桥一个夏日的下午,一群大学的绅士和他们的夫人以及来访者,正围坐在户外的桌旁享用下午的奶茶。奶茶一般是由牛奶和茶混合而成的,调制时候可以先倒茶后倒牛奶,也可以先倒牛奶后倒茶。这时候,一名女士说她能区分这两种不同做法的调制出来的奶茶。那么如何检验这位女士的说法?为此Fisher进行了研究,从

3、而提出了假设检验的思想。第4页/共105页1、推广素质教育以后,教学效果是不是有所提高?(教育统计)2、某种新胃药是否比以前更有效?(卫生统计)3、醉酒驾车认定为刑事犯罪后是否交通事故会减少?(司法统计)4、如何检测某批种子的发芽率?(农业统计)5、海关工作人员如何判定某批产品能够通关?(海关统计)6、红楼梦后40回作者的鉴定(文学统计)。7、民间借贷的利率为多少?(金融统计)8、兴奋剂检测(体育统计)假设检验的应用假设检验的应用第5页/共105页 1、假设检验的基本思想 为研究某山区的成年男子的脉搏均数是否高于一般成年男子脉搏均数,某医生在一山区随机抽查了25名健康成年男子,得其脉搏均数x为

4、74.2次/分,标准差为6.0次/分。根据大量调查已知一般健康成年男子脉搏均数为72次/分,能否据此认为该山区成年的脉搏均数高于一般成年男子的脉搏均数0?问题1:造成这25名男子脉搏均数高于一般男子的原因是什么?第6页/共105页问题2、怎样判断以上哪个原因是成立的?若x与0接近,其差别可用抽样误差解释,x来自于0;若x与0相差甚远,其差别不宜用抽样误差解释,则怀疑x不属于0。由资料已知样本均数与总体均数不等,原因有二:由资料已知样本均数与总体均数不等,原因有二:(1 1)两者非同一总体,即两者差异由地理气候等因素造成,)两者非同一总体,即两者差异由地理气候等因素造成,也就是可以说高山成年人的

5、脉搏比一般人的要高;也就是可以说高山成年人的脉搏比一般人的要高;(2 2)两者为同一总体,即两者差异由抽样误差造成)两者为同一总体,即两者差异由抽样误差造成。检验如下假设:检验如下假设:原假设原假设:高山成年人脉搏与一般人的脉搏没有差异:高山成年人脉搏与一般人的脉搏没有差异:=0 0备择假设备择假设:高山成年人脉搏与一般人的脉搏有差异:高山成年人脉搏与一般人的脉搏有差异:0 0第7页/共105页假设检验的基本概念假设检验的基本概念1.概念事先对总体参数或分布形式作出某种假设然后利用样本信息来以一定的概率判断原假设是否成立参数检验和非参数检验(第8章的内容)2.作用一般是对有差异的数据进行检验,

6、判断差异是否显著(概率)如果通过了检验,不能拒绝原假设,说明没有显著差异,那么这种差异是由抽样造成的如果不能通过检验,则拒绝原假设,说明有显著差异,这种差异是由系统误差造成的.证伪不能存真.第8页/共105页第一节第一节 假设检验概述假设检验概述1、假设检验的基本思想、假设检验的基本思想2、假设检验的步骤、假设检验的步骤3、两类错误和假设检验的规则、两类错误和假设检验的规则第9页/共105页二、假设检验的步骤二、假设检验的步骤1、根据具体的问题,建立原假设和备择假设2、构造一个合适的统计量,计算其抽样分布 (均值检验)3、给定显著水平和确定临界值。显著水平通常取0.1、0.05或0.01。在确

7、定了显著水平后,根据统计量的分布就可以确定找出接受区域和拒绝区域的临界值。4、根据样本的值计算统计量的数值并作出决策。如果统计量的值落在拒绝域中,那么就没有通过检验,说明有显著差异,拒绝原假设。如果统计量的值落在接受域中,通过了假设检验,说明这种差异是由于抽样造成,这个样本不能拒绝原假设。第10页/共105页1、原假设与备择假设、原假设与备择假设原假设(null hypothesis):一般研究者想收集证据予以反对的假设。表示为H0备择假设(alternative hypothesis):一般研究者想收集证据予以支持的假设。表示为H1由于假设检验中只有在小概率事件发生的情况下才拒绝原假设,因此

8、在假设检验过程中是保护原假设的。有三种形式:有三种形式:(1)双侧检验双侧检验 H0:0,H1:0(不等,有差异);(不等,有差异);(2)左侧检验左侧检验 H0:0,H1:0(提高,增加)(提高,增加)采用哪种形式要根据实际问题。采用哪种形式要根据实际问题。第11页/共105页某种饮料的易拉罐瓶的标准容量为335毫升,为对生产过程进行控制,质量监测人员定期对某个分厂进行检查,确定这个分厂生产的易拉罐是否符合标准要求。如果易拉罐的平均容量大于或小于335毫升,则表明生产过程不正常。试陈述用来检验生产过程是否正常的原假设和备择假设解解解:研研究究者者想想收收集集证证据据予予以以证证明明的的假假设

9、设应应该该是是“生产过程不正常生产过程不正常”。建立的原假设和备择假设为。建立的原假设和备择假设为 H H0 0:335ml 335ml H H1 1:335ml335ml 第12页/共105页 消费者协会接到消费者投诉,指控品牌纸包装饮料存在容量不足,有欺骗消费者之嫌。包装上标明的容量为250毫升。消费者协会从市场上随机抽取50盒该品牌纸包装饮品进行假设检验。试陈述此假设检验中的原假设和备择假设。解解:消消费费者者协协会会的的意意图图是是倾倾向向于于证证实实饮饮料料厂厂包包装装饮料小于饮料小于250ml 250ml。建立的原假设和备择假设为。建立的原假设和备择假设为 H H0 0:250ml

10、 250ml H H1 1:250ml H H1 1成立成立 小概率事件发生小概率事件发生 拒绝拒绝H H0 0成成立立没有发现矛盾没有发现矛盾 证明失败证明失败小概率事件没有发生小概率事件没有发生 不能不能拒绝拒绝H H0 0成立成立 小概率事件小概率事件在一次实验中不可能发生的事件,如果发生了,在一次实验中不可能发生的事件,如果发生了,那么就可以拒绝原来的假设。那么就可以拒绝原来的假设。泰力布:等待黑天鹅的人泰力布:等待黑天鹅的人第22页/共105页显著性水平和拒绝域显著性水平和拒绝域(单侧检验单侧检验 )0 0临界值临界值 样本统计量样本统计量拒绝拒绝H H0 0抽样分布抽样分布1-1-

11、置信水平置信水平拒绝域拒绝域接受域接受域第23页/共105页显著性水平和拒绝域显著性水平和拒绝域(左侧检验左侧检验 )0 00临界值临界值临界值 样本统计量样本统计量样本统计量拒绝拒绝拒绝H HH0 00抽样分布抽样分布抽样分布1-1-1-置信水平置信水平置信水平观察到的样本统计量观察到的样本统计量观察到的样本统计量第24页/共105页显著性水平和拒绝域(左侧检验)0 00临界值临界值临界值 样本统计量样本统计量样本统计量拒绝拒绝拒绝H HH0 00抽样分布抽样分布1-1-1-置信水平置信水平观察到的样本统计量观察到的样本统计量第25页/共105页【例2】一种罐装饮料采用自动生产线生产,每罐的

12、容量是255ml,标准差为5ml,服从正态分布。换了一批工人后,质检人员在某天生产的饮料中随机抽取了16罐进行检验,测得每罐平均容量为257.2ml。取显著性水平=0.05,检验该天生产的饮料容量是否增加了?右侧检验右侧检验H0:255 H1:255z z0 0拒绝拒绝H H0 00.050.051.6451.645决策:拒绝决策:拒绝H0结结论论:样样本本提提供供的的证证据据表表明明:该该天天生生产产的的饮饮料料与与标标准准有有显显著著差差异异,可可以认为换工人后容量增加了。以认为换工人后容量增加了。第26页/共105页显著性水平和拒绝域显著性水平和拒绝域(右侧检验右侧检验 )0 00临界值

13、临界值临界值 样本统计量样本统计量样本统计量拒绝拒绝拒绝H HH0 00抽样分布抽样分布抽样分布1-1-1-置信水平置信水平置信水平观察到的样本统计量观察到的样本统计量观察到的样本统计量第27页/共105页显著性水平和拒绝域显著性水平和拒绝域(右侧检验右侧检验 )0 00临界值临界值临界值 样本统计量样本统计量样本统计量抽样分布抽样分布1-1-1-置信水平置信水平拒绝拒绝拒绝H HH0 00第28页/共105页第一节第一节 假设检验概述假设检验概述1、假设检验的基本思想、假设检验的基本思想2、假设检验的步骤、假设检验的步骤3、两类错误和假设检验的规则、两类错误和假设检验的规则第29页/共105

14、页三、两类错误和假设检验的规则三、两类错误和假设检验的规则1.第类错误(弃真错误)原假设为真时拒绝原假设第类错误的概率记为被称为显著性水平2.第类错误(取伪错误)原假设为假时未拒绝原假设第类错误的概率记为(Beta)第30页/共105页H H0 0:无罪无罪假设检验中的两类错误假设检验中的两类错误陪审团审判陪审团审判裁决裁决实际情况实际情况无罪无罪有罪有罪有罪有罪错误错误正确正确无罪无罪正确正确错误错误H0 检验检验决策决策实际情况实际情况H0为真为真H0为假为假拒绝拒绝H0第第类错类错误误()正确决策正确决策(1-(1-)未拒绝未拒绝H0正确决策正确决策(1 )第第类错类错误误()假设检验就

15、假设检验就好像一场审判过程好像一场审判过程统计检验过程统计检验过程统计检验过程第31页/共105页H H0 0:药品为真药药品为真药假设检验中的两类错误之间的关系假设检验中的两类错误之间的关系真药真药假药假药拒绝拒绝拒绝域大拒绝域大a a大大弃真弃真正确正确不拒绝不拒绝 正确正确接受域小接受域小 小小取伪取伪宁可错杀三千,不可放过一个。宁可错杀三千,不可放过一个。H H0 0:某次面试为好机会某次面试为好机会好机会好机会不好的机不好的机会会拒绝拒绝(不去不去)拒绝域小拒绝域小a a小小正确正确不拒绝不拒绝(去去)正确正确接受域大接受域大 大大第32页/共105页 错误和 错误的关系 你不能同时

16、减少两类错误!只能增加样本容量。和和 的关系就像的关系就像翘翘板,翘翘板,小小 就就大,大,大大 就小就小第33页/共105页 四、置信区间与假设检验之间的关系四、置信区间与假设检验之间的关系1 1、根据置信度、根据置信度1-1-构造置信区间,如果统计量落在构造置信区间,如果统计量落在置信区间中,那么接受原假设,如果不在置信区间中,置信区间中,那么接受原假设,如果不在置信区间中,那么拒绝原假设。那么拒绝原假设。2 2、根据显著水平、根据显著水平 ,可以构建置信度为,可以构建置信度为1-1-的置的置信区间。信区间。第34页/共105页一个总体的检验Z 检验检验(单侧和双侧)(单侧和双侧)t 检验

17、检验(单侧和双侧)(单侧和双侧)Z 检验检验(单侧和双侧)(单侧和双侧)检验检验(单侧和双侧)(单侧和双侧)均值均值一个总体一个总体比例比例方差方差第35页/共105页第二节第二节 总体均值的检验总体均值的检验一、单个总体均值的检验一、单个总体均值的检验(Z TZ T)二、二、两个总体均值检验(等方差、异方差)(等方差、异方差)三、两个非正态总体均值之差的检验(成对检验)第36页/共105页一、单个正态总体均值的检验一、单个正态总体均值的检验确定检验统计量的因素:确定检验统计量的因素:1 1、样本容量的大小、样本容量的大小 2 2、总体分布形状、总体分布形状 3 3、总体方差是否已知、总体方差

18、是否已知主要情形(主要情形(6 6种)种)1.1.正态总体(方差未知,且为小样本,正态总体(方差未知,且为小样本,1 1种种)2.2.正态总体(方差已知,小样本,正态总体(方差已知,小样本,1 1种种)3.3.大样本(不论总体是否正态,不论方差是否已大样本(不论总体是否正态,不论方差是否已知,知,4 4种种)三种假设检验的形式三种假设检验的形式(双侧,左侧和右侧)(双侧,左侧和右侧)第37页/共105页(一)总体平均数的检验(小样本,正态,方差已(一)总体平均数的检验(小样本,正态,方差已知知)1.假定条件总体服从正态分布小样本(n 30),但是总体方差已知2.检验统计量第38页/共105页某

19、机床厂加工一种零件,根据经验知道,该厂加工零件 的 椭 圆 度 近 似 服 从 正 态 分 布,其 总 体 均 值 为0=0.081mm,总体标准差为=0.025。今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度为0.076mm。试问新机床加工零件的椭圆度的均值与以前有无显著差异?(0.05)H0:=0.081,H1:0.081,=0.05,n=200临界值(s)(双侧检验)Z Z0 01.961.96-1.96-1.96.025.025拒绝拒绝 H H0 0拒绝拒绝 H H0 0.025.025检验统计量检验统计量:决策决策:拒绝拒绝H H0 0结论结论结论结论:有证据表明

20、新机床加工的零有证据表明新机床加工的零有证据表明新机床加工的零有证据表明新机床加工的零件的椭圆度与以前有显著差异。件的椭圆度与以前有显著差异。件的椭圆度与以前有显著差异。件的椭圆度与以前有显著差异。第39页/共105页均值的单侧均值的单侧 Z Z 检验检验左侧:左侧:H H0 0:0 0 0 0 H H1 1:0 0 0 0必须必须显著地显著地大于大于 0 0 0 0,小的值满足小的值满足 H H0 0,不能拒绝,不能拒绝Z Z0 0拒绝拒绝 H H0 0 第40页/共105页根据过去大量资料,某厂生产的灯泡的使用寿命服从正态分布N(1020,1002)。现从最近生产的一批产品中随机抽取16只

21、,测得样本平均寿命为1080小时。试在0.05的显著性水平下判断这批产品的使用寿命是否有显著提高?(0.05)右侧检验右侧检验H0:1020 H1:1020z z0 0拒绝拒绝H H0 00.050.051.6451.645决策:在在 0.050.05的水平上的水平上拒绝H0结结论论:样样本本提提供供的的证证据据表表明明:该该天天生生产产的的饮饮料料与与标标准准有有显显著著差差异异,可可以认为试用寿命提高了。以认为试用寿命提高了。第41页/共105页总体均值的检验(z检验)(P 值的计算与应用)第 1步:进 入 Excel表 格 界 面,直 接 点 击“f(x)”(粘贴 函数)第2步:在函数分

22、类中点击“统计”,并在函数名的 菜单下选择“NORMSDIST”,然后确定第3步:将 z 的绝对值2.4录入,得到的函数值为 0.9918 P值=1-0.9918=0.0082 P值小于,故拒绝H0第42页/共105页总体均值的检验(z检验)(P 值的图示)抽样分布抽样分布抽样分布P P P=0.00820.0082 0 001.6451.6451.645 0.050.050.05拒绝拒绝拒绝H HH0 001-1-1-计算出的样本统计量计算出的样本统计量计算出的样本统计量=2.4=2.4=2.4P P P 值值值第43页/共105页【例3】一种罐装饮料采用自动生产线生产,每罐的容量是255m

23、l,标准差为5ml,服从正态分布。换了一批工人后,质检人员在某天生产的饮料中随机抽取了16罐进行检验,测得每罐平均容量为252.8ml。取显著性水平=0.05,检验该天生产的饮料容量是否减少了?左侧检验左侧检验H0:255 H1:255-1.64-1.64z z0 0拒绝拒绝H H0 00.050.05决策:在决策:在0.05水平上拒绝水平上拒绝H0结结论论:样样本本提提供供的的证证据据表表明明:该该天天生生产产的的饮饮料料与与标标准准有有显显著著差差异异,可可以认为换工人后容量减少了。以认为换工人后容量减少了。第44页/共105页总体均值的检验(z检验)(P 值的计算与应用)第 1步:进 入

24、 Excel表 格 界 面,直 接 点 击“f(x)”(粘贴 函数)第2步:在函数分类中点击“统计”,并在函数名的 菜单下选择“NORMSDIST”,然后确定第3步:将 z 的绝对值-1.76录入,得到的函数值为 0.039204 P值=0.039204 P值小于,故拒绝H0第45页/共105页总体均值的检验(z检验)(P 值的图示)0 00-1.64-1.64-1.64 =0.05=0.05=0.05z zz拒绝拒绝拒绝H HH0 00抽样分布抽样分布1-1-1-计算出的样本统计量计算出的样本统计量计算出的样本统计量=-1.76=-1.76=-1.76P P P 值值值P PP=.03920

25、4.039204 第46页/共105页总体均值的检验规则(正态,小样本,方差已知)假设假设双侧检验双侧检验左左侧检验右右侧检验假设形式假设形式H0:=0 0H1:0 0H0:=0 0H1:0 0统计量统计量 已知已知拒绝域拒绝域P值决策值决策拒绝拒绝H0练习一练习一第47页/共105页(二)总体平均数检验(小样本,正态,方差未(二)总体平均数检验(小样本,正态,方差未知知*)1.假定条件总体服从正态分布小样本(n 30),但总体方差未知2.检验统计量第48页/共105页总体均值的检验总体均值的检验规则规则 (正态,方差未知,小样本情形正态,方差未知,小样本情形)假设假设双侧检验双侧检验左侧检验

26、左侧检验右侧检验右侧检验假设形式假设形式H0:=0 0H1:0 0H0:0 0H1:0 0统计量统计量总体总体 未知未知拒绝域拒绝域P P值决策值决策拒绝拒绝H0第49页/共105页【例1】某机器制造的肥皂厚度规定为5cm,假设肥皂厚度服从正态分布。今欲了解机器性能是否良好,取16块肥皂为样本,测得平均厚度为5.2cm,标准差为0.4cm。问在显著水平为0.05的水平下,机器是否为良好?双侧检验双侧检验H0:=5 H1:5决策决策:不能拒绝不能拒绝H0结结论论:认认为为该该机机器器还还是是良良好好的的,没没有充分的理由拒绝原假设。有充分的理由拒绝原假设。t t0 02.132.13-2.13-

27、2.130.0250.025拒绝拒绝 H H0 0拒绝拒绝 H H0 00.0250.025第50页/共105页【例2】某机器制造的肥皂厚度规定为5cm,假设肥皂厚度服从正态分布。今欲了解机器性能是否良好,取16块肥皂为样本,测得平均厚度为5.2cm,标准差为0.4cm。问在显著水平为0.05的水平下,肥皂的平均厚度是否偏高?右侧检验右侧检验H0:5 H1:5决策决策:拒绝拒绝H0结论:认为肥皂的平均厚度偏高。t(15)t(15)0 0拒绝拒绝H H0 00.050.051.7531.753P值值=0.031972=0.05,故不拒绝H0 第53页/共105页(三)总体均值的检验(大样本(三)

28、总体均值的检验(大样本)1.假定条件正态总体或非正态总体大样本(n30)2.使用 z检验统计量 2 已知:2 未知:第54页/共105页总体均值的检验规则总体均值的检验规则 (大样本情形大样本情形)假设假设双侧检验双侧检验左侧检验左侧检验右侧检验右侧检验假设形式假设形式H0:=0 0H1:0 0H0:0 0H1:0 0统计量统计量 已知:已知:未知:未知:拒绝域拒绝域P P值决策值决策拒绝拒绝H0第55页/共105页某某大大学学规规定定学学生生每每天天参参加加体体育育锻锻炼炼的的时时间间为为25分分钟钟。现现学学校校为为了了调调查查学学生生是是否否达达到到锻锻炼炼标标准准,从从该该校校学学生生

29、中中随随机机抽抽取取100人人,调调查查到到他他们们平平均均每每天天参参加加体体育育锻锻炼炼的的时时间间为为24分分钟钟,标标准准为为5分分钟钟。试试以以5的的显显著著水水平平检检验验该该校校学学生生平平均均每每天天的的锻炼时间是否达到规定。锻炼时间是否达到规定。右侧检验.H0:25,H1:25,=0.05,n=100决策:拒绝决策:拒绝H0结结论论:样样本本提提供供的的证证据据表表明明:学学生的锻炼时间没有达到规定。生的锻炼时间没有达到规定。-1.64-1.64z z0 0拒绝拒绝H H0 00.050.05第56页/共105页总体均值的检验(z检验)(P 值的计算与应用)第 1步:进 入

30、Excel表 格 界 面,直 接 点 击“f(x)”(粘贴 函数)第2步:在函数分类中点击“统计”,并在函数名的 菜单下选择“NORMSDIST”,然后确定第3步:将 z 的绝对值2录入,得到的函数值为 0.9925 P值=(1-0.9925)=0.0075 P值远远小于,故拒绝H0第57页/共105页【例】一种罐装饮料采用自动生产线生产,每罐的容量是255ml,标准差为5ml。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了40罐进行检验,测得每罐平均容量为255.8ml。取显著性水平=0.05,检验该天生产的饮料容量是否符合标准要求?z z0 01.961.96-1.961

31、.960.0250.025拒绝拒绝 H H0 0拒绝拒绝 H H0 00.0250.025双侧检验.H0:=255,H1:255,=0.05,n=40决策:不拒绝决策:不拒绝H0结结论论:样样本本提提供供的的证证据据表表明明:该天生产的饮料符合标准要求该天生产的饮料符合标准要求 第58页/共105页总体均值的检验(z检验)(P 值的计算与应用)第 1步:进 入 Excel表 格 界 面,直 接 点 击“f(x)”(粘贴 函数)第2步:在函数分类中点击“统计”,并在函数名的 菜单下选择“NORMSDIST”,然后确定第3步:将 z 的绝对值1.01录入,得到的函数值为 0.8437 P值=2*0

32、.8437-1=0.6874 P值远远大于,故不能拒绝H0第59页/共105页总体均值的检验总体均值的检验(大样本大样本)【例】一种机床加工的零件尺寸绝对平均误差为1.35mm。生产厂家现采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取50个进行检验。利用这些样本数据,检验新机床加工的零件尺寸的平均误差与旧机床相比是否 有 显 著 降 低?(=0.01)左侧检验50个零件尺寸的误差数据(mm)1.261.191.310.971.811.130.961.061.000.940.981.101.121.031.161.

33、121.120.951.021.131.230.741.500.500.590.991.451.241.012.031.981.970.911.221.061.111.541.081.101.641.702.371.381.601.261.171.121.230.820.86第60页/共105页总体均值的检验(大样本)(例题分析)H0:1.35H1:1.35=0.01n=50临界值(c):检验统计量检验统计量:决策:拒绝H0结论:新机床加工的零件尺寸的平均误差与旧机床相比有显著降低-2.33-2.33z z0 0拒绝拒绝H H0 00.010.01第61页/共105页总体均值的检验(z检验)(

34、P 值的计算与应用)第1步:进入Excel表格界面,直接点击“f(x)”第2步:在函数分类中点击“统计”,并在函数名的菜单下选择“ZTEST”,然后确定第3步:在所出现的对话框Array框中,输入原始数据所在区 域;在X后输入参数的某一假定值(这里为1.35);在 Sigma后输入已知的总体标准差(若未总体标准差未 知则可忽略不填,系统将自动使用样本标准差代替)第4步:用1减去得到的函数值0.995421023 即为P值 P值=1-0.995421023=0.004579 P值 5200=0.05n=36临界值(c):检验统计量检验统计量:拒绝拒绝H H0 0(P P=0.000088 0.0

35、00088 =0.05)=0.05)改良后的新品种产量有显著提高改良后的新品种产量有显著提高 决策决策:结论结论:z z0 0拒绝拒绝H H0 00.050.051.6451.645第65页/共105页总体均值的检验(z检验)(P 值的图示)抽样分布抽样分布抽样分布P P P=0.0000880.0000880.000088 0 001.6451.6451.645 0.050.050.05拒绝拒绝拒绝H HH0 001-1-1-计算出的样本统计量计算出的样本统计量计算出的样本统计量=3.75=3.75=3.75P P P 值值值第66页/共105页二、二、两个总体均值平均数之差的检验两个总体均

36、值平均数之差的检验检验的类型:检验的类型:(1)双侧检验双侧检验 H0:1-2=D,H1:1-2 D;(2)左侧检验左侧检验 H0:1-2=D,H1:1-2 D如果如果D=0,那么检验类型简化为:,那么检验类型简化为:(1)双侧检验双侧检验 H0:1 2,H1:1 2(不等,有差异);(不等,有差异);(2)左侧检验左侧检验 H0:1 2,H1:1 2(高)(高).第67页/共105页两个总体均值之差的假设检验两个总体均值之差的假设检验假定条件,两个总体之间是独立的,情形(一)两个总体都服从正态分布,1,2已知情 形(三)若 不 是 正 态 分 布,两 者 都 是 大 样 本(n130和n23

37、0)可以用正态分布来近似。2、使用正态分布统计量 z方差已知方差已知 方差未知用样本方差替代方差未知用样本方差替代第68页/共105页两个总体均值之差的检验规则(正态总体方差已知或者大样本情形)假设假设双侧检验双侧检验左左侧检验右右侧检验假设形式假设形式H0:1 1-00H1:1 1-0 0 H0:1 1-0 0H1:1 1-0 0统计量统计量 1 12,2 已知已知 1 12,2 未知未知拒绝域拒绝域P值决策值决策拒绝拒绝H0第69页/共105页 【例】某公司对男女职员的平均小时工资进行了调查,独立抽取了具有同类工作经验的男女职员的两个随机样本,并记录下两个样本的均值、方差等资料如右表。在显

38、著性水平为0.05的条件下,能否认为男性职员与女性职员的平均小时工资存在显著差异?两个样本的有关数据两个样本的有关数据 男性职员男性职员女性职员女性职员n1=44n2=32 x1=75 x2=70S12=64S22=42.25H0:1 1-=0 H1:1 1-0结论:拒绝H0,该公司男女职员的平均小时工资之间存在显著差异 ,性别是影响工资的一个因素性别是影响工资的一个因素。z0 01.96-1.960.0250.025拒绝 H0拒绝 H00.0250.025第70页/共105页二、正态总体方差 未知但 12=22*p假定假定条件条件n两个独立的小样本n两个总体都是正态分布n 12、22未知但相

39、等,即 12=22p检验检验统计量统计量其中:其中:其中:其中:自由度自由度:第71页/共105页两个总体均值之差的检验规则(正态,方差未知,小样本情形)假设假设双侧检验双侧检验左左侧检验右右侧检验假设形式假设形式H0:1 1-00H1:1 1-0 0 H0:1 1-0 0H1:1 1-0 0统计量统计量总体总体 未知未知拒绝域拒绝域P值决策值决策拒绝拒绝H0第72页/共105页 【例例】甲甲、乙乙两两台台机机床床同同时时加加工工某某种种同同类类型型的的零零件件,已已知知两两台台机机床床加加工工的的零零件件直直径径(单单位位:cm)cm)分分别别服服从从正正态态分分布布,并并且且有有 12=2

40、2。为为比比较较两两台台机机床床的的加加工工精精度度有有无无显显著著差差异异,分分别别独独立立抽抽取取了了甲甲机机床床加加工工的的8 8个个零零件件和和乙乙机机床床加加工工的的7 7个个零零件件,通通过过测测量量得得到到如如下下数数据据 。在在=0.05的的显显著著性性水水平平下下,样样本本数数据据是是否否提提供供证证据据支支持持 “两两台台机机床床加加工工的的零零件件直径不一致直径不一致”的看法?的看法?两台机床加工零件的样本数据两台机床加工零件的样本数据 (cmcm)甲甲20.519.819.720.420.120.019.019.9乙乙20.719.819.520.820.419.620

41、.2t t0 02.1602.160-2.160-2.1600.0250.025拒绝拒绝 H0H0拒绝拒绝 H H0 00.0250.025H0:1-2=0 H1:1-2 0 不能拒绝原假设。因此没有理由认为甲、不能拒绝原假设。因此没有理由认为甲、乙两台机床加工的零件直径有显著差异乙两台机床加工的零件直径有显著差异 第73页/共105页两个总体均值之差的检验(用Excel进行检验)第1步:将原始数据输入到Excel工作表格中 第2步:选择“工具”下拉菜单并选择“数据分析”选项 第3步:在“数据分析”对话框中选择“t-检验:双样本等方差 假设”第4步:当对话框出现后 在“变量1的区域”方框中输入

42、第1个样本的数据区域 在“变量2的区域”方框中输入第2个样本的数据区域 在“假设平均差”方框中输入假定的总体均值之差 在“”方框中输入给定的显著性水平(本例为0.05)在“输出选项”选择计算结果的输出位置,然后“确定”第74页/共105页 t-检验检验:双样本等方差假设双样本等方差假设*变量变量 1变量变量 2平均平均19.92520.1428571方差方差0.2164285710.27285714观测值观测值87合并方差合并方差0.242472527假设平均差假设平均差0df13t Stat-0.854848035P(T=t)单尾单尾0.204056849t 单尾临界单尾临界1.770933

43、383P(T=t)双尾双尾0.408113698t 双尾临界双尾临界2.160368652 第75页/共105页【例例】为为检检验验两两种种方方法法组组装装产产品品所所需需时时间间的的差差异异,分分别别对对两两种种不不同同的的组组装装方方法法各各随随机机安安排排12个个工工人人,每每个个工工人人组组装装一一件件产产品品所所需需的的时时间间(分分钟钟)下下如如表表。假假定定两两种种方方法法组组装装产产品品的的时时间间服服从从正正态态分分布布,但但方方差差未未知知且且不不相相等等。取取显显著著性性水水平平0.05,能能否否认认为方法为方法1组装产品的平均数量明显地高于方法组装产品的平均数量明显地高

44、于方法2?两个方法组装产品所需的时间两个方法组装产品所需的时间 方法方法1方法方法228.336.027.631.730.137.222.226.029.038.531.032.037.634.433.831.232.128.020.033.428.830.030.226.52 21 1第76页/共105页t-检验检验:双样本等方差假设双样本等方差假设变量变量 1变量变量 2平均平均32.528.8方差方差15.9963636419.3581818观测值观测值1212合并方差合并方差17.67727273假设平均差假设平均差0df22t Stat2.155607659P(T=t)单尾单尾0.0

45、21158417t 单尾临界单尾临界1.717144335P(T=t)双尾双尾0.042316835t 双尾临界双尾临界2.073873058第77页/共105页四、12,22 未知且不相等 12 22假定条件两个总体都是正态分布12,22未知且不相等,即1222样本容量不相等,即n1n2检验统计量自由度:自由度:自由度:参见:李勇参见:李勇 统计学导论统计学导论第78页/共105页【例例】为为检检验验两两种种方方法法组组装装产产品品所所需需时时间间的的差差异异,分分别别对对两两种种不不同同的的组组装装方方法法各各随随机机安安排排12个个工工人人,每每个个工工人人组组装装一一件件产产品品所所需

46、需的的时时间间(分分钟钟)下下如如表表。假假定定两两种种方方法法组组装装产产品品的的时时间间服服从从正正态态分分布布,但但方方差差未未知知且且不不相相等等。取取显显著著性性水水平平0.05,能能否否认认为方法为方法1组装产品的平均数量明显地高于方法组装产品的平均数量明显地高于方法2?两个方法组装产品所需的时间两个方法组装产品所需的时间 方法方法1方法方法228.336.027.631.730.137.222.226.029.038.531.032.037.634.433.831.232.128.020.033.428.830.030.226.52 21 1第79页/共105页t-检验检验:双样

47、本异方差假设双样本异方差假设*变量变量 1变量变量 2平均平均32.528.8方差方差15.9963619.35818182观测值观测值1212假设平均差假设平均差0df22t Stat2.155608P(T=t)单尾单尾0.021158t 单尾临界单尾临界1.717144P(T=t)双尾双尾0.042317t 双尾临界双尾临界2.073873第80页/共105页为比较甲乙两台机床的加工精度是否相等,分别独立抽取了为比较甲乙两台机床的加工精度是否相等,分别独立抽取了甲机床加工的甲机床加工的10个零件和乙机床加工的个零件和乙机床加工的12个零件的直径。测个零件的直径。测得加工零件的直径数据后,利

48、用得加工零件的直径数据后,利用EXCEL数据工具输出的结果数据工具输出的结果如下:如下:(假设总体方差相等,显著水平为假设总体方差相等,显著水平为0.05。)1、请建立原假设和备择假设。是否有证据说明甲乙两机床是否存在差异?请说明理由2、如果显著水平为0.01,那么(1)中的结论是否有变化?为什么?3、在以上的检验中,还需要什么假设?练习练习第81页/共105页t-检验检验:双样本异方差假设双样本异方差假设变量变量 1变量变量 2平均平均33.230.06666667方差方差16.062226.913333333观测值观测值1012假设平均差假设平均差0df15t Stat2.121026P(

49、T=t)单尾单尾0.025497t 单尾临界单尾临界1.75305P(T5,nq5,样本比率可用正态分布来近似(大样本)2.检验的 z 统计量 0 0为假设的总体比率为假设的总体比率第83页/共105页总体比率的检验规则总体比率的检验规则假设假设双侧检验双侧检验左侧检验左侧检验右侧检验右侧检验假设形式假设形式H0:=0 0H1:0 0H0:0 0H1:0 0统计量统计量拒绝域拒绝域P P值决策值决策拒绝拒绝H0第84页/共105页总体比率的检验【例】一种以休闲和娱乐为主题的杂志,声称其读者群中有80%为女性。为验证这一说法是否属实,某研究部门抽取了由200人组成的一个随机样本,发现有146个女

50、性经常阅读该杂志。分别取显著性水平0.05和0.01,检验该杂志读者群中女性的比率是否为80%?它们的值各是多少?双侧检验第85页/共105页H0:=80%,H1:80%,=0.05拒绝拒绝H H0 0(P P=0.013328 0.013328 =0.01)该杂志的说法属实z z0 02.582.58-2.58-2.580.0250.025拒绝拒绝 H0H0拒绝拒绝 H H0 00.0250.025第86页/共105页1.假定条件两个总体都服从二项分布可以用正态分布来近似检验统计量检验H0:1-2=0检验H0:1-2=d0二、两个总体比率之差的检验二、两个总体比率之差的检验第87页/共105

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 管理文献 > 管理工具

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com