统计推断统计推断.pptx

上传人:一*** 文档编号:72007655 上传时间:2023-02-08 格式:PPTX 页数:96 大小:1.93MB
返回 下载 相关 举报
统计推断统计推断.pptx_第1页
第1页 / 共96页
统计推断统计推断.pptx_第2页
第2页 / 共96页
点击查看更多>>
资源描述

《统计推断统计推断.pptx》由会员分享,可在线阅读,更多相关《统计推断统计推断.pptx(96页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、会计学1统计统计(tngj)推断推断 统计统计(tngj)推断推断第一页,共96页。第六章 统计(tngj)推断 统计推断的特点按照随机原则从总体中抽取样本单位;随机原则是指在抽取样本时,排除主观(zhgun)意识地抽取调查单位,使每个单位都有一定的机会(概率)被抽中,因此也叫概率抽样。其目的是由部分信息来推断总体特征;其理论基础是概率论;其误差事先可以计算并加以控制。第2页/共96页第二页,共96页。第六章 统计(tngj)推断二、统计推断的基本方法二、统计推断的基本方法1 1、参数估计、参数估计研究如何利用样本统计量来推断总体研究如何利用样本统计量来推断总体未知参数的方法。未知参数的方法。

2、2 2、假设检验(参数检验)、假设检验(参数检验)事先对总体参数提出一事先对总体参数提出一个假设,然后个假设,然后(rnhu)(rnhu)再利用样本信息去检验这个再利用样本信息去检验这个假设是否成立的一个过程。假设是否成立的一个过程。第3页/共96页第三页,共96页。第六章 统计(tngj)推断 三、统计推断(tudun)的误差 概念:统计推断(tudun)的误差是指样本数据与总体真实值之间的差距分类:抽样误差与非抽样误差第4页/共96页第四页,共96页。第六章 统计(tngj)推断 1 1、抽样误差、抽样误差概念概念 抽样误差也称随机误差,是指由于抽样的随机性引抽样误差也称随机误差,是指由于

3、抽样的随机性引起起(y(y nqnq)的样本结果与总体真值之间的误差。的样本结果与总体真值之间的误差。抽样误差不是指某个具体的样本观测值与总体真值之间的抽样误差不是指某个具体的样本观测值与总体真值之间的差距,而是指样本的所有可能结果与总体真值之间的平差距,而是指样本的所有可能结果与总体真值之间的平均性差异,因此,也叫抽样平均误差。均性差异,因此,也叫抽样平均误差。第5页/共96页第五页,共96页。第六章 统计(tngj)推断抽样误差的计算抽样误差的计算抽样误差的计算抽样误差的计算(j sun)(j sun)在简单在简单(ji(ji ndn)ndn)随机抽样条件下,样本均值和样本随机抽样条件下,

4、样本均值和样本比例的抽样误差:比例的抽样误差:样本均值的抽样误差样本均值的抽样误差不重复抽样:不重复抽样:重复抽样:重复抽样:当总体方差当总体方差 未知时,可用样本方差未知时,可用样本方差 代替。代替。第6页/共96页第六页,共96页。第六章 统计(tngj)推断 样本样本(yngbn)(yngbn)比例的抽样误差比例的抽样误差重复重复(chngf)抽样:抽样:不重复抽样:不重复抽样:当总体比例当总体比例 未知时,可以用样本比例未知时,可以用样本比例p代替。代替。第7页/共96页第七页,共96页。第六章 统计(tngj)推断 影响抽样误差的因素影响抽样误差的因素 总体各单位标志值的差异程度,即

5、,差异程度越大,总体各单位标志值的差异程度,即,差异程度越大,则抽样误差愈大,反之,则愈小;则抽样误差愈大,反之,则愈小;抽样方法。不同的抽样方法,抽样误差也不同。一抽样方法。不同的抽样方法,抽样误差也不同。一般情况下,重复抽样误差比不重复抽样误差要大一般情况下,重复抽样误差比不重复抽样误差要大一些;些;抽样调查的组织抽样调查的组织(zzh)(zzh)形式。形式。注:注:不同的抽样组织不同的抽样组织(zzh)(zzh)形式有不同的抽样误形式有不同的抽样误差;差;抽样误差是一种随机性误差,只存在于概率抽样误差是一种随机性误差,只存在于概率抽样中抽样中 。第8页/共96页第八页,共96页。第六章

6、统计(tngj)推断 2 2、非抽样误差、非抽样误差 概念概念 非抽样误差是指除抽样误差之外,由于非抽样误差是指除抽样误差之外,由于其他原因引起的样本观测其他原因引起的样本观测(gunc)(gunc)结果与总结果与总体真值之间的差异。体真值之间的差异。非抽样误差存在于各种抽样和调查中。非抽样误差存在于各种抽样和调查中。第9页/共96页第九页,共96页。第六章 统计(tngj)推断 非抽样误差的影响因素非抽样误差的影响因素(yn s)(yn s)(1 1)抽样框因素)抽样框因素(yn s)(yn s);(;(2 2)回答因素)回答因素(yn(yn s)s);(3 3)无回答因素)无回答因素(yn

7、 s)(yn s);(;(4 4)调查员的因素)调查员的因素(yn s)(yn s);(5 5)测量因素)测量因素(yn s)(yn s)。注:非抽样误差从理论上可以避免,但实注:非抽样误差从理论上可以避免,但实际上很难控制。际上很难控制。第10页/共96页第十页,共96页。第六章 统计(tngj)推断第二节第二节 参数估计参数估计一、参数估计概述一、参数估计概述1 1、参数估计、参数估计根据样本统计根据样本统计(t(t ngj)ngj)量来估计总体参数的一种量来估计总体参数的一种方法方法 。2 2、估计量、估计量用于估计总体参数的统计用于估计总体参数的统计(t(t ngj)ngj)量的名称。

8、量的名称。3 3、估计值、估计值根据一组具体样本计算出的估计量的取值。根据一组具体样本计算出的估计量的取值。第11页/共96页第十一页,共96页。第六章 统计(tngj)推断二、参数估计的方法二、参数估计的方法二、参数估计的方法二、参数估计的方法(fngf(fngf)(一)点估计(一)点估计1 1、定义:点估计是指用样本统计量的某个取值直接作为总、定义:点估计是指用样本统计量的某个取值直接作为总体参数的估计值。例如:用样本均值体参数的估计值。例如:用样本均值(jn zh)(jn zh)直接作为直接作为总体均值总体均值(jn zh)(jn zh)的估计;用两个样本均值的估计;用两个样本均值(jn

9、 zh)(jn zh)之差之差直接作为总体均值直接作为总体均值(jn zh)(jn zh)之差的估计之差的估计无法给出估计值接近总体参数程度的信息无法给出估计值接近总体参数程度的信息虽然在重复抽样条件下,点估计的均值虽然在重复抽样条件下,点估计的均值(jn zh)(jn zh)可望等于总体可望等于总体真值,但由于样本是随机的,抽出一个具体的样本得真值,但由于样本是随机的,抽出一个具体的样本得到的估计值很可能不同于总体真值到的估计值很可能不同于总体真值一个点估计量的可靠性是由它的抽样标准误差来衡量的,这一个点估计量的可靠性是由它的抽样标准误差来衡量的,这表明一个具体的点估计值无法给出估计的可靠性

10、的度表明一个具体的点估计值无法给出估计的可靠性的度量量 第12页/共96页第十二页,共96页。第六章 统计(tngj)推断()无无偏偏性性:估估计计量量抽抽样样(chu(chu ynyn)分分布布的数学期望等于被估计的总体参数的数学期望等于被估计的总体参数P P()B B BA A A无偏无偏无偏无偏无偏无偏有偏有偏有偏有偏有偏有偏评价评价(pngji)估计量的标准估计量的标准第13页/共96页第十三页,共96页。第六章 统计(tngj)推断评价(pngji)估计量的标准(2 2)有有有有效效效效性性性性:对对对对同同同同一一一一(tngy)(tngy)总总总总体体体体参参参参数数数数的的的的

11、两两两两个个个个无偏点估计无偏点估计无偏点估计无偏点估计 量,有更小标准差的估计量更有效量,有更小标准差的估计量更有效量,有更小标准差的估计量更有效量,有更小标准差的估计量更有效 A AB B 的抽样分布的抽样分布的抽样分布的抽样分布 的抽样分布的抽样分布的抽样分布的抽样分布P P()第14页/共96页第十四页,共96页。第六章 统计(tngj)推断评价(pngji)估计量的标准(3 3)一一致致性性:随随着着(su(su zhe)zhe)样样本本量量的的增增大大,估计量的值越来越接近被估计的总体参数估计量的值越来越接近被估计的总体参数A AB B较小的样本量较小的样本量较小的样本量较小的样本

12、量较大的样本量较大的样本量较大的样本量较大的样本量P P()第15页/共96页第十五页,共96页。第六章 统计(tngj)推断3 3、点估计的优缺点、点估计的优缺点(qudin)(qudin)(1 1)优点:其一是简洁明了;其二是能提供具体的估计值。)优点:其一是简洁明了;其二是能提供具体的估计值。(2 2)缺点)缺点(qudin)(qudin):其一是无法提供误差情况;其二是估计:其一是无法提供误差情况;其二是估计的可靠程度无从知晓。的可靠程度无从知晓。第16页/共96页第十六页,共96页。第六章 统计(tngj)推断(二)区间估计相关概念1、区间估计给出总体参数的一个区间范围,并在抽样分布

13、(fnb)的基础上给出估计的可靠性度量。置信区间置信区间置信区间置信区间置信下限置信下限置信下限置信下限置信上限置信上限置信上限置信上限样本统计量样本统计量样本统计量样本统计量 (点估计点估计点估计点估计)第17页/共96页第十七页,共96页。第六章 统计(tngj)推断 2 2、置信区间、置信区间 设设 是总体是总体 的一个参数,的一个参数,是参数是参数 的两个统的两个统计量,且计量,且 ,对给定的常数对给定的常数 ,及及任意的任意的 ,有有 ,则称随机区间则称随机区间 是置信度(置信水平)为是置信度(置信水平)为 的置信区间(区间的置信区间(区间估计)。其中估计)。其中 分别为置信下限和置

14、信上限。分别为置信下限和置信上限。反映反映(fnyng)(fnyng)了估计的精度大小。了估计的精度大小。置信区间越窄,置信区间越窄,则估计精度越高。则估计精度越高。第18页/共96页第十八页,共96页。第六章 统计(tngj)推断区间区间(q jin)估计估计的图示的图示 x x95%95%的样本的样本的样本的样本 -1.96-1.96 x x +1.96+1.96 x x99%99%的样本的样本的样本的样本 -2.58-2.58 x x +2.58+2.58 x x90%90%的样本的样本的样本的样本 -1.65-1.65 x x +1.65+1.65 x x第19页/共96页第十九页,共

15、96页。第六章 统计(tngj)推断 3 3、置信度,或者称作置信系数或置信水平,是、置信度,或者称作置信系数或置信水平,是指置信区间中包含总体指置信区间中包含总体(z(z ngtngt)参数真值的可能性参数真值的可能性大小,也就是人们可以信赖的程度,通常用大小,也就是人们可以信赖的程度,通常用 表示。反映的是估计的可靠度,置信水平越大,表示。反映的是估计的可靠度,置信水平越大,则估计的可靠度越高。则估计的可靠度越高。另外,置信度也可以指重复抽样条件下,在构造另外,置信度也可以指重复抽样条件下,在构造的所有置信区间中包含参数真值的区间所占的比的所有置信区间中包含参数真值的区间所占的比例,也就是

16、说构造的所有置信区间中有例,也就是说构造的所有置信区间中有100100()%个区间包含总体个区间包含总体(z(z ngtngt)参数真值。参数真值。第20页/共96页第二十页,共96页。第六章 统计(tngj)推断(95%的置信区间的置信区间)重复重复重复重复(chngf)(chngf)构造出构造出构造出构造出的的的的2020个置信个置信个置信个置信区间区间区间区间 点估计值点估计值点估计值点估计值第21页/共96页第二十一页,共96页。第六章 统计(tngj)推断练习练习(linx)一个一个95%95%的置信区间是指(的置信区间是指()A.A.总体参数落在这一区间内的概率是总体参数落在这一区

17、间内的概率是95%95%B.B.总体参数未落在这一区间内的概率是总体参数未落在这一区间内的概率是5%5%C.C.在用同样方法构造在用同样方法构造(guzo)(guzo)的总体参数的多个区间中,有的总体参数的多个区间中,有95%95%的区的区间包含该总体参数间包含该总体参数D.D.在用同样方法构造在用同样方法构造(guzo)(guzo)的总体参数的多个区间中,有的总体参数的多个区间中,有95%95%的区的区间不包含该总体参数间不包含该总体参数第22页/共96页第二十二页,共96页。第六章 统计(tngj)推断uu 总体均值的区间估计(总体均值的区间估计(已知)已知)uu1 1、假定条件:、假定条

18、件:uu总体服从正态分布且总体方差总体服从正态分布且总体方差(fn(fn ch)ch)已知;已知;uu总体为非正态分布,但为大样本(总体为非正态分布,但为大样本(),),总体方差总体方差(fn(fn ch)ch)已知已知uu2 2、使用正态分布、使用正态分布uu 统计量统计量一个总体参数的区间一个总体参数的区间(q jin)估计估计第23页/共96页第二十三页,共96页。第六章 统计(tngj)推断3、总体(zngt)均值 在置信水平 下的置信区间为:第24页/共96页第二十四页,共96页。第六章 统计(tngj)推断【例例例例6.26.2】解:已知解:已知解:已知解:已知总体均值总体均值 在

19、置信水平在置信水平 下的置信区间为:下的置信区间为:我们可以我们可以(ky)95%(ky)95%的概率保的概率保证该地区企业总经理的年证该地区企业总经理的年收入在收入在 113440 113440至至156560156560元之间。元之间。某地区企业总经理的某地区企业总经理的年收入服从正态分布,年收入服从正态分布,随机抽取随机抽取2525个企业,个企业,得到得到2525个企业总经理个企业总经理的平均收入为的平均收入为135000135000元。元。已知总体的标准差为已知总体的标准差为5500055000元,试求:该元,试求:该地区企业总经理的地区企业总经理的年平均收入年平均收入95%95%的置

20、信的置信(zhxn)(zhxn)区间。区间。第25页/共96页第二十五页,共96页。第六章 统计(tngj)推断uu总体均值的区间估计总体均值的区间估计(gj)(gj)(大样本,(大样本,未知)未知)uu1 1、假定条件:、假定条件:uu总体服从正态分布、大样本(总体服从正态分布、大样本()且总体方)且总体方差(差()未知;)未知;uu总体为非正态分布,大样本(总体为非正态分布,大样本(),且总体),且总体方差(方差()未知。)未知。第26页/共96页第二十六页,共96页。第六章 统计(tngj)推断2 2、使用、使用(shyng)(shyng)正态分布正态分布 统计量统计量3 3、总体均值、

21、总体均值 在置信水平下在置信水平下 的置信区间为:的置信区间为:第27页/共96页第二十七页,共96页。第六章 统计(tngj)推断【例例例例6.36.36.36.3】解:解:解:解:已知:已知:由于总体方差未知,且为大样由于总体方差未知,且为大样本,所以总体均值本,所以总体均值 在置信水在置信水平下平下 的置信区间为:的置信区间为:即,我们有即,我们有90%90%的把握认为,的把握认为,贷贷 款学生款学生(xu sheng)(xu sheng)总体中总体中的平均欠款额在的平均欠款额在 29862.92 29862.92至至30137.0830137.08元之间。元之间。在一项对大学生资助在一

22、项对大学生资助贷款的研究中,从全贷款的研究中,从全国各地随机抽取国各地随机抽取(chu q)3600(chu q)3600名贷过款的大学生作名贷过款的大学生作为样本,得到毕业前为样本,得到毕业前的平均欠款余额为的平均欠款余额为3000030000元,标准差为元,标准差为50005000元。试求贷款元。试求贷款学生总体中平均欠学生总体中平均欠款额的款额的90%90%的置信区的置信区间。间。第28页/共96页第二十八页,共96页。第六章 统计(tngj)推断uu 总体均值总体均值(jn zh)(jn zh)的区间估计(小样本,的区间估计(小样本,未知)未知)uu1 1、假定条件:、假定条件:uu

23、总体服从正态分布、小样本(总体服从正态分布、小样本()且总体方差)且总体方差()未知;)未知;uu2 2、使用、使用t t分布分布uu 统计量统计量第29页/共96页第二十九页,共96页。第六章 统计(tngj)推断3 3、总体、总体(zngt)(zngt)均值均值 在置信水平在置信水平 下的置信下的置信区间为:区间为:第30页/共96页第三十页,共96页。第六章 统计(tngj)推断【例例例例6.46.46.46.4】n n 一家研究机构为估计在某外资企业一家研究机构为估计在某外资企业工作的员工每周加班的平均时间,随机工作的员工每周加班的平均时间,随机抽取了抽取了1616个员工,得到他们每周

24、加班的个员工,得到他们每周加班的时间数据如下时间数据如下(rxi)(rxi)(单位:小时单位:小时):50526258596453555751544560495556第31页/共96页第三十一页,共96页。第六章 统计(tngj)推断 由样本数据可知由样本数据可知(k zh)(k zh):由由 ,查,查t t分布表得:分布表得:,解:已知解:已知第32页/共96页第三十二页,共96页。第六章 统计(tngj)推断 再根据(公式(gngsh)6.5)得员工平均每周加班时间的置信区间为:即,我们有95%的把握认为,该外资企业员工平均每周加班时间为52.3小时至57.7小时之间。第33页/共96页第

25、三十三页,共96页。第六章 统计(tngj)推断 练习练习(linx)一一家家食食品品生生产产企企业业以以生生产产袋袋装装食食品品为为主主,为为对对食食品品质质量量进进行行监监测测,企企业业质质检检部部门门经经常常要要进进行行抽抽检检,以以分分析析每每袋袋重重量量是是否否符符合合要要求求。现现从从某某天天生生产产的的一一批批食食品品中中随随机机抽抽取取了了2525袋袋,测测得得每每袋袋重重量量如如下下表表所所示示。已已知知产产品品重重量量的的分分布布服服从从正正态态分分布布,且且总总体体标标准准差差为为10g10g。试试估估计计(gj)(gj)该该批批产产品品平平均均重量的置信区间,置信水平为

26、重量的置信区间,置信水平为95%95%。112.5101.0103.0102.0100.5102.6107.5 95.0108.8115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.3第34页/共96页第三十四页,共96页。第六章 统计(tngj)推断uu 总体成数(比例)总体成数(比例)的区间估计的区间估计uu1 1、假定条件、假定条件uu 对于试验结果只有对于试验结果只有(zh(zh y y u)u)两种情况的总体(二两种情况的总体(二项总体),且为大样本,即满足项总体),且为大样本,

27、即满足 uu2 2、使用正态分布、使用正态分布uu 统计量统计量第35页/共96页第三十五页,共96页。第六章 统计(tngj)推断 3 3、总体比例、总体比例 的置信水平的置信水平 下的置信区间为:下的置信区间为:当总体比例当总体比例 未知时,可以未知时,可以(ky)(ky)用样本成数(比例)用样本成数(比例)p p 来代来代替总体成数(比例)替总体成数(比例)。第36页/共96页第三十六页,共96页。第六章 统计(tngj)推断【例【例6.56.5】为调查网民的平均年龄,随机抽取为调查网民的平均年龄,随机抽取500500人作样本,发现其中有人作样本,发现其中有225225个上网者是个上网者

28、是1919岁以下的青少年,试估计网民总体岁以下的青少年,试估计网民总体(zngt)(zngt)中,中,1919岁以下的青少年上网比例的岁以下的青少年上网比例的95%95%的置信区间。的置信区间。第37页/共96页第三十七页,共96页。第六章 统计(tngj)推断【解】已知【解】已知 ,根据抽样结果计算,根据抽样结果计算(j(j sun)sun)的样本成数(比例)为:的样本成数(比例)为:因为是大样本,故得:因为是大样本,故得:即,我们有即,我们有95%95%的把握认为,的把握认为,1919岁以下的青少岁以下的青少年上网比例年上网比例 在在40.64%40.64%至至49.36%49.36%之间

29、。之间。第38页/共96页第三十八页,共96页。第六章 统计(tngj)推断u 总体方差 的区间估计 u1、假定(jidng)条件u 总体服从正态分布u2、使用 分布统计量第39页/共96页第三十九页,共96页。第六章 统计(tngj)推断3 3、在给定置信度、在给定置信度 下,总体方差下,总体方差 的置信区间为:的置信区间为:式中:式中:是事先给定的显著性水平是事先给定的显著性水平(shupng)(shupng);分别是自由度为分别是自由度为 时,分布右尾面积为时,分布右尾面积为 时的临界值。时的临界值。第40页/共96页第四十页,共96页。第六章 统计(tngj)推断【例例例例】一一一一家

30、家家家食食食食品品品品生生生生产产产产企企企企业业业业以以以以生生生生产产产产袋袋袋袋装装装装食食食食品品品品为为为为主主主主,现现现现从从从从某某某某天天天天生生生生产产产产的的的的一一一一批批批批食食食食品品品品中中中中随随随随机机机机(su(su j)j)抽抽抽抽取取取取了了了了2525袋袋袋袋,测测测测得得得得每每每每袋袋袋袋重重重重量量量量如如如如下下下下表表表表所所所所示示示示。已已已已知知知知产产产产品品品品重重重重量量量量的的的的分分分分布布布布服服服服从从从从正正正正态态态态分分分分布布布布。以以以以95%95%的的的的置置置置信信信信水水水水平平平平建建建建立立立立该该该该

31、种种种种食品重量方差的置信区间食品重量方差的置信区间食品重量方差的置信区间食品重量方差的置信区间 25袋食品的重量 112.5101.0103.0102.0100.5102.6107.5 95.0108.8115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.3第41页/共96页第四十一页,共96页。第六章 统计(tngj)推断解解解解:已已已已知知知知n n2525,1-1-95%95%,根根根根据据据据样样样样本本本本(yngbn)(yngbn)数数数数据据据据计计计计算算算算得得得得

32、s2=93.21 s2=93.21 2 2置信度为置信度为置信度为置信度为95%95%的置信区间为的置信区间为的置信区间为的置信区间为 该企业生产的食品该企业生产的食品(shpn)(shpn)总体重量标准差的的置信区总体重量标准差的的置信区间为间为7.54g13.43g7.54g13.43g第42页/共96页第四十二页,共96页。第六章 统计(tngj)推断三、样本容量的确定三、样本容量的确定三、样本容量的确定三、样本容量的确定(qudng)(qudng)样本容量的影响因素估计的精度(jn d)要求 估计的置信度要求 抽样估计中所能承担的费用情况 第43页/共96页第四十三页,共96页。第六章

33、 统计(tngj)推断(一)估计总体均值时样本容量的确定(一)估计总体均值时样本容量的确定1 1、简单随机重复抽样、简单随机重复抽样(chu yn(chu yn)条件下样本容量的确定条件下样本容量的确定 式中:式中:样本容量的确定样本容量的确定(qudng)第44页/共96页第四十四页,共96页。第六章 统计(tngj)推断【例例例例】拥拥拥拥有有有有(yngyu)(yngyu)工工工工商商商商管管管管理理理理学学学学士士士士学学学学位位位位的的的的大大大大学学学学毕毕毕毕业业业业生生生生年年年年薪薪薪薪的的的的标标标标准准准准差差差差大大大大约约约约为为为为20002000元元元元,假假假假

34、定定定定想想想想要要要要估估估估计计计计年年年年薪薪薪薪95%95%的的的的置置置置信信信信区区区区间间间间,希希希希望望望望估估估估计计计计误误误误差差差差为为为为400400元元元元,在在在在重复抽样条件下,应抽取多大的样本量?重复抽样条件下,应抽取多大的样本量?重复抽样条件下,应抽取多大的样本量?重复抽样条件下,应抽取多大的样本量?第45页/共96页第四十五页,共96页。第六章 统计(tngj)推断2 2、简单随机不重复抽样条件下样本量的确、简单随机不重复抽样条件下样本量的确定定注意:若按上述公式求出的结果为小数,注意:若按上述公式求出的结果为小数,则小数点后的数一律往前进取则小数点后的

35、数一律往前进取(jnq)(jnq)整,整,因为样本容量取大不取小。因为样本容量取大不取小。(N 为总体为总体(zngt)容量)容量)第46页/共96页第四十六页,共96页。第六章 统计(tngj)推断n n【例】某地区写字楼月租金的标准差为100元,要估计写字楼平均月租金的95%的置信区间,希望的估计误差(wch)为20元。假设该地区一共有200家写字楼,问:在不重复抽样条件下,应该抽取多大的样本?第47页/共96页第四十七页,共96页。第六章 统计(tngj)推断【解】根据(公式6.15)得:即应该(ynggi)抽取65家写字楼作为样本。第48页/共96页第四十八页,共96页。第六章 统计(

36、tngj)推断(二)估计总体成数(比例)时的样本容量的确定(二)估计总体成数(比例)时的样本容量的确定(qudng)(qudng)1 1、简单随机重复抽样条件下样本量的确定、简单随机重复抽样条件下样本量的确定(qudng)(qudng)式中:式中:第49页/共96页第四十九页,共96页。第六章 统计(tngj)推断【例】根据以往的生产统计,某种产品的合格率约为90%,现要求估计误差为5%,在求95%的置信区间时,重复抽样条件下,应抽取多少(dusho)个产品作为样本?第50页/共96页第五十页,共96页。第六章 统计(tngj)推断2、简单随机(su j)不重复抽样条件下样本容量的确定注意:若

37、按上述公式求出的结果为小数,则小数点后的数一律往前进取整。(为总体为总体(zngt)容量)容量)第51页/共96页第五十一页,共96页。第六章 统计(tngj)推断n n在实际应用中,当样本成数(比例)已知时,按上面的相应公式计算样本容量即可;但如果(rgu)样本成数(比例)未知,则可以取使 最大时的值,即取 =。第52页/共96页第五十二页,共96页。第六章 统计(tngj)推断 【例】某大型【例】某大型(dxng)(dxng)企业提出一项改革措施,需要估计企业提出一项改革措施,需要估计职工中赞成该项改革的人数的比例,且相对误差不超职工中赞成该项改革的人数的比例,且相对误差不超过过3%3%,

38、置信水平为,置信水平为95%95%。问:在重复抽样条件下,应。问:在重复抽样条件下,应抽取多大的样本?抽取多大的样本?第53页/共96页第五十三页,共96页。第四章 统计(tngj)描述第三节第三节一、一、基本概念、原理及步骤基本概念、原理及步骤二、总体平均数的检验二、总体平均数的检验三、总体比例三、总体比例(bl)的检验的检验四、总体方差的检验四、总体方差的检验假设检验假设检验第54页/共96页第五十四页,共96页。第六章 统计(tngj)推断一、基本概念、原理一、基本概念、原理(yunl)与步骤与步骤1.基本概念2.原理(yunl)3.步骤第55页/共96页第五十五页,共96页。第四章 统

39、计(tngj)描述引例:某企业生产一种零件引例:某企业生产一种零件(ln jin),(ln jin),过去过去的大量资料表明的大量资料表明,零件零件(ln jin)(ln jin)的平均长度的平均长度为为4CM,4CM,标准差为标准差为0.1CM.0.1CM.改革工艺后改革工艺后,抽查了抽查了100100个零件个零件(ln jin),(ln jin),测得样本平均长度为测得样本平均长度为3.95CM3.95CM。工艺(gngy)改革前后零件的长度是否发生了显著的变化?第56页/共96页第五十六页,共96页。第六章 统计(tngj)推断1.基本概念基本概念n n假设(jish)是指对总体参数的的

40、数值所作的一种陈述n n总体参数包括总体均值、比例、方差等n n分析之前必需陈述我认为该企业生我认为该企业生我认为该企业生我认为该企业生产的零件的平均产的零件的平均产的零件的平均产的零件的平均(pngjn)(pngjn)(pngjn)(pngjn)长度为长度为长度为长度为4 4 4 4厘米厘米厘米厘米!第57页/共96页第五十七页,共96页。第六章 统计(tngj)推断 1.基本概念基本概念 假设检验是指事先对总体参数或分布(fnb)形式作出某种假设,然后利用样本信息来判断原假设是否成立 有参数假设检验和非参数假设检验第58页/共96页第五十八页,共96页。第六章 统计(tngj)推断总体总体

41、总体总体假设检验的过程假设检验的过程(guchng)(提出假设(提出假设抽取样本抽取样本作出决策)作出决策)抽取随机样本抽取随机样本抽取随机样本抽取随机样本均值均值均值均值 X X=20=20我认为人口的平我认为人口的平均年龄是均年龄是5050岁岁 提出假设提出假设提出假设提出假设 拒绝假设拒绝假设!别无选择别无选择.作出决策作出决策作出决策作出决策第59页/共96页第五十九页,共96页。第六章 统计(tngj)推断原假设原假设(jish)和备择假设和备择假设(jish)n n 什么是原假设?n n也叫待检验的假设,又称“0假设”n n研究者想收集证据予以反对的假设n n总是有等号,或n n表

42、示为 H0n nH0:某一数值(shz)或 某一数值(shz)或 某一数值(shz)n n例如,H0:4cm第60页/共96页第六十页,共96页。第六章 统计(tngj)推断什么是备择假设?什么是备择假设?与原假设对立的假设,也称与原假设对立的假设,也称“研究研究(ynji)(ynji)假假设设”研究研究(ynji)(ynji)者想收集证据予以支持的假设者想收集证据予以支持的假设总是有不等号总是有不等号:,或或 表示为表示为 H1 H1H1H1:某一数值某一数值,某一数值,或某一数值,或 某一某一数值数值例如例如,H1,H1:4,4,4cm|临界值,则拒绝临界值,则拒绝H0;H0;或者根据检或

43、者根据检验统计量可以计算出相应的概率验统计量可以计算出相应的概率P P,与显著性,与显著性水平水平(shu(shu png)png)/2/2大小进行比较,若大小进行比较,若 ,则拒绝则拒绝H0 H0。抽样分布抽样分布抽样分布HHH000值值值临界值临界值临界值临界值临界值临界值 /2/2 /2/2/2 样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域1-1-1-置信水平置信水平置信水平图图1第70页/共96页第七十页,共96页。第六章 统计(tngj)推断n n 单侧检验又分为左侧检验和右侧检验。单侧检验又分为左侧检验和右侧检验。n n 左侧检验是指拒绝域在左侧的检验。左侧检

44、验是指拒绝域在左侧的检验。如图如图2 2所示。原假设用符号所示。原假设用符号“”“”来表示。来表示。决策规则为:若检验统计量决策规则为:若检验统计量 临界值,临界值,则拒绝则拒绝H0 H0;或者;或者(huzh)(huzh)根据检验统计根据检验统计量可以计算出相应的概率量可以计算出相应的概率P P,与显著性,与显著性水平水平 大小进行比较,若大小进行比较,若 ,则拒绝,则拒绝H0 H0。抽样分布抽样分布抽样分布HHH000值值值临界值临界值临界值 样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域1-1-1-置信水平置信水平置信水平图图2第71页/共96页第七十一页,共96页。第六章 统计(tn

45、gj)推断qq例例如如,某某灯灯泡泡制制造造商商声声称称,该该企企业业所所生生产产的的灯灯泡泡的的平平均均使使用用寿寿命在命在10001000小时以上小时以上(y(y shng)shng)qq除除非非样样本本能能提提供供证证据据表表明明使使用用寿寿命命在在10001000小小时时以以下下,否否则则就就应应认为厂商的声称是正确的认为厂商的声称是正确的qq建立的原假设与备择假设应为建立的原假设与备择假设应为qq H0:H0:1000 H1:1000 H1:1000 临界值,拒绝临界值,拒绝H0 H0;或者根据检验统计量可以计算出相应的或者根据检验统计量可以计算出相应的概率概率P,P,与显著性水平与

46、显著性水平 大小进行大小进行(jnxng)(jnxng)比比较,若较,若 ,则拒绝,则拒绝H0 H0。抽样分布抽样分布抽样分布HHH000值值值临界值临界值临界值 样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域1-1-1-置信水平置信水平置信水平图图3第73页/共96页第七十三页,共96页。第六章 统计(tngj)推断n n 例如:某企业用一台包装机包装食品,标准重量为500g,假设食品重量服从(fcng)正态分布,且有长期经验知道其标准差为15 g,某日开工后从生产的包装食品中随机抽取9包,测得它们的平均重量为511 g,试检验包装机包装的食品重量是否显著高于规定水平?n n 解:建立的假

47、设为:第74页/共96页第七十四页,共96页。第六章 统计(tngj)推断二、二、总体总体(zngt)平均数的检验平均数的检验 是否已知是否已知小小小小小小样本样本容量容量n大大大大大大 是否已知是否已知否否否否否否 t 检验检验否否否否否否z 检验检验是是是是是是z 检验检验 是是是是是是z 检验检验第75页/共96页第七十五页,共96页。第六章 统计(tngj)推断1.大样本大样本(yngbn)()(2 已知或已知或 2未知未知)l l假定条件假定条件l l总体服从总体服从(fcng)(fcng)正态分布正态分布l l若不服从若不服从(fcng)(fcng)正态分布正态分布,可用正态分布来

48、可用正态分布来近似近似(n(n 30)30)l l使用使用Z-Z-统计量统计量l l 2 2 已知:已知:l l 2 2 未知:未知:第76页/共96页第七十六页,共96页。第六章 统计(tngj)推断 2 2 已知大样本均值的检验已知大样本均值的检验(ji(ji nyn)nyn)n n【例例】一一种种罐罐装装饮饮料料采采用用自自动动生生 产产 线线 生生 产产,每每 罐罐 的的 容容 量量(rngling)(rngling)是是255ml255ml,标标准准差差为为5ml5ml。为为 检检 验验 每每 罐罐 容容 量量(rngling)(rngling)是是否否符符合合要要求求,质质检检人人

49、员员在在某某天天生生产产的的饮饮料料中中随随机机抽抽取取了了4040罐罐进进行行检检验验,测测得得每每罐罐 平平 均均 容容 量量(rngling)(rngling)为为255.8ml255.8ml。取取显显著著性性水水平平=0.05=0.05,检检验验该该天天生生产产的的饮饮料料容容量量(rngling)(rngling)是否符合标准要求?是否符合标准要求?双侧检验双侧检验绿色绿色绿色绿色健康饮品健康饮品绿色绿色绿色绿色健康饮品健康饮品255255255255255255第77页/共96页第七十七页,共96页。第六章 统计(tngj)推断总体均值总体均值(jn zh)的检验的检验(2 已知已

50、知)(例题分析例题分析)n n H H0 0 :=255=255n n H H1 1 :255n n =0.05=0.05n nn n=40=40n n临界值临界值(c c):):n n 检验检验检验检验(jinyn)(jinyn)统计量统计量统计量统计量:z z0 01.961.96-1.96-1.960.0250.025拒绝拒绝 H H0 0拒绝拒绝 H H0 00.0250.025决策决策决策决策:结论结论结论结论:不拒绝不拒绝H H0 0样样本本提提供供的的证证据据还还不不足足以以推推翻翻“该该天天生生产产的的饮饮料料符符合合标标准准要要求求”的看法的看法第78页/共96页第七十八页,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 管理文献 > 管理工具

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com