章抽样分布与参数估计.ppt

上传人:赵** 文档编号:68608978 上传时间:2022-12-29 格式:PPT 页数:82 大小:1.27MB
返回 下载 相关 举报
章抽样分布与参数估计.ppt_第1页
第1页 / 共82页
章抽样分布与参数估计.ppt_第2页
第2页 / 共82页
点击查看更多>>
资源描述

《章抽样分布与参数估计.ppt》由会员分享,可在线阅读,更多相关《章抽样分布与参数估计.ppt(82页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、统计学导论统计学导论曾五一曾五一 肖红叶肖红叶 主编主编第四章第四章 抽样分布与参数估计抽样分布与参数估计 n第一节第一节 抽样的基本概念与数学原理抽样的基本概念与数学原理 n第二节第二节 抽样分布抽样分布 n第三节第三节 参数估计参数估计n第四节第四节 样本容量的确定样本容量的确定 n第五节第五节 EXCEL在参数估计中的应用在参数估计中的应用2第一节第一节 抽样的基本概念与数学原理抽样的基本概念与数学原理n一、有关抽样的基本概念一、有关抽样的基本概念n二、大数定理与中心极限定理二、大数定理与中心极限定理3一、有关抽样的基本概念一、有关抽样的基本概念(一)样本容量与样本个数(一)样本容量与样

2、本个数 1.样本容量样本容量。样本是从总体中抽出的部分单位。样本是从总体中抽出的部分单位的集合,这个集合的大小称为样本容量,一的集合,这个集合的大小称为样本容量,一般用般用n表示,它表明一个样本中所包含的单位表示,它表明一个样本中所包含的单位数。数。一般地,样本单位数大于一般地,样本单位数大于30个的样本称为个的样本称为大样大样本本,不超过,不超过30个的样本称为个的样本称为小样本小样本。2.样本个数样本个数。样本个数又称样本可能数目,它。样本个数又称样本可能数目,它是指从一个总体中可能抽取多少个样本。是指从一个总体中可能抽取多少个样本。4(二)总体参数与样本统计量(二)总体参数与样本统计量

3、1.总体参数总体参数。总体分布的数量特征就是总体的。总体分布的数量特征就是总体的参数,也是抽样统计推断的对象。参数,也是抽样统计推断的对象。常见的总体参数有:总体的常见的总体参数有:总体的平均数指标平均数指标,总体,总体成数成数(比例比例)指标指标,总体分布的,总体分布的方差方差、标准差标准差等等。它们都是反映总体分布特征的重要指等等。它们都是反映总体分布特征的重要指标。标。(二)总体参数与样本统计量(二)总体参数与样本统计量5 2.样本统计量样本统计量。样本统计量是样本的一个函数。样本统计量是样本的一个函数。它们是随机变量。我们利用统计量来估计和它们是随机变量。我们利用统计量来估计和推断总体

4、的有关参数。推断总体的有关参数。常见的样本统计量有:常见的样本统计量有:样本平均数,样本比例,样本平均数,样本比例,样本的方差、标准差样本的方差、标准差。(二)总体参数与样本统计量(二)总体参数与样本统计量6n所谓所谓概率抽样概率抽样,就是要求对总体的每一次观,就是要求对总体的每一次观察(每一次抽取)都是一次随机试验,并且察(每一次抽取)都是一次随机试验,并且有和总体相同的分布。按这样的要求对总体有和总体相同的分布。按这样的要求对总体观测(抽取)观测(抽取)n次,可得到容量为次,可得到容量为n的样本。的样本。(三)概率抽样及其组织形式(三)概率抽样及其组织形式789n(四)放回抽样与不放回抽样

5、(四)放回抽样与不放回抽样102.不放回抽样不放回抽样11从总体中可以随机地抽取许多样本,由每一个从总体中可以随机地抽取许多样本,由每一个样本都可以计算样本统计量的观测值,所有样本都可以计算样本统计量的观测值,所有可能的样本观测值及其所对应的概率便是所可能的样本观测值及其所对应的概率便是所谓的抽样分布。因此,抽样分布也可以称为谓的抽样分布。因此,抽样分布也可以称为样本统计量的概率分布。样本统计量的概率分布。抽样分布可能是精确地服从某种已知分布(所抽样分布可能是精确地服从某种已知分布(所谓已知分布,例如我们在第四章介绍过的各谓已知分布,例如我们在第四章介绍过的各种常见分布),也可能是以某种已知分

6、布为种常见分布),也可能是以某种已知分布为极限分布。在实际应用中,后者更为多见。极限分布。在实际应用中,后者更为多见。(五)抽样分布(五)抽样分布121314第第 二二 次次 抽抽 取取 可可 能能 被被 抽抽 中中 的的 人人 员员12345678910第第 一一 次次 抽抽 取取 可可 能能 被被 抽抽 中中 的的 人人 员员 11,1(1)1,2(1.5)1,3(2)1,4(2.5)1,5(3)1,6(3.5)1,7(4)1,8(4.5)1,9(5)1,10(5.5)22,1(1.5)2,2(2)2,3(2.5)2,4(3)2,5(3.5)2,6(4)2,7(4.5)2,8(5)2,9(

7、5.5)2,10(6)33,1(2)3,2(2.5)3,3(3)3,4(3.5)3,5(4)3,6(4.5)3,7(5)3,8(5.5)3,9(6)3,10(6.5)44,1(2.5)4,2(3)4,3(3.5)4,4(4)4,5(4.5)4,6(5)4,7(5.5)4,8(6)4,9(6.5)4,10(7)55,1(3)5,2(3.5)5,3(4)5,4(4.5)5,5(5)5,6(5.5)5,7(6)5,8(6.5)5,9(7)5,10(7.5)66,1(3.5)6,2(4)6,3(4.5)6,4(5)6,5(5.5)6,6(6)6,7(6.5)6,8(7)6,9(7.5)6,10(8)7

8、7,1(4)7,2(4.5)7,3(5)7,4(5.5)7,5(6)7,6(6.5)7,7(7)7,8(7.5)7,9(8)7,10(8.5)88,1(4.5)8,2(5)8,3(5.5)8,4(6)8,5(6.5)8,6(7)8,7(7.5)8,8(8)8,9(8.5)8,10(9)99,1(5)9,2(5.5)9,3(6)9,4(6.5)9,5(7)9,6(7.5)9,7(8)9,8(8.5)9,9(9)9,10(9.5)1010,1(5.5)10,2(6)10,3(6.5)10,4(7)10,5(7.5)10,6(8)10,7(8.5)10,8(9)10,9(9.5)10,10(10)表

9、表5-310人中有放回抽二人的全部可能样本人中有放回抽二人的全部可能样本15n表表5-4任职年限样本均值分布数列任职年限样本均值分布数列1617二、大数定理与中心极限定理二、大数定理与中心极限定理18n 大数定理表明:尽管个别现象受偶然因大数定理表明:尽管个别现象受偶然因素影响,有各自不同的表现。但是,对总体素影响,有各自不同的表现。但是,对总体的大量观察后进行平均,就能使偶然因素的的大量观察后进行平均,就能使偶然因素的影响相互抵消,消除由个别偶然因素引起的影响相互抵消,消除由个别偶然因素引起的极端性影响,从而使总体平均数稳定下来,极端性影响,从而使总体平均数稳定下来,反映出事物变化的一般规律

10、。反映出事物变化的一般规律。1920 从正态分布的再生定理可以看出,只要从正态分布的再生定理可以看出,只要总体变量服从正态分布,则从中抽取的样本,总体变量服从正态分布,则从中抽取的样本,不管不管n是多少,是多少,样本平均数都服从正态分布。样本平均数都服从正态分布。但是在客观实际中,总体并非都是正态分布。但是在客观实际中,总体并非都是正态分布。对于从非正态分布的总体中抽取的样本平均对于从非正态分布的总体中抽取的样本平均数的分布问题,需要由中心极限定理来解决。数的分布问题,需要由中心极限定理来解决。21(三)中心极限定理(三)中心极限定理2223第二节第二节 抽样分布抽样分布n一、样本平均数的抽样

11、分布一、样本平均数的抽样分布n二、样本比例的抽样分布二、样本比例的抽样分布24一、样本平均数的抽样分布一、样本平均数的抽样分布(一)样本平均数的期望值与方差(一)样本平均数的期望值与方差25262728n(二)样本平均数的分布规律(二)样本平均数的分布规律293031二、样本比例的抽样分布二、样本比例的抽样分布 n(一一)样本比例的期望值与方差样本比例的期望值与方差32333435(二)样本比例的分布规律(二)样本比例的分布规律36表表5-5 用正态分布来近似时对样本量的要求用正态分布来近似时对样本量的要求总总 体体参参 数数0.500.450.40 0.35 0.30 0.25 0.20 0

12、.15 0.101 0.500.550.60 0.65 0.70 0.75 0.80 0.85 0.90样样本量本量至少至少为为n363738404348577110037n(三)样本方差的抽样分布(三)样本方差的抽样分布3839第三节第三节 参数估计参数估计 n一、参数估计概述一、参数估计概述n二、总体均值的估计二、总体均值的估计n三、总体比例的估计三、总体比例的估计n四、总体方差的估计四、总体方差的估计40一、参数估计概述一、参数估计概述(一)参数估计的定义与种类(一)参数估计的定义与种类所谓参数估计,就是用样本统计量去估计总体所谓参数估计,就是用样本统计量去估计总体的未知参数(或参数的函

13、数)。的未知参数(或参数的函数)。例如,估计总体均值,估计总体比例和总体方例如,估计总体均值,估计总体比例和总体方差。差。参数估计有两种基本形式:参数估计有两种基本形式:点估计点估计是用一个数值作为未知参数是用一个数值作为未知参数的估计。的估计。区间估区间估计是给出具体的上限和下限,把计是给出具体的上限和下限,把 包括在包括在这个区间内。这个区间内。41点估计,主要有矩估计法和最大似然估计法。点估计,主要有矩估计法和最大似然估计法。矩估计法矩估计法是用样本矩去估计总体矩(或是用样本矩的是用样本矩去估计总体矩(或是用样本矩的函数去估计总体矩的相应函数)的一种估计方法,函数去估计总体矩的相应函数)

14、的一种估计方法,由此获得的估计量称作矩估计量。由此获得的估计量称作矩估计量。最大似然估计法最大似然估计法是把待估计的总体参数看作一个可以是把待估计的总体参数看作一个可以取不同数值的变量,计算当总体参数取上述不同数取不同数值的变量,计算当总体参数取上述不同数值的时候,发生我们当前所得到的样本观测值的不值的时候,发生我们当前所得到的样本观测值的不同概率,总体参数取哪一个数值的时候这种概率最同概率,总体参数取哪一个数值的时候这种概率最大,便把这个数值作为对总体参数的估计结果。大,便把这个数值作为对总体参数的估计结果。(二)点估计(二)点估计42n(三)估计量的优良标准(三)估计量的优良标准2.有效性

15、。又称最小方差性。有效性。又称最小方差性。434.充分性。估计量包含了样本中关于充分性。估计量包含了样本中关于的全部信息。的全部信息。44n(四)区间估计与估计的精度和可靠性(四)区间估计与估计的精度和可靠性454647n二、总体均值的估计二、总体均值的估计48495051525354n(二)总体方差(二)总体方差2未知的情形未知的情形552.区间估计565758n【例例5-4】在例在例5-3中,若总体方差未知,但通过抽中,若总体方差未知,但通过抽取的取的6个样本测得的样本方差为个样本测得的样本方差为0.0025,试在,试在0.95的置信度下,求该产品直径的均值置信区间。的置信度下,求该产品直

16、径的均值置信区间。59n三、总体比例的估计三、总体比例的估计606162n三、总体方差的估计三、总体方差的估计63(二)区间估计6465第四节第四节 样本容量的确定样本容量的确定n一、问题的提出一、问题的提出n二、估计总体均值时样本容量的确定二、估计总体均值时样本容量的确定n三、估计总体比例时样本容量的确定三、估计总体比例时样本容量的确定n四、使用上述公式应注意的问题四、使用上述公式应注意的问题66 由由前前面面的的论论述述,我我们们已已知知参参数数估估计计中中的的精精度度要要求求与与可可靠靠性性要要求求常常常常是是一一对对矛矛盾盾,但但是是,通通过过增增加加样样本本容容量量n有有可可能能降降

17、低低样样本本平平均均数数的的标标准准差差,从从而而实实现现既既保保证证一一定定的的估估计计精精度度,又又具具有有较较高高的的置置信信度度的的目目的的。这这时时,需需要要考考虑虑在在给给定定的的置置信信度度与与极极限限误误差差的的前前提提下下,样样本本容容量量n究究竟竟取取多多大大合合适适?这这就就是是所所谓谓样样本容量的确定问题。本容量的确定问题。一、问题的提出一、问题的提出67二、估计总体均值时样本容量的确定二、估计总体均值时样本容量的确定686970三、估计总体比例时样本容量的确定三、估计总体比例时样本容量的确定71四、使用上述公式应注意的问题四、使用上述公式应注意的问题1计算样本容量时,

18、总体的方差与成数常常计算样本容量时,总体的方差与成数常常是未知的,这时可用有关资料替代:一是用是未知的,这时可用有关资料替代:一是用历史资料已有的方差与成数代替;二是在进历史资料已有的方差与成数代替;二是在进行正式抽样调查前进行几次试验性调查,用行正式抽样调查前进行几次试验性调查,用试验中方差的最大值代替总体方差;三是比试验中方差的最大值代替总体方差;三是比例方差在完全缺乏资料的情况下,就用比例例方差在完全缺乏资料的情况下,就用比例方差的最大可能值方差的最大可能值0.25代替。代替。72 2.如果进行一次抽样调查,需要同时估计总体如果进行一次抽样调查,需要同时估计总体均值与比例,可用上面的公式

19、同时计算出两均值与比例,可用上面的公式同时计算出两个样本容量,取其中较大的结果,同时满足个样本容量,取其中较大的结果,同时满足两方面的需要。两方面的需要。四、使用上述公式应注意的问题四、使用上述公式应注意的问题3.上面的公式计算结果如果带小数,这时样本容上面的公式计算结果如果带小数,这时样本容量不按四舍五入法则取整数,取比这个数大量不按四舍五入法则取整数,取比这个数大的最小整数代替。例如计算得到:的最小整数代替。例如计算得到:n=56.03,那么,样本容量取那么,样本容量取57,而不是,而不是56。7374757677第五节第五节 Excel在参数估计中的应用在参数估计中的应用n【例例5-9】

20、用用Excel完成本章思考与练习计算题完成本章思考与练习计算题的第的第1题。题。解:操作步骤如下。解:操作步骤如下。1构造工作表。如图构造工作表。如图5-3所示,所示,A、B列为原列为原始输入数据,始输入数据,A2:A16存放的是关于最大飞行存放的是关于最大飞行速度的数据,图中未完全显示出来。速度的数据,图中未完全显示出来。C、D列列为计算结果,分别在为计算结果,分别在C2、D2单元格存放置信单元格存放置信下限和上限。下限和上限。78 2定义变量名。将定义变量名。将A列命名为列命名为“x”,将,将B2单单元格命名为元格命名为“置信水平置信水平”。3计算置信上、下限。计算置信上、下限。分别在分别

21、在C2、D2中输入如下的公式:中输入如下的公式:=AVERAGE(x)-TINV(1-置信水平置信水平,COUNT(x)-1)*STDEV(x)/SQRT(COUNT(x)=AVERAGE(x)+TINV(1-置信水平置信水平,COUNT(x)-1)*STDEV(x)/SQRT(COUNT(x)用用Excel完成本章思考与练习计算题的第完成本章思考与练习计算题的第1题题79本章小结本章小结80815.5.所谓估计就是构造适当的样本统计量,来充所谓估计就是构造适当的样本统计量,来充当总体参数的估计量。好的统计量的理想性当总体参数的估计量。好的统计量的理想性质包括:无偏性、有效性、一致性和充分性。质包括:无偏性、有效性、一致性和充分性。6.6.估计包括点估计与区间估计。估计包括点估计与区间估计。7.7.在给定的置信度与极限误差的前提下,样本在给定的置信度与极限误差的前提下,样本容量容量n n可利用极限误差、临界值与抽样标准差可利用极限误差、临界值与抽样标准差三者间的数量关系去计算。三者间的数量关系去计算。8.8.在在ExcelExcel中可使用各种函数按照有关公式实现中可使用各种函数按照有关公式实现区间估计的运算。区间估计的运算。82

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 高考资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com