统计量及其抽样分布.pptx

上传人:修**** 文档编号:12429731 上传时间:2022-04-24 格式:PPTX 页数:60 大小:1.27MB
返回 下载 相关 举报
统计量及其抽样分布.pptx_第1页
第1页 / 共60页
统计量及其抽样分布.pptx_第2页
第2页 / 共60页
点击查看更多>>
资源描述

《统计量及其抽样分布.pptx》由会员分享,可在线阅读,更多相关《统计量及其抽样分布.pptx(60页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、第 6 章 统计量及其抽样分布作者:中国人民大学统计学院作者:中国人民大学统计学院贾俊平贾俊平统计学第 6 章 统计量及其抽样分布6.1 统计量统计量6.2 关于分布的几个概念关于分布的几个概念 6.3 由正态分布导出的几个重要分布由正态分布导出的几个重要分布 6.4 样本均值的分布与中心极限定理样本均值的分布与中心极限定理6.5 样本比例的抽样分布样本比例的抽样分布6.6 两个样本平均值之差的分布两个样本平均值之差的分布6.7 关于样本方差的分布关于样本方差的分布 作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)1.了解统计量及其分布的几个概念了解统计量及其

2、分布的几个概念2.了解由正态分布导出的几个重要分布了解由正态分布导出的几个重要分布 3.理解样本均值的分布与中心极限定理理解样本均值的分布与中心极限定理4.掌握单样本比例和样本方差的抽样分布掌握单样本比例和样本方差的抽样分布学习目标6.1 统计量6.1.1 统计量的概念统计量的概念6.1.2 常用统计量常用统计量6.1.3 次序统计量次序统计量 6.1.4 充分统计量充分统计量 作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)1.设X1,X2,Xn是从总体X中抽取的容量为n的一个样本,如果由此样本构造一个函数T(X1,X2,Xn),不依赖于任何未知参数,则称函

3、数T(X1,X2,Xn)是一个统计量样本均值、样本比例、样本方差等都是统计量2.统计量是样本的一个函数3.统计量是统计推断的基础统计量(statistic)作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)1.一组样本观测值X1,X2,Xn由小到大的排序 X(1)X(2) X(i) X(n) 后,称X(1),X(2),X(n)为次序统计量 2.中位数、分位数、四分位数等都是次序统计量次序统计量6.2 关于分布的几个概念6.2.1 抽样分布抽样分布6.2.2 渐进分布渐进分布6.2.3 随机模拟获得的近似分布随机模拟获得的近似分布 作者:贾俊平,中国人民大学统计学

4、院统计学统计学STATISTICS(第五版第五版)1.样本统计量的概率分布,是一种理论分布在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布 2.随机变量是 样本统计量样本统计量样本均值, 样本比例,样本方差等3.结果来自容量相同容量相同的所有所有可能样本4.提供了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据 抽样分布 (sampling distribution)6.3 由正态分布导出的几个重要分布 6.3.1 2分布分布6.3.2 t 分布分布6.3.3 F 分布分布2 分布作者:贾俊平,中国人民大学统计学院统计学统计学STATISTI

5、CS(第五版第五版)2 分布的使用 如果一个变量的诸数值可视为几个独立变量值的平方和,则该变量服从如果一个变量的诸数值可视为几个独立变量值的平方和,则该变量服从2 分布分布 方差就可视为若干随机变量值的平方和方差就可视为若干随机变量值的平方和 样本中各随机数值与均值之离差的平方和样本中各随机数值与均值之离差的平方和(即样本方差的即样本方差的n-1倍倍)与总体方与总体方差之比,服从自由度为差之比,服从自由度为n-1的的2 分布分布作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)1.由阿贝(Abbe) 于1863年首先给出,后来由海尔墨特(Hermert)和卡皮尔

6、逊(KPearson) 分别于1875年和1900年推导出来2.设 ,则3.令 ,则 Y 服从自由度为1的2分布,即4. 5.当总体 ,从中抽取容量为n的样本,则2分布(2 distribution),(2NX) 1 , 0 ( NXz2zY ) 1 (2Y),(2NX) 1()(2212nxxnii作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)1.分布的变量值始终为正 2.分布的形状取决于其自由度n的大小,通常为不对称的正偏分布,但随着自由度的增大逐渐趋于对称 3.期望为:E(2)=n,方差为:D(2)=2n(n为自由度) 4.可加性:若U和V为两个独立的

7、2分布随机变量,U2(n1),V2(n2),则U+V这一随机变量服从自由度为n1+n2的2分布 2分布(性质和特点)作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)2分布(图示)t 分布作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)t 分布作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)t 分布图示作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)T分布的图形作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)T分布的使用F 分布

8、作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)F分布 两个都服从两个都服从2 分布的变量之比的分布规律。分布的变量之比的分布规律。 可以设想为两个方差之比可以设想为两个方差之比 方差之比会接近方差之比会接近1(因为前面已经假设各变量都服从标准因为前面已经假设各变量都服从标准正态分布正态分布),似乎存在一个,似乎存在一个“两端少,中间多两端少,中间多”的特征,的特征,但不对称(除非其中存在一个无限总体,使样本数量但不对称(除非其中存在一个无限总体,使样本数量为无穷大,则样本方差有无穷多个)为无穷大,则样本方差有无穷多个)作者:贾俊平,中国人民大学统计学院统计学

9、统计学STATISTICS(第五版第五版)1.由统计学家费希尔(R.A.Fisher) 提出的,以其姓氏的第一个字母来命名2.设若U为服从自由度为n1的2分布,即U2(n1),V为服从自由度为n2的2分布,即V2(n2),且U和V相互独立,则称F为服从自由度n1和n2的F分布,记为F分布(F distribution)21nVnUF ),(21nnFF作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)F分布 两个都服从两个都服从2 分布的变量之比的分布规律。分布的变量之比的分布规律。 可以设想为两个方差之比可以设想为两个方差之比 方差之比会接近方差之比会接近1(

10、因为前面已经假设各变量都服从标准因为前面已经假设各变量都服从标准正态分布正态分布),似乎存在一个,似乎存在一个“两端少,中间多两端少,中间多”的特征,的特征,但不对称(除非其中存在一个无限总体,使样本数量但不对称(除非其中存在一个无限总体,使样本数量为无穷大,则样本方差有无穷多个)为无穷大,则样本方差有无穷多个)作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)F分布(图示)作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)F分布的图形此处的n和m分别相当于n1、n2作者:贾俊平,中国人民大学统计学院统计学统计学STATISTIC

11、S(第五版第五版)F分布的使用 应用很广泛,可用来检验两状态总体方差是否相等,应用很广泛,可用来检验两状态总体方差是否相等,检验回归方差是否有代表性,在方差分析和多元统检验回归方差是否有代表性,在方差分析和多元统计中都是重要的检验手段。计中都是重要的检验手段。作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)三种抽样分布的对比 2 分布可视为关于方差的分布规律。分布可视为关于方差的分布规律。 t 分布中的两个变量,一个服从正态分布,另一个服从分布中的两个变量,一个服从正态分布,另一个服从2 分布。可视为均值与方差之比的分布规律。分布。可视为均值与方差之比的分布规

12、律。 F分布的变量都服从分布的变量都服从2 分布,可以设想为两个方差之比的分布,可以设想为两个方差之比的分布规律。分布规律。 这些“分布”都说明变量的规律,某些具有相同特征的,某些具有相同特征的变量具有什么样的共同规律。现实中,按图索骥,依样画变量具有什么样的共同规律。现实中,按图索骥,依样画葫芦。葫芦。作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)三种抽样分布综述为什么要使用统计方法?因为要了解事物的数量特征几乎惟一的方法是抽样,随机抽样抽样可以有很多结果,众结果的随机性规律是正态分布为什么要导出三大抽样分布?因为要了解的数量特征的性质不同,比如,可能要了

13、解样本方差的规律若干个变量都服从正态分布,每变量有不同取值,计算每组取值中各值的平方,再加起来,该总和服从2 分布每次抽样的误差与平均误差之比服从t分布两个样本的方差之比服从F分布什么是分布?骰子点数服从均匀分布,身高服从正态分布。分布就是各种情况发生概率的全体组合。6.4 样本均值的分布与中心极限定理 作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)抽样分布 抽样分布 从总体种抽出容量相同的样本,计算统计量的值,然后按统计量的值所编制的频数分布。 抽样分布的作用: 根据抽样分布研究统计量的性质 对统计推断方法进行评价抽样分布:样本统计量所有可能值的概率分布。

14、样本统计量总体未知参数样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量分布的形状及接近总体参数的程度STAT作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版) 知道这些“分布”有什么用?从现象上看,事物非常复杂,但其中某些内容具有某种意义上从现象上看,事物非常复杂,但其中某些内容具有某种意义上的相同性质(比如的相同性质(比如7 7条鱼与条鱼与7 7天之间都有天之间都有7 7这个数量)这个数量)从逻辑上看,可以在某些限定条件下构造许多模型,即数量关从逻辑上看,可以在某些限定条件下构造许多模型,

15、即数量关系(此处都用系(此处都用“等于等于”关系),这些关系的总和都符合逻辑,现关系),这些关系的总和都符合逻辑,现实中事物如果符合那些限定条件,则其本角度的其他特征(可实中事物如果符合那些限定条件,则其本角度的其他特征(可视为进一步的发展结果)都会服从逻辑模型所表述的变化规律视为进一步的发展结果)都会服从逻辑模型所表述的变化规律统计分布类型就是:在某些限定条件下,考察不同类型的个别统计分布类型就是:在某些限定条件下,考察不同类型的个别数量现象在总体上具有什么样的分布特征,熟知的如正态分布。数量现象在总体上具有什么样的分布特征,熟知的如正态分布。这些模型的结果告诉我们各种情况出现的可能性。这些

16、模型的结果告诉我们各种情况出现的可能性。抽样分布分布的特征值:均值和标准差样本主要统计量:平均数比率(成数)方差xp2SSTAT统计学第四章 抽样估计作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)1.在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布2.一种理论概率分布3.推断总体均值的理论基础样本均值的抽样分布作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)样本均值的抽样分布与中心极限定理x5x50 x5 . 2x作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)中心极限

17、定理(central limit theorem)nxx学生成绩 30 40 50 60 70 80 90按随机原则抽选出名学生,并计算平均分数。平均数的抽样分布二者均值相等样本均值的平均数总体的平均数平均数的抽样分布全部可能样本平均数的均值等于总体均值,即: 从非正态总体中抽取的样本平均数当n足够大时其分布接近正态分布。 从正态总体中抽取的样本平均数不论容量大小其分布均为正态分布。样本均值的标准差为总体标准差的 。n1)()(xxESTAT),(nNx作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版) An example A die is thrown in

18、finitely many times. Let X represent the number of spots showing on any throw.一个骰子被投掷了无数次,用X表示每一次出现的点数. The probability distribution of X isx 1 2 3 4 5 6p(x) 1/6 1/6 1/6 1/6 1/6 1/6E(X) = 1(1/6) +2(1/6) + 3(1/6)+= 3.5V(X) = (1-3.5)2 +(2-3.5)2 + . = 2.92 作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版) Supp

19、ose we want to estimate from the mean of a sample of size n = 2. What is the distribution that can follow样本平均的分布是什么样?xxSampleMean SampleMeanSampleMean11,11133,12255,1321,21.5143,22.5265,23.531,32153,33275,3441,42.5163,43.5285,44.551,53173,54295,5561,63.5183,64.5305,65.572,11.5194,12.5316,13.582,2220

20、4,23326,2492,32.5214,33.5336,34.5102,43224,44346,45112,53.5234,54.5356,55.5122,64244,65366,66SampleMean SampleMeanSampleMean11,11133,12255,1321,21.5143,22.5265,23.531,32153,33275,3441,42.5163,43.5285,44.551,53173,54295,5561,63.5183,64.5305,65.572,11.5194,12.5316,13.582,22204,23326,2492,32.5214,33.53

21、36,34.5102,43224,44346,45112,53.5234,54.5356,55.5122,64244,65366,661 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.06/365/364/363/362/361/36xE( ) =1.0(1/36)+1.5(2/36)+.=3.5V(X) = (1.0-3.5)2(1/36)+(1.5-3.5)2(2/36). = 1.46x2and:Note2x2xxx111666)5(5833.5 . 35n2x2xx)10(2917.5 . 310n2x2xx)25(1167.5 . 325n2x2xxNo

22、tice that is smaller than x. The larger the samplesize the smaller . Therefore, tends to fall closer to , as the sample size increases.2x2xx作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版) Simulation of dice tossing11.522.533.544.555.56More11.522.533.544.555.56More11.522.533.544.555.56Moren = 2n = 5n = 10M

23、ean = 3.494Stand. Dev. = 0.544Mean = 3.486Stand. Dev. = 1.215Mean = 3.495Stand. Dev. = 0.749作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)The variance of the sample mean is smaller than the variance of the population.样本平均数方差小于总体方差Also,Expected value of the population = (1 + 2 + 3)/3 = 2Mean = 1.5Mean = 2

24、.5Mean = 2.Population1.51.51.51.51.51.51.51.51.51.51.51.51.52.52.52.52.52.52.52.52.52.52.52.52.52.522222222222Expected value of the sample mean = (1.5 + 2 + 2.5)/3 = 2Compare the variability of the populationto the variability of the sample mean.Let us take samplesof two observations作者:贾俊平,中国人民大学统计学

25、院统计学统计学STATISTICS(第五版第五版)The Sampling Distribution of the Sample Mean样本平均数分布size. sample largely sufficient for ddistributenormally ely approximat is x nonnormal is xIf normal. is x normal, isxIf. 3n. 2. 12x2xxx作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)4.2.1抽样推断的理论基础 大数定律 大数定律是阐明大量随机现象平均结果的稳定性的一系列定理的

26、总称。其一般意义是:在随机试验过程中,每次试验的结果不同,但大量重复试验后,所出现结果的平均值总是接近某一确定的值。 中心极限定理 第一,如果总体很大,而且服从正态分布,样本平均数(或成数)的分布也同样服从正态分布。第二,如果总体很大,但不服从正态分布,只要样本容量足够大(n30),样本平均数(或成数)的分布趋近于正态分布。第三,样本平均数(或成数)的平均数,等于总体平均数(或成数)。 作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)STAT统计学第四章 抽样估计学生成绩 30 40 50 60 70 80 90离差 -30 -20 -10 0 10 20 3

27、007. 7100214201747122nNnNx2007.7x作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)中心极限定理 (central limit theorem)6.5 样本比例的抽样分布 作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)1.总体(或样本)中具有某种属性的单位与全部单位总数之比不同性别的人与全部人数之比合格品(或不合格品) 与全部产品总数之比2.总体比例可表示为3.样本比例可表示为4.比例(proportion)NNNN101或nnpnnp101或作者:贾俊平,中国人民大学统计学院统计学统计学STA

28、TISTICS(第五版第五版)1.在重复选取容量为n的样本时,由样本比例的所有可能取值形成的相对频数分布2.一种理论概率分布3.当样本容量很大时,样本比例的抽样分布可用正态分布近似 4.推断总体比例的理论基础样本比例的抽样分布作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)1.样本比例的数学期望2.样本比例的方差重复抽样不重复抽样样本比例的抽样分布(数学期望与方差)(pEnp)1 (21)1 (2NnNnp6.6 两个样本均值之差的抽样分布 比率的抽样分布教师是否博士 是 是 否 否 否 是 具有博士学位的比率:0.5比率的标准差:0.5从总体中按不重复抽样方

29、法随机抽取人,计算其比率和标准pSTAT统计学第四章 抽样估计STAT统计学第四章 抽样估计比率的抽样分布Pnpp5 . 0p1581. 05245 . 05 . 01)1 (NnNnPPp全部可能样本比率的均值等于总体比率,即: 当n足够大时样本比率分布接近正态分布。 样本比率的标准差为总体标准差的 n1)()(PpPpE比率的抽样分布5)1 (5)1 (,(pnnpnPPPNpSTAT统计学第四章 抽样估计作者:贾俊平,中国人民大学统计学院统计学统计学STATISTICS(第五版第五版)1.统计量及其分布统计量及其分布2.由正态分布导出的几个重要分布由正态分布导出的几个重要分布3.样本均值的分布与中心极限定理样本均值的分布与中心极限定理4.样本比例的抽样分布样本比例的抽样分布5.两个样本平均值之差的分布两个样本平均值之差的分布6.关于样本方差的分布关于样本方差的分布本章小结结结 束束

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 管理文献 > 其他资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com