理论分布和抽样分布 (2).ppt

上传人:赵** 文档编号:82666839 上传时间:2023-03-26 格式:PPT 页数:79 大小:555.01KB
返回 下载 相关 举报
理论分布和抽样分布 (2).ppt_第1页
第1页 / 共79页
理论分布和抽样分布 (2).ppt_第2页
第2页 / 共79页
点击查看更多>>
资源描述

《理论分布和抽样分布 (2).ppt》由会员分享,可在线阅读,更多相关《理论分布和抽样分布 (2).ppt(79页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、第二章第二章 理论分布和抽样分布理论分布和抽样分布 第一节第一节 概率和计算概率的准则概率和计算概率的准则1、概率的定义、概率的定义 对于随机现象,虽然不能事先控制某种结果的对于随机现象,虽然不能事先控制某种结果的出现,但我们总是会尽量预测某个结果发生的可能出现,但我们总是会尽量预测某个结果发生的可能性。为此,我们使用一个数值来度量随机现象中某性。为此,我们使用一个数值来度量随机现象中某一结果出现的可能性大小,这个数值就称为概率一结果出现的可能性大小,这个数值就称为概率(probability)。)。概率的取值总是从概率的取值总是从0到到1之间。概率值等于之间。概率值等于0表表明该现象不可能发

2、生;概率值等于明该现象不可能发生;概率值等于1表明该现象必表明该现象必然发生;介于然发生;介于0到到1之间的概率则说明该现象出现可之间的概率则说明该现象出现可能性的不同程度。能性的不同程度。概率大表示事件发生的可能性大,概率小表概率大表示事件发生的可能性大,概率小表示事件发生的可能性小。若某事件发生的概率小示事件发生的可能性小。若某事件发生的概率小于于0.05或或0.01,则认为该事件在试验中不太可能发,则认为该事件在试验中不太可能发生,称为小概率事件实际不可能性原理,简称小生,称为小概率事件实际不可能性原理,简称小概率原理。概率原理。0.05或或0.01称为小概率标准。称为小概率标准。随机现

3、象的每一个结果都是一个随机事件。随机现象的每一个结果都是一个随机事件。事事件的产生可以通过试验获得。所谓试验是指产生明件的产生可以通过试验获得。所谓试验是指产生明确结果的过程,这个结果可以是定量的,也可以是确结果的过程,这个结果可以是定量的,也可以是定性的,但每一次试验只能有且只有一个结果发生。定性的,但每一次试验只能有且只有一个结果发生。当一个试验所有结果都确定时,这些试验结果的集当一个试验所有结果都确定时,这些试验结果的集合,称为样本空间,其中的每一个结果称为一个样合,称为样本空间,其中的每一个结果称为一个样本点或一个事件。本点或一个事件。序号序号试验试验试验结果试验结果1记录某一时段车流

4、量记录某一时段车流量0,1,2,2打电话找某人打电话找某人在,不在在,不在3调查学生对食堂质量的评价调查学生对食堂质量的评价满意,不满意,无所谓满意,不满意,无所谓4掷一枚掷一枚1,2,3,4,5,65观察证券指数的走势观察证券指数的走势上涨,下跌,平盘上涨,下跌,平盘表表2.1 对于每一种试验,各种事件的概率计算是不同对于每一种试验,各种事件的概率计算是不同的,需要用不同的方法来表示概率,但无论采用何的,需要用不同的方法来表示概率,但无论采用何种方法,都要满足以下条件:种方法,都要满足以下条件:在实践中,确定概率的方法主要有三种:在实践中,确定概率的方法主要有三种:(一)古典法(一)古典法按

5、照古典法定义,事件按照古典法定义,事件A A出现的概率为:出现的概率为:古典概率又叫做先验概率(事前概率),是事件古典概率又叫做先验概率(事前概率),是事件发生前可计算出的概率。古典概率模型要求满足两个发生前可计算出的概率。古典概率模型要求满足两个条件:其一,试验的所有结果是有限的;其二,每一条件:其一,试验的所有结果是有限的;其二,每一种可能结果出现的可能性(概率)相等。种可能结果出现的可能性(概率)相等。解:(解:(1 1)相对频数法是用过去发生的事件的相对频率当相对频数法是用过去发生的事件的相对频率当作概率。这样概率也可以叫预计概率。例如,想预作概率。这样概率也可以叫预计概率。例如,想预

6、测明年某一天是测明年某一天是“晴天晴天”的可能性概率的研究中,的可能性概率的研究中,对于是对于是“晴天晴天”还是还是“非晴天非晴天”在现在的预报技术在现在的预报技术条件下,是不可能预报的。因此,只能根据历史上条件下,是不可能预报的。因此,只能根据历史上这一天发生这一天发生“晴天晴天”的频数来作为发生的频数来作为发生“晴天晴天”的的概率。如过去概率。如过去40年中这一天是晴天的次数为年中这一天是晴天的次数为20天,天,则明年这一天是则明年这一天是“晴天晴天”的可能性的概率是的可能性的概率是0.5。因此使用相对频数法确定概率时,通过增加试验因此使用相对频数法确定概率时,通过增加试验的次数,就能够提

7、高概率的精确性。的次数,就能够提高概率的精确性。(二)相对频数法(二)相对频数法(三)主观概率法(三)主观概率法 主观概率法是根据个人的主观知觉和经验确定主观概率法是根据个人的主观知觉和经验确定的概率,有时也称为个人概率。的概率,有时也称为个人概率。例如,例如,“对于某两个企业合并后第二年利润将上对于某两个企业合并后第二年利润将上升升”的概率的确定,既不符合古典概率法也没有相的概率的确定,既不符合古典概率法也没有相对频数可用,更不可能进行多次试验,在这种情况对频数可用,更不可能进行多次试验,在这种情况下,就要依靠个人的直觉、知识、经验等因素对此下,就要依靠个人的直觉、知识、经验等因素对此做出判

8、断,给出一个概率值。做出判断,给出一个概率值。(一)事件间的关系一)事件间的关系 在实际问题中,不只研究一个随机事件,而是在实际问题中,不只研究一个随机事件,而是研究多个随机事件,这些事件之间有一定的联系。研究多个随机事件,这些事件之间有一定的联系。二、计算概率的准则二、计算概率的准则 例如,一次有关家庭有电脑数量的调查。在例如,一次有关家庭有电脑数量的调查。在1000个家庭中,有台式电脑的家庭数是个家庭中,有台式电脑的家庭数是400户,有手提电户,有手提电脑的家庭数量脑的家庭数量42户,其中户,其中22户家庭既有台式电脑又户家庭既有台式电脑又有手提电脑。根据这些数据计算一个家庭拥有电脑有手提

9、电脑。根据这些数据计算一个家庭拥有电脑的概率。的概率。1.1.加法法则加法法则3 3、乘法法则、乘法法则第二节第二节 随机变量及其概率分布随机变量及其概率分布 当当试验只有几个确定的结果,并可一一列出,变试验只有几个确定的结果,并可一一列出,变量量x的取值可用实数表示,且取某一值时,其概率是的取值可用实数表示,且取某一值时,其概率是确定的,这种类型的变量称为离散型随机变量。确定的,这种类型的变量称为离散型随机变量。将将这种变量的所有可能取值及其对应概率一一列这种变量的所有可能取值及其对应概率一一列出所形成的分布称为离散型随机变量的概率分布。出所形成的分布称为离散型随机变量的概率分布。变量的取值

10、仅为一范围,且在该范围取值时,其变量的取值仅为一范围,且在该范围取值时,其概率是确定的。此时取一固定值是无意义的,因为在概率是确定的。此时取一固定值是无意义的,因为在连续尺度上一点的概率几乎为连续尺度上一点的概率几乎为0 0。这种类型的变量称。这种类型的变量称为连续型随机变量为连续型随机变量 。二、概率分布概率分布(一)离散型变量的概率分布(一)离散型变量的概率分布1 1二项式分布二项式分布 二项总体及二项分布二项总体及二项分布间断性随机变量,其总体中包含两项,即:非此即间断性随机变量,其总体中包含两项,即:非此即彼的两项,它们构成的总体称为二项总体。彼的两项,它们构成的总体称为二项总体。二项

11、式分布的概率计算二项式分布的概率计算 二项式分布的的形状和参数二项式分布的的形状和参数2.2.多项式分布多项式分布 例例2.72.7,某药对病人有效的概率为,某药对病人有效的概率为1/21/2,对病人无,对病人无效的概率为效的概率为1/31/3,有副作用的概率为,有副作用的概率为1/61/6。若随机抽。若随机抽取取2 2个使用该药的病人,那么结果可能包括这样几种个使用该药的病人,那么结果可能包括这样几种事件:事件:2 2个病人有副作用;一个无效,一个有副作用;个病人有副作用;一个无效,一个有副作用;两个无效;一个有效,一个有副作用;一个有效、两个无效;一个有效,一个有副作用;一个有效、一个无效

12、;两个均有效。这几种事件的概率分别为一个无效;两个均有效。这几种事件的概率分别为多少?多少?3.3.泊松分布泊松分布此值很小,而此值很小,而n=15399n=15399,则较大,把暴雨看成稀有,则较大,把暴雨看成稀有事件,暴雨分布近似为泊松分布。事件,暴雨分布近似为泊松分布。(二)连续型变量的概率分布(二)连续型变量的概率分布正态分布正态分布1.1.正态分布及标准正态分布正态分布及标准正态分布 正态概率分布是连续型变量概率分布中最重要正态概率分布是连续型变量概率分布中最重要的分布,它在实践中有着广泛的应用。在自然界和的分布,它在实践中有着广泛的应用。在自然界和人类社会,有许多现象的分布都服从正

13、态分布,如人类社会,有许多现象的分布都服从正态分布,如人的身高、体重、降水量、学习成绩、污染物浓度人的身高、体重、降水量、学习成绩、污染物浓度分布等。在统计推断中,当样本的数量足够大时,分布等。在统计推断中,当样本的数量足够大时,许多统计数据都服从正态分布。另外,正态分布还许多统计数据都服从正态分布。另外,正态分布还是其他连续型概率分布的极限分布,可用正态分布是其他连续型概率分布的极限分布,可用正态分布近似计算或导出其他连续型概率分布。近似计算或导出其他连续型概率分布。代入代入2.2.正态分布曲线特征正态分布曲线特征第三节第三节 抽样分布抽样分布一、概率抽样方法一、概率抽样方法(一)简单随机抽

14、样(一)简单随机抽样 简单随机抽样(简单随机抽样(simple random sampling)就)就是按照随机原则从总体中随机抽取个体组成一个样是按照随机原则从总体中随机抽取个体组成一个样本,每一个个体被抽中的机会是相等的。具体做法本,每一个个体被抽中的机会是相等的。具体做法如下:如下:(1 1)对总体的个体单位进行编号,使个体单位)对总体的个体单位进行编号,使个体单位都有唯一的编号。如果个体是有序排列,则可以按都有唯一的编号。如果个体是有序排列,则可以按自然顺序编号。自然顺序编号。(2 2)按随机原则抽取号码。当个体单位数量较)按随机原则抽取号码。当个体单位数量较少时,可以用抽签或摸球的方

15、法进行,要使每支签少时,可以用抽签或摸球的方法进行,要使每支签或每个球出现的可能性相同。当个体单位数量较多或每个球出现的可能性相同。当个体单位数量较多时,一般使用随机数表进行。随机数表是事先按随时,一般使用随机数表进行。随机数表是事先按随机原则形成的数字表,其中每一位数字都是由机原则形成的数字表,其中每一位数字都是由0 09 9随机产生。这些数字可以任意组合形成两位数、三随机产生。这些数字可以任意组合形成两位数、三位数、位数、,因此使用该表抽号,可以从任意的一,因此使用该表抽号,可以从任意的一个数开始向上或向下取数或跳跃取数,这些数字出个数开始向上或向下取数或跳跃取数,这些数字出现的机会也都是

16、相等的。现的机会也都是相等的。(3 3)按抽选的数字在总体中将对应的个体单位)按抽选的数字在总体中将对应的个体单位选出作为样本。例如,总体共有选出作为样本。例如,总体共有1000个个体单位,个个体单位,从中选出从中选出40个单位作为样本。为此,首先将个体个单位作为样本。为此,首先将个体编成编成1 11000号,然后在随机数表中任意选择四行号,然后在随机数表中任意选择四行或四列组成一个四位数字。如果确定从第六行第或四列组成一个四位数字。如果确定从第六行第11、12、13、14列向下取数,依次为列向下取数,依次为3407,4557,0205,0532,0352,其中其中3407,4557,已超已超

17、出出00011000的范围,舍弃不要,而的范围,舍弃不要,而0205,0532,0352,就是被选为样本的个体号码,就这样就是被选为样本的个体号码,就这样直到选出直到选出4040个号码为止。个号码为止。(二)等距抽样(二)等距抽样 等距抽样等距抽样(systematic sampling)又称系统抽样,又称系统抽样,这种抽样的方法是先将个体按某一标志排队,然后随这种抽样的方法是先将个体按某一标志排队,然后随机确定某一开始位置,再按一定的相等距离抽取调查机确定某一开始位置,再按一定的相等距离抽取调查单位。具体步骤为:单位。具体步骤为:(1 1)将总体的所有个体单位按一定的空间顺序)将总体的所有个

18、体单位按一定的空间顺序(或时间顺序)排列起来编号。(或时间顺序)排列起来编号。(2 2)计算抽样的间隔距离)计算抽样的间隔距离例如例如:对排列整齐的对排列整齐的100箱水果进行等距抽样,欲抽取箱水果进行等距抽样,欲抽取5 5箱作为样本。如何抽样?箱作为样本。如何抽样?计算抽样的间隔距离:计算抽样的间隔距离:确定开始位置:例如在第一箱到第二十箱水果随机确定开始位置:例如在第一箱到第二十箱水果随机抽取一箱,如选取序号抽取一箱,如选取序号1515号,则第二箱水果箱为号,则第二箱水果箱为15+20=3515+20=35号,第三箱为号,第三箱为5555号,号,一直抽到,一直抽到9595号,号,共计共计5

19、 5箱水果组成一个样本。箱水果组成一个样本。(三)分层抽样(三)分层抽样 分层抽样就是先将总体依照某一种或某几种特分层抽样就是先将总体依照某一种或某几种特性分为若干层(或组),然后从每一层中随机抽取性分为若干层(或组),然后从每一层中随机抽取个体单位组成样本。其步骤为:个体单位组成样本。其步骤为:(1 1)将总体按某种特征分为若干层。一般是按自然)将总体按某种特征分为若干层。一般是按自然形成的群体来分层,如不同的性别、年龄、年份等形成的群体来分层,如不同的性别、年龄、年份等的差异,都可以成为一个层。的差异,都可以成为一个层。(2 2)计算在各层中应抽取的个体单位数。确定在每)计算在各层中应抽取

20、的个体单位数。确定在每层中抽取多少个体数量的方法一般采取比例分层抽层中抽取多少个体数量的方法一般采取比例分层抽样,它是按各层单位数占全部个体单位数的比例大样,它是按各层单位数占全部个体单位数的比例大小分配。小分配。例如,某中学有学生例如,某中学有学生2000人,其中男同学人,其中男同学1200人,人,女同学女同学800人,现欲抽取人,现欲抽取100名同学进行身高的调查。名同学进行身高的调查。问如何抽取样本?问如何抽取样本?(四)整群抽样(四)整群抽样 整体抽样就是将总体按照某种标志划分成为不整体抽样就是将总体按照某种标志划分成为不同的群,然后随机抽取几个群,对抽出群中的个体同的群,然后随机抽取

21、几个群,对抽出群中的个体单位进行调查。其步骤为:单位进行调查。其步骤为:(1 1)将总体划分不同的群。)将总体划分不同的群。(2 2)按随机原则抽取几个群作为样本。)按随机原则抽取几个群作为样本。(3 3)对抽取群中的个体单位进行调查。)对抽取群中的个体单位进行调查。对抽出的群的个体单位进行调查时,有两种选对抽出的群的个体单位进行调查时,有两种选择:一种是调查被抽中群的全部个体单位,称之择:一种是调查被抽中群的全部个体单位,称之为一级整群抽样;另一种是被抽中群中再以概率为一级整群抽样;另一种是被抽中群中再以概率方式抽取部分个体单位进行调查,称之为二级整方式抽取部分个体单位进行调查,称之为二级整

22、群抽样。群抽样。(五)复置抽样和非复置抽样(五)复置抽样和非复置抽样 (重复抽样或非重复抽样)(重复抽样或非重复抽样)复置抽样是指每抽出一个单位,登记其特征值后,仍复置抽样是指每抽出一个单位,登记其特征值后,仍放回原总体之中;非复置抽样是指每抽出一个单位,放回原总体之中;非复置抽样是指每抽出一个单位,登记其特征值后,不再放回原总体之中。登记其特征值后,不再放回原总体之中。被抽出的部分个体叫做总体的一个样本被抽出的部分个体叫做总体的一个样本 从总体中随机抽样得到样本,获得样本观察值后可以从总体中随机抽样得到样本,获得样本观察值后可以计算一些统计量,统计量的概率分布称为抽样分布计算一些统计量,统计量的概率分布称为抽样分布 二、抽样分布二、抽样分布(一)样本均值的抽样分布(中心极限定理)(一)样本均值的抽样分布(中心极限定理)正态分布正态分布(五)样本方差的抽样分布(五)样本方差的抽样分布

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 高考资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com