贾俊平-统计学-总结.doc

上传人:zhe****342 文档编号:13133556 上传时间:2022-04-28 格式:DOC 页数:10 大小:527.41KB
返回 下载 相关 举报
贾俊平-统计学-总结.doc_第1页
第1页 / 共10页
贾俊平-统计学-总结.doc_第2页
第2页 / 共10页
点击查看更多>>
资源描述

《贾俊平-统计学-总结.doc》由会员分享,可在线阅读,更多相关《贾俊平-统计学-总结.doc(10页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、第一章 导论概念:统计学:收集、处理、分析、解释数据井从数据中得出结论的科学。统计的分类:描述统计:研究的是数据收集,处理,汇总,图表描述,文字概括与分析等统计方法。推断统计:是研究如何利用样木数据进行推断总体特征。数据:1.分类数据:对事物进行分类的结果数据,表现为类别,用文字来表述。例如,人口按性别分为男、女两类2.顺序数据对事物类别顺序的测度,数据表现为类别,用文字来表述例如,产品分为一等品、二等品、三等品、次品等3.数值型数据对事物的精确测度,结果表现为具体的数值。例如:身高为175cm,190cm,200cm参数:描述总体特征。有总体均值()、标准差()总体比例(T)统计量:描述样本

2、特征,样本标准差(s),样木比例(p)统计方法描述统计推断统计参数估计假设检验统计数据的分类按计量层次分类的数据顺序的数据数值型数据按时间状况截面的数据时序的数据按收集方法观察的数据实验的数据第二章 数据的搜集1. 数据来源包括直接来源(一手数据)和间接来源(二手数据)2. 抽样方式包括概率抽样与非概率抽样3. 概率抽样:也称随机抽样。按一定的概率以随机原则抽取样本,抽取样本时使每个单位都 有一定的机会被抽中。4.5. 抽样误差:是由抽样的随机性引起的样本结果与总体真值之间的误差。抽样误差并不是针对某个样本的检测结果与总体真是结果的差异而言,抽样误差描述的是所有样本可能的结果与总体真值之间的平

3、均差异。6. 抽样误差的大小与样本量的大小和总体的变异程度有关。第三章 数据的图表展示计算机实训内容,要求:1. 数据筛选,自动筛选2. 高级筛选,3. 数据排序4. 分类汇总-利用数据透视表5. 对比条形图6. 环形图7. 累计频数图8. 散点图9. 雷达图等等频数分布图两种方法:工具-数据分析-直方图 数值型和顺序数据 数据-数据透视表 数据透视表第四章 数据的概括性度量集中趋势:算数平均数:几何平均数:指n个观察值连乘积的n次方根,计算平均发展速度时复利下的平均年利率,最常用的一种计算公式为,几何平均数算术平均数。中位数:有限的数集,可以通过把所有观察值高低排序后找出正中间的一个作为中位

4、数。(平均家庭收入)(记忆的重要性)离散程度:异众比率:异众比率指的是总体中非众数次数与总体全部次数之比。(了解)四分位差:(了解)方差:var标准差:STDEV平均差:相对位置的度量:标准分数:离散系数:形状:偏态:SK0,正值,正偏或者右偏,小数集中 SK0,尖峰,数据分布集中, K0,扁平,数据分布分散。第五章 概率与概率分布1.概率的分类:1.概率的古典定义,概率的统计定义,概率的主观定义。2.期望值:在离散型随机变量X的一切可能取值的完备组中,各可能取值xi与其取相对应的概率pi乘积之和,描述离散型随机变量取值的集中程度,记作E(X),或者,其实为加权平均数。3. 二项分布的数学期望

5、为 E ( X ) np 方差为 D ( X ) npq标准差?区别二项分布的概率值与期望值。4. 当二项分布中n很大,p很小时,二项分布就变成为Poisson分布 计算机计算二项分布计算时候, 已知:1,目标概率 2,实验次数 3,成功次数公式: 二项分布换泊松分布,已知:1,入=np=1*2 2,成功的次数 (揉合在一起,因为都是那种目标概率小、实验次数多的实验) 入=数学期望值E(X)=方差D(X)=npP119例子,P121例子5. 正态分布 主要特点:钟型,离近的概率大,离远的概率小。 标准差小,集中;标准差大,分散。正态曲线的最高点在均值,它也是分布的中位数和众数。正态分布是一个分

6、布族,每一特定正态分布通过均值和标准差来区分。曲线f(x)相对于均值对称,尾端向两个方向无限延伸,且理论上永远不会与横轴相交正态曲线下的总面积等于1。计算机计算:已知:1,正态分布(的形状)(与), 2.临界值(右端值,即默认计算的是改值以左部分的面积)6. 标准正态分布: 期望值=0,(即曲线图象对称轴为Y轴), 标准差=1条件下的正态分布, 记为N(0,1)。(N是正态英文的首字母) 计算:由于形状已知(N(0,1)),所以只需要知道临界值(右端值)7.此段内容只供理解,不是知识。 概率函数:横轴表示“统计对象”,纵轴表示 ”概率”。故称概率函数。 概率密度函数:将直方图组距缩小到很密的程

7、度,故称概率密度函数。 分布函数:分布函数F(x)在x处的函数值就表示X落在区间(-,x上的概率。(把概率函数的面积转换成分布函数的纵轴值) 所以:找一个的具体值的概率应该在密度函数上的值,范围区间(-,x是在分布函数上的值,一个范围区间(X1X2)是分布函数上X2的值-X1的值8. 正态分布的3原则:只要是正态分布,不论标准与否,(可以反过来理解)数值分布在(-,+)中的概率为0.6826数值分布在(-2,+2)中的概率为0.9544数值分布在(-3,+3)中的概率为0.9974可以认为,Y 的取值几乎全部集中在(-3,+3)区间内,超出这个范围的可能性仅占不到0.00269. 正态分布表

8、10. 其他公式: 11. 正态分布的标准化公式:Z=(X-)/N(0,1) (EXCEL实例)第六章 统计量及抽样分布中心极限定理:设从均值为、方差为2(有限)的任意一个总体中抽取样本量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为、方差为2/n 的正态分布。(那么标准差呢?)理解:m为总体个数,n为抽样时每个样本的个数,可以抽出个样本,这些样本符合正态分布。 第七章:参数估计1.参数估计:根据统计量计算推断出总体低的参数,包括点估计和区间估计2.点估计:点估计3.区间估计:条件 1.均值 2.标准差 3.置信水平(区间应包括几个标准差) 置信水平越大,区间应该越长;置信水平越小,区间可以越短。 主要在求上下限(因为均值已知,知道上下限即可知道区间)4.第八章 假设检验1.已知均值,标准差,上下限,求置信水平(与几个标准差相关)。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 教育教学

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com