统计数据的收集与整理(1).ppt

上传人:赵** 文档编号:65765280 上传时间:2022-12-08 格式:PPT 页数:43 大小:602KB
返回 下载 相关 举报
统计数据的收集与整理(1).ppt_第1页
第1页 / 共43页
统计数据的收集与整理(1).ppt_第2页
第2页 / 共43页
点击查看更多>>
资源描述

《统计数据的收集与整理(1).ppt》由会员分享,可在线阅读,更多相关《统计数据的收集与整理(1).ppt(43页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、绪绪 论论一、生物统计是应用于生物科学的数理统计方法(1)科学的发展总是从定性研究到定量(2)研究生物学和数学之间的一门交叉科学(3)生物统计的基础:概率论和数理统计(4)生态数学、数量遗传学、群体遗传学、数量分类方法二、统计学研究的是随机现象 确定性现象在一定的条件下必然发生(结果可以预言)。非确定性现象又称随机现象在一定条件下,具有多种可能结果,而究竟出现哪种结果,事先不可断言在个别试验中呈现出不确定性,但经大量重复试验,又具有统计规律性三、生物统计的研究内容1研究简缩数据和描述数据描述统计学2研究样本和总体的关系A.从已知的总体研究样本的特性。b.根据部分样本数据去推断总体。3研究实验设

2、计。四、课程安排学时51学时作业辅导5学时+计算器使用2学时+统计软件使用3学时。成绩理论成绩:70(闭卷50,开卷50)平时成绩:作业30%。准备课代表一人练习本一本,带统计功能的计算器五、学习要求1、掌握数据分析的基本方法会算2、理解统计学的基本概念弄懂3、提高分析问题和解决问题的能力灵活应用,包括分析数据的合理性,针对具体研究项目,进行合理的试验设计六、参考书1、生物统计刘来福 北师大出版社2、现代生物统计杨纪柯 安徽教育出版社3、统计学导论美A.M穆德,科学出版社4、田间试验和统计方法5、生物统计第第1章章 统计数据的统计数据的收集与整理收集与整理 11 总体与样本总体与样本 一、总体

3、和样本总体指研究对象的全体,可以看成一个集合每一个研究对象个体,元素无限总体和有限总体样本总体的一部分,即总体的一个子集样本含量研究样本的目的上为了推断总体二、随机抽样要求总体中的每一个个体被抽到的机会相等1抽样的方式:有放回抽样和无放回抽样样本容量的大小,是统计学研究的课题之一2抽样的方法:(1)抽签、抓阄(2)计算机,RND()(3)随机数字表随机数字表随机数字表 附表附表1 11 p2241 p224随机数字表随机数字表 附表附表1 12 p2252 p225三、连续型数据和离散型数据连续型数据由称量、度量或测量等计量方法所得到的数据,又称计量数据离散型数据(间断性数据):用计数的方法获

4、得的数据。是整数、可数的、又称计数数据。观察值每一个个体的某一性状、特征的测定数值12 频数分布频数分布 频数表或频数图频数表或频数图 一、离散型数据资料的整理举例:每10个新生儿中体重超过3公斤的人数共调 查120次,每次只调查10人)特点:根据样本数据的自然值进行分组如果观察值个数较多,变异幅度较大,可扩大以几个观察值为一组。每每每每1010名新生儿中体重超过名新生儿中体重超过名新生儿中体重超过名新生儿中体重超过3kg3kg人数的频数(频率)表人数的频数(频率)表人数的频数(频率)表人数的频数(频率)表组值组值(体重超过(体重超过3kg人数)人数)频数计算频数计算数数频率频率000.000

5、100.000200.0003一一10.0084正丅正丅20.0175正正丅正正丅120.1006正正正正正正190.1587正正正正正正正正正正正正正正390.3258正正正正正正正正正正正正340.2839正正正正100.0831030.025总计总计1200.999二、连续型数据资料和整理举例:高梁“三尺三”株高测量结果,样本容量100,株高数据,p4。表1-2表表1-2“1-2“三尺三株高测量结果三尺三株高测量结果155 153 159 155 150 159 157 159 151 152159 158 153 153 144 156 150 157 160 150150 150 1

6、60 156 160 155 160 151 157 155159 161 156 141 156 145 156 153 158 161157 149 153 153 155 162 154 152 162 155161 159 161 156 162 151 152 154 157 162158 155 153 151 157 156 153 147 158 155148 163 156 163 154 158 152 163 158 154164 155 156 158 164 148 164 154 157 165158 166 154 154 157 167 157 159 170

7、158分组数:分组数:1010组下限组上限组距组中值表表1-2“1-2“三尺三株高测量结果三尺三株高测量结果155 153 159 155 150 159 157 159 151 152159 158 153 153 144 156 150 157 160 150150 150 160 156 160 155 160 151 157 155159 161 156 141 156 145 156 153 158 161157 149 153 153 155 162 154 152 162 155161 159 161 156 162 151 152 154 157 162158 155 153

8、151 157 156 153 147 158 155148 163 156 163 154 158 152 163 158 154164 155 156 158 164 148 164 154 157 165158 166 154 154 157 167 157 159 170 158二、连续型数据资料和整理1求极差:又称全距R=最大观察值最小观察值 170-141292确定组数:考虑到:(1)观察值的多少(2)便于计算(整数)(3)能反映出资料的真实面貌两种确定组数的方法:经验 公式:G=1.87(N-1)2/5 样本数(n)分组的组数306068601007101002009122005

9、001217500以上1730二、连续型数据资料和整理3确定组距:每一组的范围称为组距分组时要求各组的距离相等一般以整数作为组距 二、连续型数据资料和整理4选定组限与组中值(1)选定第一组的组中值最好接近于最小观察值,142组中值最好是整数或与观察值的位数相同。(2)求第一组的组下限:下限=组中值-1/2组距(3)求各组的组中值和组限:(组中值)i(组中值)i-1+组距(组限)i=(组限)i-1+组距二、连续型数据资料和整理5.唱票 唱票程序 L第一组下限;D组距 Dim Frequency(N)As Integer,Data(nSample)As Single Dim i As Intege

10、r,nGroup As Integer For i=1 To nSample nGroup=Int(Data(i)-L)/D)Frequency(nGroup)=Frequency(nGroup)+1 Next i二、连续型数据资料和整理 5.唱票说明说明第组的下限等于第组的几种处理方法:(1)组限明确,比原始数据多一位小数,LXH(2)各组的上限是整数时减0.1,一位小数时减0.01(3)对各组的下(上)限不记载,用一缺横表示607080LXH(4)半数法表表1-3“1-3“三尺三株高的频数分布统计三尺三株高的频数分布统计组组 限限组中值组中值频数计算频数计算频数频数频率频率139.5-14

11、2.5141一一10.01142.5-145.5144丅丅20.02145.5-148.514730.03148.5-151.5150正正100.10151.5-154.5153正正正190.19154.5-157.5156正正正正正丅丅270.27157.5-160.5159正正正正200.20160.5-163.5162正正一一110.11163.5-166.5165正50.05166.5-169.5168一一10.01169.5-172.5171一一10.01总计1001.006 6绘制直方图绘制直方图(histogram)(histogram)图1-2“三尺三”株高直方图直方图0 05

12、 510101515202025253030139.5 142.5 145.5 148.5 151.5 154.5 157.5 160.5 163.5 166.5 169.5 172.5频率7 7多边形图多边形图(polygon)(polygon)7 7多边形图多边形图(polygon)(polygon)三、研究频数分布的意义1、可以看出数据的集中情况平均、大部分数据集中在何处、重心所在。2、可以看出数据的变异情况是整齐还是分散,这些数据是集中在平均数附近,还是分散在平均数的两侧。3、可以看出数据的分布是否对称 13平均数和标准差平均数和标准差mean&standard deviation一、

13、平均数(average)的意义、种类1意义(1)资料中观察值的中心位置(2)不同资料进行比较2算术平均数(arithmetic mean)设x1,x2,x3,xn表示样本内的几个观察值一、平均数(average)的意义、种类3中位数(median)有序数列的中点上的数排序,中间位置所对应的那个数样本为奇数和偶数的情况4众数(mode)具有最高频数的组值或组中值5几何平均数二、算术平均数的基本特征和算法1特征(1)每个观察值都对 有贡献1/n(2)(3)(4)如果 (5)样本平均数是总体平均数的无偏估计二、算术平均数的基本特征和算法2算法(1)一般算法:根据定义的公式。(2)频数分组资料用组中值

14、代表每一组的平均数三、变异程度的几种度量方法1、极差 又称全距,记作R是资料中最大观察值与最小观察值的差数。R=max(x)min(x)优点:简单。样本数小于10时常用缺点:没有充分利用资料,完全受极端值的影响2平均离差(mean deviation)平均离差三、变异程度的几种度量方法3样本方差(sample variance)说明:(1)平方的作用:消除负号,加重较大的分量(2)样本方差是总体方差的无偏估计(3)除以n-1的问题三、变异程度的几种度量方法4样本标准差,又称标准差(sample standard deviation,s)四、方差、标准差的计算方法一般情况:用公式 证明四、方差、标准差的计算方法频数资料的计算 五、变异系数(coefficient of variability)(1)平均数相差很大,不能比较(2)单位不同,也不能进行比较第第1章章 结束结束

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 高考资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com