第二章统计资料的整理与描述.pptx

上传人:茅**** 文档编号:89838989 上传时间:2023-05-13 格式:PPTX 页数:71 大小:766.35KB
返回 下载 相关 举报
第二章统计资料的整理与描述.pptx_第1页
第1页 / 共71页
第二章统计资料的整理与描述.pptx_第2页
第2页 / 共71页
点击查看更多>>
资源描述

《第二章统计资料的整理与描述.pptx》由会员分享,可在线阅读,更多相关《第二章统计资料的整理与描述.pptx(71页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、1第二章第二章 统计资料的整理与描述统计资料的整理与描述2主要内容主要内容 v个体变异个体变异(individual variation)v频数分布频数分布(frequency distribution)v集中趋势集中趋势(central tendency)v离散趋势离散趋势(tendency of dispersion)3个体变异个体变异v个个体体变变异异(individual variation)是是同同质质观观察对象间表现出的差异。察对象间表现出的差异。v变变异异是是生生物物体体在在一一种种或或多多种种、已已知知或或未未知知的不可控因素作用下所产生的综合反映。的不可控因素作用下所产生的综

2、合反映。v就就每每个个观观察察单单位位而而言言,其其观观察察指指标标的的变变异异是是随机的随机的(random)。v就总体而言,个体变异是有规律的。就总体而言,个体变异是有规律的。4个体变异是统计学应用的前提个体变异是统计学应用的前提个体变异个体变异抽样误差抽样误差统计推断统计推断5个体变异个体变异v生物体的变异是普遍存在的,是客观事实,生物体的变异是普遍存在的,是客观事实,无法准确预测。无法准确预测。v这种变异是有规律的,这种变异是有规律的,是可以认识的。是可以认识的。6一个原始资料一个原始资料某市某市1997年年12岁男童岁男童120人的身高人的身高(cm)资料如下。资料如下。142.3

3、156.6 142.7 145.7 138.2 141.6 142.5 130.5 134.5 148.8134.4 148.8 137.9 151.3 140.8 149.8 145.2 141.8 146.8 135.1150.3 133.1 142.7 143.9 151.1 144.0 145.4 146.2 143.3 156.3141.9 140.7 141.2 141.5 148.8 140.1 150.6 139.5 146.4 143.8143.5 139.2 144.7 139.3 141.9 147.8 140.5 138.9 134.7 147.3138.1 140.2

4、 137.4 145.1 145.8 147.9 150.8 144.5 137.1 147.1142.9 134.9 143.6 142.3 125.9 132.7 152.9 147.9 141.8 141.4140.9 141.4 160.9 154.2 137.9 139.9 149.7 147.5 136.9 148.1134.7 138.5 138.9 137.7 138.5 139.6 143.5 142.9 129.4 142.5141.2 148.9 154.0 147.7 152.3 146.6 132.1 145.9 146.7 144.0135.5 144.4 143.

5、4 137.4 143.6 150.0 143.3 146.5 149.0 142.1140.2 145.4 142.4 148.9 146.7 139.2 139.6 142.4 138.7 139.97v由由于于个个体体变变异异的的存存在在,医医学学研研究究中中某某指指标标在在各个体上的观察结果不是恒定不变的;各个体上的观察结果不是恒定不变的;v现现状状:医医学学研研究究得得到到的的原原始始数数据据(raw data)往往是庞大的、混乱的。往往是庞大的、混乱的。v但但变变异异也也不不是是杂杂乱乱无无章章的的,而而是是有有一一定定规规律律的,呈一定的分布的,呈一定的分布(distributi

6、on)。v解决:频数分布表,频数分布图。解决:频数分布表,频数分布图。2.1频数表与频数分布频数表与频数分布8v频数表的编制频数表的编制(frequency distribution drawings)2.1频数表与频数分布频数表与频数分布求极差求极差(R)。R=160.9-125.9=35划分组段。划分组段。定组数、组段、组距定组数、组段、组距统计频数。统计频数。9计量资料的频数、频率分布计量资料的频数、频率分布组组 段段 频频 数数 频频 率率 12410.0083 12820.0167 132100.0833 136220.1834 140370.3083 144260.2167 148

7、150.1250 15240.0333 15620.0167 16010.0083合合 计计1201.000010计量资料的频数分布计量资料的频数分布 x Freq.124 1 *128 2 *132 10 *136 22 *140 37 *144 26 *148 15 *152 4 *156 2 *160 1 *Total 120 11124 128 132 136 140 144 148 152 156 160计量资料的频数分布计量资料的频数分布12124132140148156164010203040人人数数图图 某市某市120名名12岁男童身高的频数分布岁男童身高的频数分布计量资料的频

8、数分布计量资料的频数分布13分类资料的频数分布分类资料的频数分布血型血型频数频数频率频率(%)O205 40.43 A112 22.09 B150 29.59 AB 40 7.89合计合计507100.0014分类资料的频数分布图OABAB15EXCEL制作的频数图16EXCEL制作的频率图17总结总结定量资料:将定量资料人为地划分为假设干个相连接的区间,统计每个区间所包含的观察值数。定性资料:根据指标值的不同属性,归类统计各类的频数分布。频数分布用于表达指标的分布规律。分布规律:变异规律。2.1频数表与频数分布频数表与频数分布18v频数分布的类型频数分布的类型 types of freque

9、ncy distribution对称分布 symmetric distribution 偏态分布 skewness distribution2.1频数表与频数分布频数表与频数分布19124132140148156164010203040人人数数身高身高(cm)对称分布对称分布2.1频数表与频数分布频数表与频数分布20偏态分布偏态分布正偏态正偏态(positive skew)负偏态负偏态(negative skew)2.1频数表与频数分布频数表与频数分布21v偏态偏态(skewness):Skewness means the lack of symmetry in a probability d

10、istribution.(The Cambridge Dictionary of Statistics in the Medical Sciences.)An asymmetric distribution is called skew.(Armitage:Statistical Methods in Medical Research.)2.1频数表与频数分布频数表与频数分布22v非对称分布称为skewness;俗称偏态分布,有人称偏峰分布。v“偏”是偏离的意思,表示个别观察值偏离均数较远,而不是“集中位置偏”;2.1频数表与频数分布频数表与频数分布23v “分布不对称者称为偏态分布。v偏态分

11、布又分为正偏分布和负偏分布。v所谓正偏分布是指分布的长尾在峰的右侧,又称右偏分布;v所谓负偏分布是指分布的长尾在峰的左侧,又称左偏分布。”2.1频数表与频数分布2470357911131517192110203040506001人人数数大多数居民发汞含量在115mol/kg之间,少数人的发汞大于15mol/kg,分布呈正偏态。发汞含量发汞含量(mol/kg)(a)239人发汞含量的频数分布人发汞含量的频数分布25图图 某城市某城市892名老年人生存质量自评分的频数分布名老年人生存质量自评分的频数分布0 10 20 30 40 50 60 70 80 90 100自评分自评分4003002001

12、00 0人人数数2605101520253035404501 02 03 040(b)102名黑色素瘤患者的生存时间频数分布名黑色素瘤患者的生存时间频数分布人人数数生存时间(月)生存时间(月)患者生存时间大部份在患者生存时间大部份在30个个月内,少数达月内,少数达45个月,分布个月,分布呈极度偏态,又称呈极度偏态,又称L型分布型分布。27图图 某地某地1990199019921992年男性死亡年龄分布年男性死亡年龄分布 0 5 10 15 20 25 0 5 10 15 20 25 30 35 40 30 35 40 45 50 55 60 65 70 75 80 8545 50 55 60

13、65 70 75 80 85死亡年龄死亡年龄(岁岁)2500200015001000 500 028频数分布表的用途频数分布表的用途v观察有无可疑值观察有无可疑值;v便于进一步计算便于进一步计算;v考察分布的类型考察分布的类型;v考察分布的特征考察分布的特征;2.1频数表与频数分布频数表与频数分布集中位置(集中位置(Central Tendency)离散趋势(离散趋势(Tendency of Dispersion)292.2 统计资料的描述统计资料的描述v图形描述图形描述频数分布图频数分布图 趋势图趋势图v指标描述指标描述 集中位置:算术均数、几何均数、中位数、百分位数集中位置:算术均数、几何

14、均数、中位数、百分位数 离散程度:极差、标准差、方差、四分位数间距离散程度:极差、标准差、方差、四分位数间距30v均数均数 (arithmetic mean,mean)v几何均数几何均数 (geometric mean)v中位数中位数 (median)v百分位数百分位数 (percentile)2.2 集中趋势的描述集中趋势的描述(average)312.2集中趋势的描述集中趋势的描述v均数均数(arithmetic mean,mean)32v加权均数加权均数(weighted mean)均数是加权均数的一个特例均数是加权均数的一个特例2.2集中趋势的描述集中趋势的描述33均数的应用:均数的应

15、用:最适于对称分布资料,特别是正最适于对称分布资料,特别是正态分布资料态分布资料;对于偏态资料,均数不能较好地对于偏态资料,均数不能较好地反映其集中趋势。反映其集中趋势。我也知道了!34v几何均数几何均数(geometric mean)加权法:加权法:f lgx fG=lg-1直接法:直接法:2.2集中趋势的描述集中趋势的描述35几何均数例v1:10,1:20,1:40,1:80,1:16036几何均数的应用:几何均数的应用:1.1.等比资料,如抗体平均滴度等比资料,如抗体平均滴度2.2.对数正态分布资料对数正态分布资料Remember!37使用几何均数时的注意点:使用几何均数时的注意点:1)

16、观察值不能有观察值不能有0。2)观察值不能同时有正值和负值。假设观察值不能同时有正值和负值。假设全为负值,在计算时先把负号去掉,得全为负值,在计算时先把负号去掉,得出结果再加上负号。出结果再加上负号。Be careful!38v中位数中位数(median)将一组数据按从小到大的顺序排列,位置居将一组数据按从小到大的顺序排列,位置居中的数即是中位数。中的数即是中位数。2.2集中趋势的描述集中趋势的描述39中位数例v9例正常人的发汞值:1.1,1.8 3.5 4.2 4.8 5.6 5.9 7.1 10.5 M=4.8 v9例正常人的发汞值:1.1,1.8 3.5 4.2 4.8 5.6 5.9

17、7.1 16 M=4.8v10例正常人的发汞值:1.1,1.8 3.5 4.2 4.8 5.6 5.9 7.1 10.5 16 M=(4.8+5.6)/2=5.2 40v百分位数百分位数(percentile)X%PX (100-X)%v50%分位数就是中位数分位数就是中位数v25%,75%分位数称四分位数分位数称四分位数(quartile)41中位数的应用:中位数的应用:中中位位数数常常用用于于描描述述偏偏态态资资料料,开开口口资资料料,有有不不确确定定值值的的资资料料的的集中趋势;集中趋势;中中位位数数和和均均数数在在对对称称分分布布上上理理论上是相同的。论上是相同的。42百分位数的应用:

18、百分位数的应用:百分位数用于描述某个观察序列在某百分位数用于描述某个观察序列在某百分位置上的水平。常用于确定参考百分位置上的水平。常用于确定参考值范围,亦称正常值范围。值范围,亦称正常值范围。43平均数应用的本卷须知平均数应用的本卷须知v同质的资料计算平均数才有意义。同质的资料计算平均数才有意义。v均数适用于:单峰对称分布的资料均数适用于:单峰对称分布的资料v几何均数适用于:对数变换后单峰对称的资料几何均数适用于:对数变换后单峰对称的资料v中位数适用于:任何分布资料,有不确定值的资料中位数适用于:任何分布资料,有不确定值的资料44只用平均数描述资料的弊病 It has been said th

19、at a fellow with one leg frozen in ice and the other leg in boiling water is comfortable.ON AVERAGE!例例如如,设设有有三三组组同同年年龄龄、同同性性别别儿儿童童体体重重(kg)数据如下:)数据如下:v甲组甲组 26 28 30 32 34 v乙组乙组 24 27 30 33 36 v丙组丙组 26 29 30 31 34 2.3离散程度的描述离散程度的描述4647描述离散程度的指标描述离散程度的指标:v极差极差 (range)v四分位数间距四分位数间距 (inter-quartile range

20、)v方差方差 (variance)v标准差标准差 (standard deviation)v变异系数变异系数 (coefficient of variation)48(一)极差(一)极差(range)v极极差差(全全距距),用用字字母母R表表示示,描描述述数数据据分分布布的的范范围围。极极差差大大,说说明明数数据据分分布布较较分散。分散。49特点特点v方法简单明了;v不灵敏,除了最大最小值外,不能反映组内其他数据的变异;v不稳定,样本较大时抽到较大值与较小值的可能性也较大,因而样本极差也较大,故样本含量相差较大时,不宜用极差来比较分布的离散度。50如上述三组数据中:如上述三组数据中:v甲组数据

21、的极差甲组数据的极差 R=34-26=8v乙组数据的极差乙组数据的极差 R=36-24=12v丙组数据的极差丙组数据的极差 R=34-26=8v甲组、丙组数据分布较乙组集中。甲组、丙组数据分布较乙组集中。v甲组与丙组的离散程度相同?甲组与丙组的离散程度相同?51(二)四分位数间距(二)四分位数间距 (inter-quartile range)(1)四分位数)四分位数(quartile,Q)下四分位数即第下四分位数即第2525百分位数,常用百分位数,常用QQL L表示;表示;上四分位数即第上四分位数即第7575百分位数,常用百分位数,常用QQU U表示。表示。52 (2)四分位数间距)四分位数间

22、距v指上、下四分位数的间距,既指上、下四分位数的间距,既QQL L与与QQU U间的差距,它是从小到大排列后间的差距,它是从小到大排列后中间一半数据所在的范围。中间一半数据所在的范围。53(三)方差与标准差(三)方差与标准差 54(三)方差与标准差(三)方差与标准差 55(三)方差与标准差(三)方差与标准差 56(三)方差与标准差(三)方差与标准差 57(三)方差与标准差(三)方差与标准差 58(三)方差与标准差(三)方差与标准差 59(三)方差与标准差(三)方差与标准差 60(三)方差与标准差(三)方差与标准差 61(三)方差与标准差(三)方差与标准差 62标准差的计算标准差的计算v直接法直

23、接法 总体标准差:总体标准差:样本标准差:样本标准差:63v加权法加权法 xi是各组段的组中值,fi是相应的频数 64v甲组:甲组:26 28 30 32 34v乙组:乙组:24 27 30 33 36v丙组:丙组:26 29 30 31 34v 极差极差方差方差 标准差标准差v甲组:甲组:8 10.03.16 v乙组:乙组:1222.54.74v丙组:丙组:8 8.52.9265(四)变异系数(四)变异系数 变异系数变异系数(coefficient of variation,CV)66v由由于于度度量量单单位位不不同同,故故不不能能直直接接比比较较两两者者的的标标准准差差,而应比较变异系数:

24、而应比较变异系数:v身高身高 v体重体重 v由此可见,该地由此可见,该地20岁男子体重的变异度大于身高的变岁男子体重的变异度大于身高的变异度。异度。例题 某某地地20岁岁男男子子100人人,身身高高均均数数为为166.06cm,标标准准差差为为4.98cm;体体重重均均数数为为53.7kg,标标准准差差为为4.96kg,试比较身高和体重的变异何者为大。,试比较身高和体重的变异何者为大。67正确应用正确应用(1)(1)v算数均数算数均数:适用于单峰对称分布资料;v几何均数几何均数:适合于作对数变换后单峰对称分布资料;v中位数和百分位数中位数和百分位数:适用于任何分布的资料;v中位数和百分位数在样

25、本含量较少时不稳定,越靠两端越不稳定;v中位数在抗极端值的影响方面,比均数具有较好的稳定性,但不如均数精确。v因此,当资料适合计算均数或几何均数时,不宜用中位数表示其平均水平。v不同质的资料应考虑分别计算平均数。68正确应用正确应用(2)v标准差的基本内容是离均差,它显示一组变量值与其均数的间距,故标准差直接地、总结地、平均地描述了变量值的离散程度。v在同质的前提下,标准差大表示变量值的离散程度大,即变量值的分布分散、不整齐、波动较大;反之,标准差小表示变量值的离散程度小,即变量值的分布集中、整齐、波动较小。v变异系数派生于标准差,其应用价值在于排除了平均水平的影响,并消除了单位。69平均数与

26、变异度v均数标准差(min,max)v中位数四分位数间距(min,max)v变异度小,则均数代表性好!v变异度大,数据分散,则均数代表性差!v平均数所表示的集中性与变异度所表示的离散性,从两个不同的角度说明计量资料的特征!70总结:总结:v每个观察指标均有其特定的变异规律;v描述变异:图形描述统计量描述平均数:均数、几何均数、中位数变异度:标准差(方差)、四分位数间距、变异系数、极差v不同分布的指标,用不同的统计量描述;v用平均数与变异度共同描述。谢谢观看/欢送下载BY FAITH I MEAN A VISION OF GOOD ONE CHERISHES AND THE ENTHUSIASM THAT PUSHES ONE TO SEEK ITS FULFILLMENT REGARDLESS OF OBSTACLES.BY FAITH I BY FAITH

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 技术资料 > 其他杂项

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com