2 统计描述201102.ppt

上传人:hyn****60 文档编号:87214062 上传时间:2023-04-16 格式:PPT 页数:81 大小:467KB
返回 下载 相关 举报
2 统计描述201102.ppt_第1页
第1页 / 共81页
2 统计描述201102.ppt_第2页
第2页 / 共81页
点击查看更多>>
资源描述

《2 统计描述201102.ppt》由会员分享,可在线阅读,更多相关《2 统计描述201102.ppt(81页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、施学忠公共卫生学院卫生统计学教研室生物医学研究的统计方法第2章讲授内容1定量资料的统计描述2定性资料的统计描述生物医学研究的统计方法第2章教学目的和要求了解频数分布表的编制方法及应用;掌握定量资料集中趋势和离散趋势常用的统计描述指标及应用;掌握率、频率的概念及应用。生物医学研究的统计方法第2章一、频数表与频数分布图二、集中趋势的统计描述三、离散趋势的统计描述定量资料的统计描述生物医学研究的统计方法第2章【例例1 1】某地2008年100名8岁男童身高资料(cm)生物医学研究的统计方法第2章问题1:该100名8岁男童的平均身高是多少?问题2:最高身高是多少?最低身高是多少?身高的分布范围是多少?

2、问题3:身高在132136cm占多大比例?问题4:如何用一个直观的统计图来描述身高的分布规律?分布是否对称?生物医学研究的统计方法第2章【解析解析】此问题涉及如何对定量资料进行统计描述?问题1 集中趋势集中趋势 问题2 离散趋势离散趋势 问题3,4 频数分布表和频数分布图频数分布表和频数分布图生物医学研究的统计方法第2章(一)频数表的概念:(一)频数表的概念:为频数分布表的简称,将各数值变量的值及其相应的频数列表即称为频数分布表。频率可用百分数或小数表示,频率的和为100%或1。一、连续变量频数表与频数分布图一、连续变量频数表与频数分布图生物医学研究的统计方法第2章(二)频数表的编制方法:(二

3、)频数表的编制方法:1.1.求求MAXMAX、MINMIN、R R R=MAX-MIN R=143.3-116.2=27.1(cm)2.2.求求“组段组段”数,组段和组距数,组段和组距(1)“组段”数一般为10-15个;(2)组距一般为R/10取整;(3)第一组段要包括MIN,最末组段包括MAX,并同时写出上下限。本例本例 i=R/10=2.71i=R/10=2.71 3 33.3.列表划计列表划计生物医学研究的统计方法第2章146生物医学研究的统计方法第2章 图3.1 某市100名8岁男童身高(cm)的频数分布身高(cm)频频数数生物医学研究的统计方法第2章(三)频数表的用途1.揭示频数的分

4、布特征揭示频数的分布特征(1)集中趋势centraltendency(2)离散趋势tendencyofdispersion(3)当集中趋势与离散趋势结合起来时能全面反映频数的分布。l对称分布:高峰位于中部,左右两侧的频数大体对称。正态分布为最常见的一种。l偏态分布:正偏态分布儿童疾病年龄分布;负偏态分布老年疾病年龄分布。生物医学研究的统计方法第2章对称分布对称分布偏态分布偏态分布正偏正偏负偏负偏频数分布高峰位于中部,左右两恻的频数大体对称。高峰偏于右侧,长尾向左侧延伸,则为负偏态负偏态。高峰偏于左侧,长尾向右侧延伸,则为正偏态正偏态生物医学研究的统计方法第2章2.便于发现某些特大或特小的可疑值

5、。便于发现某些特大或特小的可疑值。3.当当样样本本含含量量足足够够大大时时,以以频频率率作作为为概概率率的的估估计计值。值。4.作为陈述资料的形式。作为陈述资料的形式。生物医学研究的统计方法第2章 二、集中趋势指标二、集中趋势指标v概概念念:集中趋势是指一组定量资料集中位置的特征值,说明这种变量值大小的平均水平,常用平均数描述。包括算术均数、几何均数、中位数、百分位数等。生物医学研究的统计方法第2章(一)均数(一)均数:1.1.概念:概念:均数是算术均数的简称,指n个性质相同的定量数据之和除以n所得的结果。总体均数用希腊字母表示,样本均数用 表示。生物医学研究的统计方法第2章均数的计算均数的计

6、算(1)直接法:适用于观察值的个数较少时。生物医学研究的统计方法第2章l例 某地10名18岁健康男大学生身高(cm)分别为168.7,178.4,170.0,170.4,172.1,167.6,172.4,170.7,177.3,169.7求平均身高。生物医学研究的统计方法第2章(2)加权法:适用于样本例数较多时或者频数表资料。各组段的频数组中值(下限+上限)/2生物医学研究的统计方法第2章例2 计算例1中100名8岁男童的平均身高。生物医学研究的统计方法第2章算术均数的应用场合:算术均数的应用场合:均数能反映全部观察值的平均数量水平,因而应用甚广。它适用于对称分布,特别是正态分布的定量资料。

7、生物医学研究的统计方法第2章(二)几何均数二)几何均数G 1.1.概概念念:对n个性质相同的定量数据分别取对数变换后,按算术均数计算,然后再求其反对数所得的结果,叫几何均数。生物医学研究的统计方法第2章 2.2.计算计算 (1)直接法:适用于观察值个数较少时。方法:将n个观察值(X1,X2,X3,Xn)直接相乘再开n次方。公式:生物医学研究的统计方法第2章l例3.2 设有5份血清样品,滴度分别为:1:1,1:10,1:100,1:1000,1:10000 求其平均滴度。生物医学研究的统计方法第2章lG或Glg-1(lg1+lg10+lg100+lg1000+lg10000)/5)lg-1(0+

8、1+2+3+4)/5)lg-12=100即:平均滴度为1:100。较好地代表了观察值的平均水平。生物医学研究的统计方法第2章(2)加权法用于样本量较大的频数表资料。可用下式计算:Glg-1(flgX/f)生物医学研究的统计方法第2章几何均数的应用场合 几何均数适用于经对数转换后成对称分布的资料,或者说是等比资料,如抗体的滴度,血清效价等。生物医学研究的统计方法第2章(三)中位数和(三)中位数和百分位数百分位数1.1.概念:概念:(1)中位数(median):把一组变量值从小到大排列,位于中间位置的变量值叫中位数,用M表示。(2)百分位数(percentile):为一种位置指标,一个PX将总体或

9、样本的全部观察值分为两部分,理论上有X%的观察值比它小,(100-X)%的观察值比它大,P50分位数即是中位数。生物医学研究的统计方法第2章2.2.计算方法:计算方法:(1)直接由原始数据计算中位数n为奇数时n为偶数时生物医学研究的统计方法第2章生物医学研究的统计方法第2章(2)用频数表计算中位数及百分位数步骤:按所分组段,由小到大计算累计频数和累计频率根据公式计算中位数及其它百分位数生物医学研究的统计方法第2章Px 所在组段的组距Px 所在组段的下限Px 所在组段的频数 fL 为小于 L 的各组段累计频数计算中位数时,X=50,即M=P50。生物医学研究的统计方法第2章3.3.应用应用(1)

10、中位数(median):可用于任何分布的资料集中趋势的统计描述,但更常用于偏态分布资料、分布的一端或两端无确定数值时集中趋势的描述。生物医学研究的统计方法第2章(2)百分位数:A、用于描述数据某一百分位的位置,最常用的是P50,即中位数;也可用两个百分位数的结合来描述一组资料的分布特征。B、用于确定参考值范围:WBC95%参考值范围:P2.5P97.5过高过低均异常 肺活量95%参考值范围:P5 过低异常 尿铅95%参考值范围:P95 过高异常。生物医学研究的统计方法第2章(四)众数(mode):):是一组数据中出现频率最高的那个数;一组数据的众数可以是1个,也可能有多个。生物医学研究的统计方

11、法第2章中位数、算术均数和众数的关系 众数中位数算术均数众数中位数算术均数算术均数中位数众数正偏态分布对称分布负偏态分布生物医学研究的统计方法第2章三、离散趋势指标三、离散趋势指标生物医学研究的统计方法第2章 (一一)、极差(极差(Range,R)计算计算:R=极大值极小值意义意义:反映观察值变异度的大小。优点优点:简单明了缺点:缺点:1、R只考虑最大值和最小值之差,不能反映组内其它观察值的变异度;2、样本例数越多,抽到极大值和极小值的可能性越大,故样本例数悬殊时不易比较极差。3、即使样本例数不变,极差的抽样误差亦较大,即不够稳定。生物医学研究的统计方法第2章(二二)、四分位数间距(四分位数间

12、距(uartile,)计算计算:=P75-P25意义及特点意义及特点:类似值,但比其稳定,考虑了中间50%观察值的变异度。缺点:缺点:未考虑全部观察值的变异度。生物医学研究的统计方法第2章例 有164例沙门氏菌食物中毒病人的潜伏期(小时)见表3.5,求该潜伏期的四分位数间距。生物医学研究的统计方法第2章P25Li/f25(n25%fL)1212/58(16425%21)16.14(小时)P75Li/f75(n75%fL)2412/44(16475%79)36(小时)Q=P75-P25=36-16.14=19.86(小时)即该潜伏期的四分位数间距为19.86小时。生物医学研究的统计方法第2章常用

13、的变异指标常用的变异指标 (三三)、方差(方差(arianceariance)概念概念:1 总体方差:一组性质相同的定量数据中的每一个与其总体算术均数总体算术均数的差的平方和除以数据个数数据个数,所得的结果叫做总体方差。2 样本方差:一组性质相同的定量数据中的每一个与其样本算术均数样本算术均数的差的平方和除以数据个数与数据个数与1 1的差值的差值,所得的结果叫做样本方差。生物医学研究的统计方法第2章离均差平方和:离均差平方和:总体方差:总体方差:样本方差:样本方差:生物医学研究的统计方法第2章 n-1为自由度(为自由度(degree of freedom),表示随表示随机变量能自由取值的个数。

14、机变量能自由取值的个数。如有一四个(n=4)数据的样本,受到的条件限制,在自由确定4、2、5三个数据后,第四个数据只能是9,否则。因而这里的自由度=n-1=4-1=3。推而广之,任何统计量的自由度=n-限制条件的个数。离均差平方和常用SS或lxx表示生物医学研究的统计方法第2章意义及特点意义及特点:克服了值的不足,考虑了每个变量值的离散情况并消除了的影响。其单位是原度量单位的平方。例7-9 从表7-6中3组男孩体重资料分别求出方差。表7-6三组同龄男孩体重(kg)分组 12345甲2628303234乙2427303336丙2629303134生物医学研究的统计方法第2章生物医学研究的统计方法

15、第2章甲组甲组乙组乙组丙组丙组生物医学研究的统计方法第2章常用的变异指标常用的变异指标 (四四)、标准差(标准差(Standard deviation)概念概念:方差的单位为原单位平方,:方差的单位为原单位平方,不便使用。为了应用的方便,对总不便使用。为了应用的方便,对总体方差开平方体方差开平方标准差。标准差。生物医学研究的统计方法第2章样本标准差样本标准差总体标准差总体标准差生物医学研究的统计方法第2章标准差的计算标准差的计算(1)直接法:用于样本量较小的资料例3.6:现有一影像专业医生,测得10名患者的EA值分别为:0.470.600.860.961.011.131.271.581.722

16、.88。试计算其标准差。首先列表,求出X和X2(表3.6)。生物医学研究的统计方法第2章生物医学研究的统计方法第2章l将X和X2代入公式得:生物医学研究的统计方法第2章(2)加权法:用于样本量较大的频数表资料。例3.7以表3.3的资料为例,计算其标准差。生物医学研究的统计方法第2章生物医学研究的统计方法第2章 标准差的应用:标准差的应用:(1)表示变量分布的离散程度;(2)概略估计正态分布资料的频数分布;(3)结合样本含量,计算标准误;(4)结合均数,计算变异系数。生物医学研究的统计方法第2章常用的变异指标常用的变异指标(五五)、变异系数(变异系数(Coefficient of variati

17、on,CV)概念:概念:又叫变异度或离散系数,是同一组资料的标准差与均数之比。生物医学研究的统计方法第2章计算:计算:生物医学研究的统计方法第2章应用应用:CV为相对数,无单位,主要用于比较度量衡单位不同或均数相差悬殊的资料的变异度。其数值越小,说明观察值的变异度越小,均数的代表性越好。生物医学研究的统计方法第2章l例7-11 某地7岁男孩身高的均数为123.10cm,标准差为4.71 cm;体重的均数为22.29kg,标准差为2.26kg。试比较身高、体重何者变异度大。生物医学研究的统计方法第2章身高l体重由此可见,7岁男孩体重的变异度大于身高的变异度或者说身高比体重稳定。生物医学研究的统计

18、方法第2章 总总 结结上述变异指标中,标准差是反映观察值离散趋势的最佳指标,而极差则是最简明指标。服从一定分布的资料,其标准差和极差之间存在着一定的数量化关系。生物医学研究的统计方法第2章集中趋势集中趋势 离散趋势离散趋势 应用场合算术均数算术均数 方差、标准差方差、标准差 适用于对称分布,特别是正态分布几何均数几何均数 正偏态分布资料或对数正态分布资料 中位数中位数 极差及极差及及百分位数及百分位数 四分位数间距四分位数间距 变异系数变异系数 适用于任何分布资料,特别是偏态 分布、分布不明、分布末端无确定 值适用于均数相差悬殊或度量衡单位不同的资料生物医学研究的统计方法第2章 分类资料的统计

19、描述分类资料的统计描述生物医学研究的统计方法第2章前面已讲过,统计中的变量有两种类型,即:定量变量和分类变量。定量变量其变量值是定量的,表现为数值的大小;而分类变量是定性的,对其观察结果的统计处理,应先按分析要求,分类汇总观察单位数,即绝对数,再进一步计算其相对数。生物医学研究的统计方法第2章【案例3.1】某年甲乙两地发生麻疹流行,甲地发病人数为人,乙地发病人数为人,甲地发病人数比乙地多人,能否据此认为甲地麻疹发病比乙地严重呢?生物医学研究的统计方法第2章【案例解析3.1】l甲乙两地麻疹发病人数300人,250人是计数资料,对于该类资料的整理,一般是先根据某种属性(即发病,未发病)分组,然后得

20、到每组的观察单位数(绝对数)。l尽管甲地发病的绝对数比乙地多50人,但并不能就肯定地说甲地麻疹发病比乙地严重,需借助相对数进行描述。生物医学研究的统计方法第2章l一相对数的概念一相对数的概念包括率、构成比、相对比和动态数列,由于它是两个有联系的指标之比,因而叫作相对数。生物医学研究的统计方法第2章二常用的相对数(一)率(rate),又称频率指标概念概念:表示在一定条件下,发生某现象的观察单位数与可能发生某现象的观察单位数之比。公式公式:作用作用:说明某现象发生的频率或强度。生物医学研究的统计方法第2章式中的K为比例基数,可以为100%、1000、10000/万、100000/10万等。选择K的

21、要点:(1)根据习惯用法以便于比较,如治愈率、某病病死率、人工流产率等用百分率;出生率、婴儿死亡率等用千分率;(2)使算得的率至少保留12位整数。生物医学研究的统计方法第2章如果【案例3.1】中甲地人口为30000,乙地人口为10000,则:甲地麻疹发病率=乙地麻疹发病率=乙地麻疹发病率高于甲地,所以认为乙地麻疹发病比较严重。生物医学研究的统计方法第2章(二)构成比(constituent ratio),构成指标。概念:概念:表示某一现象内部各组成部分所占的比重或分布。公式:公式:作用:作用:表示某一事物内部各组成部分所占的比重。生物医学研究的统计方法第2章 表3-1某地1955年和1956年

22、疟疾的构成生物医学研究的统计方法第2章构成比的特征:构成比的特征:l(1)各组成部分的构成比之和为100%。l(2)某一部分构成比增大或减小,必然使其它部分产生相应的变化。生物医学研究的统计方法第2章l注意区别率和构成比注意区别率和构成比:虽然两者均为两个指标之比,但意义却完全不同。率反应了某项指标的平均强度或平均水平,它具有数值变量中平均数的含意,如甲地麻疹发病率为1%,也可认为该地每个人患麻疹的平均可能性为1%。构成比表示某一现象内部各组成部分所占的比重或分布,不能反应该现象的平均强度或平均水平。生物医学研究的统计方法第2章生物医学研究的统计方法第2章(三)相对比(relativerati

23、o)概念:概念:是2个有联系的同类指标之比,说明二者的对比水平。公式:公式:作用:作用:说明A为B的若干倍或百分之几。生物医学研究的统计方法第2章l例3.2某市19771979年肺癌死亡率城区为19.39/10万,郊区为9.99/10万,二者的相对比为19.39/9.99=1.94,即城区肺癌死亡率为郊区肺癌死亡率的1.94倍。生物医学研究的统计方法第2章 计算相对比的指标既可是相对数,计算相对比的指标既可是相对数,也可是两个绝对数或平均数。也可是两个绝对数或平均数。如我们可计算出甲乙两地麻疹发病人数之比为300/250=1.25。生物医学研究的统计方法第2章三应用相对数时应注意的问题1.计算相对数的分母不易过小。2.分析时不能以构成比代替率。生物医学研究的统计方法第2章3.对观察单位不等的几个率,不能直接相加求其平均率。如:n140X120P1=50%n260X220P233.3%显然显然:P(P1P2)/2而是:P(X1+X2)/(n1n2)比例基数=40%4.资料的对比应注意同质。5.对样本率的比较应遵循随机抽样,要作假设检验。生物医学研究的统计方法第2章l某文章作者根据下表资料,认为沙眼在20-岁组的患病率最高,以后随着年龄的增大而减少。你同意吗?说明理由。某医院门诊沙眼病人年龄构成比某医院门诊沙眼病人年龄构成比生物医学研究的统计方法第2章

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 生活常识

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com