离散型趋势.ppt

上传人:石*** 文档编号:39879258 上传时间:2022-09-08 格式:PPT 页数:25 大小:1.78MB
返回 下载 相关 举报
离散型趋势.ppt_第1页
第1页 / 共25页
离散型趋势.ppt_第2页
第2页 / 共25页
点击查看更多>>
资源描述

《离散型趋势.ppt》由会员分享,可在线阅读,更多相关《离散型趋势.ppt(25页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、离散型趋势现在学习的是第1页,共25页 这三组数据的均数都是这三组数据的均数都是3030,集中水平是一样的,但是三组,集中水平是一样的,但是三组的分布不一样,也就是离散程度不同。的分布不一样,也就是离散程度不同。A A和和B B的数据分布均的数据分布均匀,但匀,但B B的散布范围大于的散布范围大于A A;C C的数据分布不均匀,两头分散,的数据分布不均匀,两头分散,中间集中,散布范围与中间集中,散布范围与A A相同。因此,要全面把握数据的分布相同。因此,要全面把握数据的分布特点,不仅需要了解数据的集中位置,还要了解数据的离散状特点,不仅需要了解数据的集中位置,还要了解数据的离散状况。况。24

2、26 28 30 32 34 36ABC现在学习的是第2页,共25页 表示变异程度常用的指标有:极差、四分位数间距、方差表示变异程度常用的指标有:极差、四分位数间距、方差及标准差。及标准差。1 1 极差(极差(rangerange,R R):):就是这一组数据的全距,可以反映个体就是这一组数据的全距,可以反映个体变异的范围。适用于数量较少,内部分布较均匀的资料。试计算变异的范围。适用于数量较少,内部分布较均匀的资料。试计算A A、B B、C C三组数据的极差。如:三组数据的极差。如:A A和和B B的数据。特点是:简单明了,但粗的数据。特点是:简单明了,但粗略、不稳定。由于仅考虑到两个极端值,

3、当样本含量较大的情况下,这略、不稳定。由于仅考虑到两个极端值,当样本含量较大的情况下,这种缺点更加暴露出来。种缺点更加暴露出来。离散趋势指标(续)离散趋势指标(续)现在学习的是第3页,共25页离散趋势指标(续)离散趋势指标(续)2 2 四分位数间距(四分位数间距(quartile rangequartile range,Q Q):):上节已经接触到百分位数的上节已经接触到百分位数的概念。四分位数间距定义是概念。四分位数间距定义是Q=Q=P P7575-P-P2525 实际上,就是中间一半变量实际上,就是中间一半变量值的全距,反映了居中数值值的全距,反映了居中数值50%50%个体的散布范围。与全

4、距相比,稳个体的散布范围。与全距相比,稳定性较好,因它舍去了两头不太稳定的变量值的影响。可以用于各定性较好,因它舍去了两头不太稳定的变量值的影响。可以用于各种类型的连续性变量资料,但主要用于偏态分布数据的描述,与中种类型的连续性变量资料,但主要用于偏态分布数据的描述,与中位数的数据相对应。试计算以下资料中伤寒患者潜伏期的四分位数位数的数据相对应。试计算以下资料中伤寒患者潜伏期的四分位数间距。间距。现在学习的是第4页,共25页现在学习的是第5页,共25页四分位数间距四分位数间距 首先找到首先找到P75P75所在的组段,即累计频数百分比超出所在的组段,即累计频数百分比超出75%75%的组段,在本例

5、为的组段,在本例为”1010 “组段,故组段,故L=10L=10,f75=40f75=40,i=2i=2,n=178n=178,代入公式:代入公式:然后找到然后找到P25P25所在组段,本例为所在组段,本例为”6 6 “组段,故组段,故L=6L=6,f25=36f25=36,i=2i=2,n=178n=178,代入公式:代入公式:Q=P75-P25=10.33-6.08=4.25Q=P75-P25=10.33-6.08=4.25(天)(天)127Lf 2(*%)10(178*75%127)10.33()40XLxiPLn xff天43Lf 2(*%)=6+%=36XLxiPLn xff(178

6、*25-43)6.08(天)现在学习的是第6页,共25页离散趋势指标(续)离散趋势指标(续)3 3 方差(方差(variancevariance):):极差和四分位数间距因代极差和四分位数间距因代表性差,一般只用于偏态分布等不适合计算算术表性差,一般只用于偏态分布等不适合计算算术均数的资料的变异程度大小,对于正态分布的资均数的资料的变异程度大小,对于正态分布的资料,可以考虑每一个观察值与均数的差值,这样料,可以考虑每一个观察值与均数的差值,这样就可以避免极差和四分位数间距的缺陷。就可以避免极差和四分位数间距的缺陷。那么能否用每一个观察值与均数之差的总和,即那么能否用每一个观察值与均数之差的总和

7、,即 来表示变异程度的大小呢?来表示变异程度的大小呢?(X-X)现在学习的是第7页,共25页方方 差差 因此,考虑把每个观察值的离均差 平方后再求和,即 ,称离均差平方和,这样就避免了正负相消的问题。但离均差平方和的大小除了与变异程度大小有关外,还与观察值的个数有关。观察值的个数越多,则 就越大。用 除以观察值的个数所得到的值就称为离均差的平方,简称均方,又称为方差(variance)。方差就是表示变异程度较好的指标,方差愈小,说明观察值的变异程度愈小。(X-X)2(X-X)2(X-X)2(X-X)现在学习的是第8页,共25页总总 体体 方方 差差为了全面考虑观察值的变异情况,衡量总体(正态分

8、布)中每一为了全面考虑观察值的变异情况,衡量总体(正态分布)中每一个变量值个变量值X X与均数与均数的差距,即(的差距,即(X X-),称为),称为“离均差离均差”。那么。那么变异总和,即变异总和,即(X X-),称为),称为“离均差总和离均差总和”,由于,由于(X X-)=0=0(理论上),不能进行描述应用,而采用(理论上),不能进行描述应用,而采用(X X-)2 2,称为,称为“离均差平方和离均差平方和”,再考虑到变量值个数,再考虑到变量值个数N N(平均分配变异度),(平均分配变异度),就得到了总体方差即:就得到了总体方差即:现在学习的是第9页,共25页样样 本本 方方 差差 在实际应用

9、时,总体均数往往未知,常常得到的是样本的数据,因此,在实际应用时,总体均数往往未知,常常得到的是样本的数据,因此,以以 来代替来代替 ,得到的就是样本方差即:,得到的就是样本方差即:由于用样本计算得到的数值偏小,为了较好地估计总体,分母用由于用样本计算得到的数值偏小,为了较好地估计总体,分母用n-1n-1代替代替N N进行校正。这里的上进行校正。这里的上n-1n-1又称为自由度(又称为自由度(degree of freedomdegree of freedom)。为)。为了便于计算,将方差变换为:了便于计算,将方差变换为:现在学习的是第10页,共25页 离散趋势指标(续)离散趋势指标(续)标准

10、差(标准差(standard deviationstandard deviation):):方差说明观察值的变异程度,其优方差说明观察值的变异程度,其优点是全面考虑了一组观察值中每一个数据,缺点是将观察值的单位点是全面考虑了一组观察值中每一个数据,缺点是将观察值的单位进行了平方,不便于实际应用中解释其含义。标准差就是一个反映进行了平方,不便于实际应用中解释其含义。标准差就是一个反映变异程度的统计指标,由于它是以正态分布为前提推算出来的,因变异程度的统计指标,由于它是以正态分布为前提推算出来的,因此,它适用于与算术均数相同条件的资料分布类型,与算术均数结此,它适用于与算术均数相同条件的资料分布类

11、型,与算术均数结合起来,描述一组正态分布资料的基本特征。标准差小,变异度小合起来,描述一组正态分布资料的基本特征。标准差小,变异度小,分布集中,均数的代表性好。计算公式:,分布集中,均数的代表性好。计算公式:2()1XXSn现在学习的是第11页,共25页标准差的计算方法标准差的计算方法1.1.直接法:小样本未分组资料可以直接用公式求标准差直接法:小样本未分组资料可以直接用公式求标准差,但实际工作中,为了便于计算,常用以下推导公式:,但实际工作中,为了便于计算,常用以下推导公式:22()/1XXnSn现在学习的是第12页,共25页 测定了测定了5 5名健康成人血糖值分别为名健康成人血糖值分别为5

12、.865.86、5.325.32、4.054.05、4.954.95、3.833.83(mmol/Lmmol/L)本例本例 ,n=5n=5,代入公,代入公式:式:24.01X 2118.22X222()/118.2224.01/5=0.8515 1XXnSn(mmol/L)现在学习的是第13页,共25页标准差的计算方法标准差的计算方法2.2.加权法:大样本资料先列频数表,然后按下式计算加权法:大样本资料先列频数表,然后按下式计算标准差。标准差。22()/1fXfXfSf现在学习的是第14页,共25页表表2-1 2-1 某山区某山区100100名健康成年男性身高测量结果名健康成年男性身高测量结果

13、168.5170.0172.5165.0175.5155.5157.0180.0179.5161.5175.0175.0167.0171.5171.0172.5168.5168.0159.5164.0167.0162.0176.0177.5166.0167.5165.0175.5169.0173.5167.5172.0168.5165.5161.0175.5165.0169.5166.5158.0160.0168.5178.5172.0160.0170.0167.0146.5155.0170.5170.0175.0172.0165.0156.5162.0168.5165.0159.0170.5

14、162.0162.5167.5166.0157.5163.5169.0155.5167.5169.0165.0184.0168.0160.0179.5150.0165.0173.0168.0152.0170.0165.0173.0156.0167.5161.0176.5171.5162.0158.0164.0154.5168.5158.0163.5170.0162.5166.0152.5160.0现在学习的是第15页,共25页根据上表资料求根据上表资料求100100名健康成年男性身高(名健康成年男性身高(cmcm)的标准差。首先列)的标准差。首先列出频数表,然后分别计算出出频数表,然后分别计算

15、出 ,和和 ,然后代入,然后代入公式即可:本例。公式即可:本例。fX2fXf222()/2784480.0 16672.0/1007.11100 1fXfXfSf(cm)现在学习的是第16页,共25页表表2-3 1002-3 100名健康成年男性身高的均数计算(加名健康成年男性身高的均数计算(加权法)权法)身高()身高()频数(频数(f)组中值(组中值(X0)fX0fX02146.01148.0148.021 904.0150.03152.0456.069 312.0154.08156.01248.0194 688.0158.012160.01920.0307 200.0162.019164.

16、03116.0511 024.0166.025168.04200.0705 600.0170.018172.03096.0532 512.0174.09176.01584.0278 784.0178.04180.0720.0129 600.0182.0186.01184.0184.033 856.0合计合计100(f)-16 672.0(fX)2 784 480.0(fX2)现在学习的是第17页,共25页标准差的应用标准差的应用 1.1.表示一组观察值的离散程度。两组或多组观察表示一组观察值的离散程度。两组或多组观察值在单位相同,均数相等或近似的条件下,标准值在单位相同,均数相等或近似的条件下

17、,标准差较大的那一组,说明观察值的离散程度较大,差较大的那一组,说明观察值的离散程度较大,即观察值围绕均数的分布较离散,均数的代表性即观察值围绕均数的分布较离散,均数的代表性较差;反之,均数的代表性好。在医学文献上常较差;反之,均数的代表性好。在医学文献上常用均数加减标准差(用均数加减标准差()的形式,表示资料的)的形式,表示资料的平均水平和离散程度。平均水平和离散程度。XS现在学习的是第18页,共25页标准差的应用标准差的应用 2.2.用标准差计算变异系数,当两组观察值单位不同,或两组均数相差较用标准差计算变异系数,当两组观察值单位不同,或两组均数相差较大时,不能直接用标准差比较其离散程度的

18、大小,这是则要用变异系大时,不能直接用标准差比较其离散程度的大小,这是则要用变异系数(数(coefficient of variationcoefficient of variation,CVCV)作比较。其计算公式为:)作比较。其计算公式为:100%SCVX和标准差一样,变异系数愈小,说明该组观察值的离散程度愈小,变异系数愈大,说明离散和标准差一样,变异系数愈小,说明该组观察值的离散程度愈小,变异系数愈大,说明离散程度愈大。程度愈大。现在学习的是第19页,共25页 例:测得某地56名7岁男童身高均数为121.16cm,标准差为4.32cm;胸围均数为57.71cm,标准差为2.82cm,试比

19、较两个指标的变异程度。从标准差来看,该人群身高的变异大于胸围的变异,但这可能只是一种假象,因为身高的均数远大于胸围的均数。标准差反映的是各观察值与均数之间平均的绝对差值,但对于不同的指标而言,相同的差值意义却不同。当两均数相差较大时,相对指标比绝对指标能更好地反映变异程度大小。现在学习的是第20页,共25页本例,分别求的身高和胸围的变异系数为:本例,分别求的身高和胸围的变异系数为:身高:身高:CV1=4.31/121.76CV1=4.31/121.76100%=3.56%100%=3.56%胸围:胸围:CV2=2.82/57.71CV2=2.82/57.71100%=4.89%100%=4.8

20、9%即胸围的变异程度大于身高的变异程度。即胸围的变异程度大于身高的变异程度。现在学习的是第21页,共25页 3.3.用标准差估计观察值的频数分布情况,当观察值呈正态用标准差估计观察值的频数分布情况,当观察值呈正态分布时,可用均数说明其平均水平,标准差说明其离散程分布时,可用均数说明其平均水平,标准差说明其离散程度,两者结合起来,反映正太曲线下面积分布的规律,能度,两者结合起来,反映正太曲线下面积分布的规律,能够对观察值频数分布情况做出概括的估计。这在医学上颇够对观察值频数分布情况做出概括的估计。这在医学上颇为常用,如用于估计医学参考值范围。为常用,如用于估计医学参考值范围。4.4.用标准差计算

21、标准误用标准差计算标准误标准差的应用标准差的应用现在学习的是第22页,共25页 离散趋势指标(续)离散趋势指标(续)描述小结:描述小结:不同的资料分布,它的集中趋势和离散不同的资料分布,它的集中趋势和离散趋势的指标是不同的:趋势的指标是不同的:在正态分布中:在正态分布中:在对数正态分布中:在对数正态分布中:在偏态分布中:在偏态分布中:现在学习的是第23页,共25页1、在处理性质相同的一组资料时,各观察值同加(或同减)一个不等于、在处理性质相同的一组资料时,各观察值同加(或同减)一个不等于0的的常数后(常数后(B)A 均数不变,标准差改变均数不变,标准差改变 B 均数改变,标准差不变均数改变,标

22、准差不变 C 两者均改变两者均改变 D 两者均不改变两者均不改变 2、用均数与标准差相结合可全面描述下列哪种资料的特征(、用均数与标准差相结合可全面描述下列哪种资料的特征(A)A 正态或近似正态分布正态或近似正态分布 B 正偏态分布正偏态分布 C 负偏态分布负偏态分布 D 分布不清的资料分布不清的资料3、标准差可以说明(、标准差可以说明(C )A 样本均数的可靠程度样本均数的可靠程度 B 资料的分布类型资料的分布类型 C 变量值的离散程度变量值的离散程度 D 以上均不是以上均不是现在学习的是第24页,共25页4、表示偏态分布资料的离散程度,可以用(、表示偏态分布资料的离散程度,可以用(C)A 标准差表示标准差表示 B 变异系数表示变异系数表示 C 四分位数间距表示四分位数间距表示 D 方差表示方差表示5、比较身高和体重两组资料数据变异程度大小宜采用的指标为(、比较身高和体重两组资料数据变异程度大小宜采用的指标为(A)A 变异系数变异系数 B 方差方差 C 全距全距 D 标准差标准差现在学习的是第25页,共25页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com