数据分布特征的描述学习教案.pptx

上传人:一*** 文档编号:82690388 上传时间:2023-03-26 格式:PPTX 页数:82 大小:1.29MB
返回 下载 相关 举报
数据分布特征的描述学习教案.pptx_第1页
第1页 / 共82页
数据分布特征的描述学习教案.pptx_第2页
第2页 / 共82页
点击查看更多>>
资源描述

《数据分布特征的描述学习教案.pptx》由会员分享,可在线阅读,更多相关《数据分布特征的描述学习教案.pptx(82页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、会计学1数据分布特征数据分布特征(tzhng)的描述的描述第一页,共82页。数据分布的特征数据分布的特征(tzhng):一、集中趋势一、集中趋势:反映数据向其中心靠拢或反映数据向其中心靠拢或 聚集程度;聚集程度;二、离中趋势;数据远离中心的趋势二、离中趋势;数据远离中心的趋势(又又称离散称离散(lsn)(lsn)程度程度);三、偏态和峰态;偏态是对数据分布对称三、偏态和峰态;偏态是对数据分布对称性的度量;峰度是指数据分布的平峰性的度量;峰度是指数据分布的平峰或尖峰程度(形状)。或尖峰程度(形状)。第1页/共82页第二页,共82页。数据分布的特征数据分布的特征(tzhng)集中趋势集中趋势集中趋

2、势集中趋势:反映反映反映反映数据向其中心数据向其中心数据向其中心数据向其中心靠拢或聚集程靠拢或聚集程靠拢或聚集程靠拢或聚集程度度度度 (位置位置位置位置)偏态和峰态;偏偏态和峰态;偏偏态和峰态;偏偏态和峰态;偏态:反映数据偏态:反映数据偏态:反映数据偏态:反映数据偏斜程度;峰度:斜程度;峰度:斜程度;峰度:斜程度;峰度:数据分布的平峰数据分布的平峰数据分布的平峰数据分布的平峰或尖峰程度或尖峰程度或尖峰程度或尖峰程度(形(形(形(形状)状)状)状)离中趋势;数据离中趋势;数据离中趋势;数据离中趋势;数据远离中心的趋势远离中心的趋势远离中心的趋势远离中心的趋势 (分散程度分散程度分散程度分散程度)

3、第2页/共82页第三页,共82页。数据分布特征数据分布特征(tzhng)的测的测度度数据特征的测度数据特征的测度众众众众众众 数数数数数数中位数中位数中位数中位数中位数中位数平均数平均数平均数平均数平均数平均数离散系离散系离散系离散系离散系离散系数数数数数数方差和标准方差和标准方差和标准方差和标准方差和标准方差和标准差差差差差差峰峰峰峰峰峰 态态态态态态四分位差四分位差四分位差四分位差四分位差四分位差异众比率异众比率异众比率异众比率异众比率异众比率偏偏偏偏偏偏 态态态态态态分布的形状分布的形状集中趋势集中趋势离中趋势离中趋势第3页/共82页第四页,共82页。集中集中(jzhng)趋势的度趋势的

4、度量量分类数据-众数顺序数据-中位数和分位数数值型数据-均值(jn zh)众数、中位数和均值(jn zh)的关系第4页/共82页第五页,共82页。集集 中中 趋趋 势势(central tendency)一组数据向其中心值靠拢的倾向和程度一组数据向其中心值靠拢的倾向和程度(chngd)测度集中趋势就是寻找数据水平的代表值或中心值测度集中趋势就是寻找数据水平的代表值或中心值不同类型的数据用不同的集中趋势测度值不同类型的数据用不同的集中趋势测度值注意:低层次数据的测度方法也适用于高层次的数据,注意:低层次数据的测度方法也适用于高层次的数据,但高层次数据的测度方法往往不适用于低层次的数据。但高层次数

5、据的测度方法往往不适用于低层次的数据。第5页/共82页第六页,共82页。分类数据分类数据(shj)-众众数数 一组数据中出现次数最多的变量值 适合于数据量较多时使用 不受极端值的影响 一组数据可能没有众数或有几个众数 主要用于分类(fn li)数据,也可用于顺序数据和数值型数据(spss计算)第6页/共82页第七页,共82页。注意注意(zh y):众数:众数(不惟一性不惟一性)无众数无众数(zhn sh)原始数据原始数据:10 5 9 12 6 8一个一个一个一个(y)(y)众数众数众数众数原始数据原始数据原始数据原始数据:6 5 9 8 5 5:6 5 9 8 5 5多于一个众数多于一个众数

6、多于一个众数多于一个众数原始数据原始数据:25 :25 28 2828 28 36 36 42 4242 42第7页/共82页第八页,共82页。分类数据的众数分类数据的众数(例题例题(lt)分析分析)不同品牌饮料的频数分布不同品牌饮料的频数分布不同品牌饮料的频数分布不同品牌饮料的频数分布 饮料品牌饮料品牌频数频数比例比例百分比百分比(%)可口可乐可口可乐 旭日升冰茶旭日升冰茶 百事可乐百事可乐 汇源果汁汇源果汁 露露露露1511 9 6 90.300.220.180.120.183022181218合计合计501100解解解解:这这这这里里里里的的的的变变变变量量量量为为为为“饮饮饮饮料料料料

7、品品品品牌牌牌牌”,这这这这是是是是个个个个分分分分类类类类变变变变量量量量,不不不不同同同同类类类类型型型型(lixng)(lixng)的的的的饮饮饮饮料就是变量值料就是变量值料就是变量值料就是变量值 所所所所调调调调查查查查的的的的5050人人人人中中中中,购购购购买买买买可可可可口口口口可可可可乐乐乐乐的的的的人人人人数数数数最最最最多多多多,为为为为1515人人人人,占占占占总总总总被被被被调调调调查查查查人人人人数数数数的的的的30%30%,因因因因此此此此众众众众数数数数为为为为“可可可可口口口口可乐可乐可乐可乐”这一品牌,即这一品牌,即这一品牌,即这一品牌,即 Mo Mo可口可乐

8、可口可乐可口可乐可口可乐第8页/共82页第九页,共82页。顺序数据顺序数据(shj)的众数的众数(例题分例题分析析)解解解解:这这这这里里里里的的的的数数数数据据据据为为为为顺顺顺顺序序序序数数数数据据据据。变变变变量量量量为为为为“回回回回答答答答类类类类别别别别”甲甲甲甲 城城城城 市市市市 中中中中 对对对对 住住住住 房房房房(zhfng)(zhfng)表表表表示示示示不不不不满满满满意意意意的的的的户户户户数数数数最最最最多多多多,为为为为108108户户户户,因因因因此此此此众众众众数数数数为为为为“不不不不满满满满意意意意”这这这这一类别,即一类别,即一类别,即一类别,即 Mo

9、Mo不满意不满意不满意不满意甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数 (户户)百分比百分比 (%)非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意 24108 93 45 30 836311510合计合计300100.0第9页/共82页第十页,共82页。数值型数据众数的确定数值型数据众数的确定(qudng)方法方法 单变量值分组资料单变量值分组资料某年级某年级(ninj)83名女生身名女生身高资料高资料 身高身高(shn o)人人数数(CM

10、)(人)(人)152 1 154 2 155 2 156 4 157 1 158 2 159 2 160 12 161 7 162 8 163 4 身高身高 人数人数(CM)(人)(人)164 3 165 8 166 5 167 3 168 7 169 1 170 5 171 2 172 3 174 1总计总计总计总计 8383 STATSTAT第10页/共82页第十一页,共82页。身高身高 人数人数 比重比重(bzhng)(CM)(人)(人)(%)160-165 34 40.96 170以上以上 总计总计 83 100某年级某年级(ninj)83名女生名女生身高资料身高资料数值型数据众数的确

11、定数值型数据众数的确定(qudng)方法方法 组距分组资料组距分组资料STATSTAT第11页/共82页第十二页,共82页。众数众数(zhn sh)的计算的计算方法总结:方法总结:1、观察法(例题分析)2、插值法P76(例题分析)所谓插值法就是先找到众数所在的组,然后按该组次数(csh)与前后相邻两组分布次数(csh)之差所占的比重推算众数值。第12页/共82页第十三页,共82页。例3.1 某车间实行计件工资,2005年10月120名工人的月工资资料(zlio)如下表所示:要求:试计算月工资的众数。月工资(元)人数(人)比重(%)由小到大累计次数由大到小累计次数800以下1512.501512

12、0800-10002520.83401051000-1200 4840.0088801200-1400 2016.67108321400-1600 1210.0012012合计120100.00第13页/共82页第十四页,共82页。解:从上表中我们可以(ky)看出,月工资变量值中最大的字数为48人,即众数组为1000-1200这一组。根据公式,可得:第14页/共82页第十五页,共82页。众数众数(zhn sh)的特点的特点n n众数是以它在所有变量值中所处的位置确定的一个代表值,它不受分众数是以它在所有变量值中所处的位置确定的一个代表值,它不受分布数列的极大或极小值的影响,从而增强了众数对分布

13、数列的代表性。布数列的极大或极小值的影响,从而增强了众数对分布数列的代表性。n n众数有可能不存在,也可能存在多个众数有可能不存在,也可能存在多个(du(du );n n众数缺乏敏感性。众数缺乏敏感性。第15页/共82页第十六页,共82页。3.1.2 3.1.2 顺序顺序顺序顺序(shnx)(shnx)数据数据数据数据-中位数中位数中位数中位数 和分和分和分和分位数位数位数位数 1 1中位数:中位数:中位数:中位数:概念:排序后处于(chy)中间位置上的值MMe e50%50%50%50%特点特点(tdin)(tdin):不受极端值的影响:不受极端值的影响 主要用于顺序数据,也可主要用于顺序数

14、据,也可 用数值型数据,用数值型数据,但不能用于分类数据但不能用于分类数据 各变量值与中位数的离差绝对值之和最小,即各变量值与中位数的离差绝对值之和最小,即第16页/共82页第十七页,共82页。顺序数据顺序数据(shj)的中位数的中位数(例题分例题分析析)解解解解:中中中中 位位位位 数数数数 的的的的 位位位位 置置置置(wi zhi)(wi zhi)为为为为 300/2 300/2150150 从从从从累累累累计计计计频频频频数数数数看看看看,中中中中位位位位数数数数在在在在“一一一一般般般般”这这这这一组别中一组别中一组别中一组别中 中位数为中位数为中位数为中位数为 Me=Me=一般一般

15、一般一般甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数 (户户)累计频数累计频数 非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意 24108 93 45 30 24132225270300合计合计300第17页/共82页第十八页,共82页。未分组数值型数据未分组数值型数据(shj)的中位数的中位数(奇数个数据奇数个数据(shj)的算例的算例)n【例】【例】9个家庭个家庭(jitng)的人均月收入数的人均月收入数据据n原始数据原始数据:1500

16、750 780 1080 850 960 2000 1250 1630n排排 序序:750 780 850 960 1080 1250 1500 1630 2000n位位 置置:1 2 3 4 5 6 7 8 9中位数中位数中位数中位数 10801080第18页/共82页第十九页,共82页。未分组数值型数据未分组数值型数据(shj)的中位数的中位数(偶数个数据偶数个数据(shj)的算例的算例)n【例】:【例】:10个家庭的人均个家庭的人均(rn jn)月收入数据月收入数据n排排 序序:660 750 780 850 960 1080 1250 1500 1630 2000n位位 置置:1 2

17、3 4 5 6 7 8 9 10 第19页/共82页第二十页,共82页。组距分组数据组距分组数据(shj)中位数的确中位数的确定方法定方法 身高身高 fi人数人数(rn sh)累累计计 (CM)(人)(人)人数人数(rn sh)150-155 3 3 155-160 11 14 160-165 34 48 165-170 24 72 170以上以上 11 83 总计总计 83 某年级某年级83名女生名女生(nshng)身高资料身高资料STATSTAT第20页/共82页第二十一页,共82页。中位数的计算方法:中位数的计算方法:中位数的计算方法:中位数的计算方法:1、根据未分组数据计算中位数对于没

18、分组数据,首先(shuxin)要排序,然后根据所在位置确定中位数。第21页/共82页第二十二页,共82页。2、由分组资料(zlio)确定中位数:第22页/共82页第二十三页,共82页。例3.2 某车间实行计件工资,2005年10月120名工人(gng rn)的月工资资料如下表所示:要求:试计算月工资的中位数。月工资(元)人数(人)比重(%)由小到大累计次数由大到小累计次数800以下1512.5015120800-10002520.83401051000-1200 4840.0088801200-1400 2016.67108321400-1600 1210.0012012合计120100.00

19、第23页/共82页第二十四页,共82页。解:第24页/共82页第二十五页,共82页。2.顺序顺序(shnx)数据数据-分位数分位数二分位数(中位数)、四分位数、十分位数和二分位数(中位数)、四分位数、十分位数和百分位数等。其中主要百分位数等。其中主要(zhyo)(zhyo)有四分位数。有四分位数。排排位位处于处于 25%25%和和75%75%位置上的值即位置上的值即 四分位数四分位数 不受极端值的影响不受极端值的影响 要要用用于于顺顺序序(shnx)(shnx)数数据据,也也可可用用于于数数值值型型数数据据,但但不不能能用用于于分分类类数数据据(各各种种分分位位数数可可由由spssspss计算

20、)计算)QQL LQQMMQQU U25%25%25%25%25%25%25%25%第25页/共82页第二十六页,共82页。四分四分(s fn)位数的位位数的位置置n n下四分(s fn)位数n n上四分(s fn)位数第26页/共82页第二十七页,共82页。例两个学习小组的统计学考试成绩合并如下:例两个学习小组的统计学考试成绩合并如下:要求:(要求:(1 1)计算前)计算前1515个学生统计学考试成绩的四分个学生统计学考试成绩的四分(s fn)(s fn)位数;位数;(2 2)如果增加一个学生的成绩为)如果增加一个学生的成绩为9595分,试计算分,试计算1616个学生统计学考试个学生统计学考

21、试成绩的四分成绩的四分(s fn)(s fn)位数。位数。序号12345678成绩(分)5861 646872747576序号910 111213141516成绩(分)7878 8285868690-第27页/共82页第二十八页,共82页。解(解(1)QL1)QL的位置的位置(wi zhi)=N+1/4=15+1/4=4(wi zhi)=N+1/4=15+1/4=4,即,即QLQL在第在第4 4个位置个位置(wi zhi)(wi zhi)上,相应的变量值上,相应的变量值6868分分就是下四分位数。就是下四分位数。QuQu的位置的位置(wi zhi)=3(wi zhi)=3(N+1N+1)/4=

22、3/4=3(15+1/4=1215+1/4=12,即即QuQu在第在第1212个位置个位置(wi zhi)(wi zhi)上,相应的变量值上,相应的变量值8585分就是上四分位数。分就是上四分位数。(2 2)QLQL的位置的位置(wi zhi)(wi zhi),即,即QL QLQL QL在第个位置在第个位置(wi(wi zhi)zhi)上上,采用分割法,得:采用分割法,得:QL=X4+0.25x(X5-X4)=68+0.25x(72-68)=69(QL=X4+0.25x(X5-X4)=68+0.25x(72-68)=69(分)分)同理,可得(分)同理,可得(分)第28页/共82页第二十九页,共

23、82页。3.1.3 数值型数据数值型数据(shj)-平均数平均数1.平均数(均值)平均数(均值)均值(算术平均数)定义:全部变量值之和均值(算术平均数)定义:全部变量值之和与变量值个数相除所得与变量值个数相除所得(su d)的商。通常的商。通常也称为平均数(也称为平均数(average)或均值()或均值(mean又有简单算数平均数和加权平均数之分又有简单算数平均数和加权平均数之分STATSTAT平均数的定义平均数的定义-变量值的一般水平。有算术均值变量值的一般水平。有算术均值(jn zh)、调、调 和均值和均值(jn zh)和几何均值和几何均值(jn zh)。第29页/共82页第三十页,共82

24、页。简单(jindn)算术平均数与加权算术平均数的计算(simple mean/weighted mean)设一组数据设一组数据(shj)(shj)为:为:x1 x1,x2 x2,xnxn(未分组数(未分组数据据(shj)(shj))各组的组中值为:各组的组中值为:M1 M1,M2 M2,Mk Mk(组距分组数据(组距分组数据(shj)(shj))相应的频数为:相应的频数为:f1 f1,f2 f2,fkfk简单简单简单简单(jindn)(jindn)算术均值算术均值算术均值算术均值加权算术均值加权算术均值加权算术均值加权算术均值第30页/共82页第三十一页,共82页。未分组资料算术未分组资料算

25、术(sunsh)平均数的平均数的计算:计算:算术平均数算术平均数=某变量值总量某变量值总量变量值总数变量值总数数据数据(shj)个个数数 nSTATSTAT简单简单(jindn)算术平均数算术平均数设有数据:设有数据:设有数据:设有数据:第31页/共82页第三十二页,共82页。身高身高 组中值组中值 人数人数 比重比重(bzhng)(cm)xi(cm)fi(人)(人)(%)160-165 162.5 34 40.96 170以上以上 总计总计 -83 100 分组资料均值的计算:分组资料均值的计算:某年级某年级83名女生名女生(nshng)身身高资料高资料组距数据组距数据(shj)次数次数f频

26、率频率f/f变量变量值值xSTATSTAT加权算术加权算术平均数平均数第32页/共82页第三十三页,共82页。集中趋势的最常用测度值;集中趋势的最常用测度值;一组数据的均衡点所在;一组数据的均衡点所在;易受极端值的影响;易受极端值的影响;各变量值与其均值的离差之和等于零;各变量值与其均值的离差之和等于零;由组距分组资料计算的均值有近似值性质;由组距分组资料计算的均值有近似值性质;用于数值型数据,不能用于分类用于数值型数据,不能用于分类(fn li)数数据和顺序数据据和顺序数据算术算术(sunsh)平均数平均数(均值)特征:(均值)特征:第33页/共82页第三十四页,共82页。2.平均数的另一种

27、平均数的另一种(y zhn)表现形式:调和平表现形式:调和平均数均数 注意注意(zh y)(zh y):是均值的另一种表现形式是均值的另一种表现形式 易受极端值的影响易受极端值的影响 计计算公式为计计算公式为原来只是计原来只是计算时使用了算时使用了不同的数据不同的数据!第34页/共82页第三十五页,共82页。调和调和(tio h)平均数平均数(例题例题分析分析)某日三种蔬菜的批发成交数据某日三种蔬菜的批发成交数据蔬菜蔬菜名称名称批发价格批发价格(元元)Mi(已知)已知)成交额成交额(元元)Mi fi(已知)(已知)成交量成交量(公斤公斤)fi甲甲乙乙丙丙1.200.500.8018000125

28、00 64001500025000 8000合计合计3690048000【例例例例】某某某某蔬蔬蔬蔬菜菜菜菜批批批批发发发发市市市市场场场场三三三三种种种种蔬蔬蔬蔬菜菜菜菜的的的的日日日日成成成成交交交交数数数数据据据据如如如如表表表表,计计计计算算算算三三三三种种种种蔬蔬蔬蔬菜菜菜菜该该该该日日日日的的的的平平平平均均均均(pngjn)(pngjn)批发价格批发价格批发价格批发价格第35页/共82页第三十六页,共82页。3.几何(j h)平均数(geometric mean)概念:n 个变量值乘积的 n 次方根用途:适用于对比率数据的平均(pngjn)主要用于计算平均(pngjn)发展速度、

29、平均(pngjn)增长率、平均(pngjn)比率计算公式为:可看作可看作(kn zu)(kn zu)是均值的一种变是均值的一种变形形第36页/共82页第三十七页,共82页。几何几何(j h)平均数平均数(例题分析例题分析)n 【例例】某某水水泥泥生生产产企企业业(qy)1999年年的的水水泥泥产产量量为为100万万吨吨,2000年年与与1999年年相相比比增增长长率率为为9%,2001年年与与2000年年相相比比增增长长率率为为16%,2002年年与与2001年年相相比比增增长长率率为为20%。求求各各年年的的年平均增长率。年平均增长率。年平均年平均(pngjn)(pngjn)增长率增长率11

30、4.91%-114.91%-1=14.91%1=14.91%第37页/共82页第三十八页,共82页。3.1.4 众数众数(zhn sh)、中位数和平、中位数和平均数的关系均数的关系左偏分布左偏分布左偏分布左偏分布左偏分布左偏分布均值均值均值均值均值均值 中位数中位数中位数中位数中位数中位数 众数众数众数众数众数众数对称分布对称分布对称分布对称分布对称分布对称分布 均值均值均值均值均值均值=中位数中位数中位数中位数中位数中位数=众数众数众数众数众数众数右偏分布右偏分布右偏分布右偏分布右偏分布右偏分布众数众数众数众数众数众数 中位数中位数中位数中位数中位数中位数均值均值均值均值均值均值对何种数据对

31、何种数据(shj)而言的?而言的?第38页/共82页第三十九页,共82页。均数、中位数、众数均数、中位数、众数(zhn sh)三者关系三者关系正态分布时:均数中位数众数(zhn sh)正偏态分布时:均数中位数众数(zhn sh)负偏态分布时:均数中位数众数(zhn sh)第39页/共82页第四十页,共82页。众数、中位数、平均数的特点众数、中位数、平均数的特点(tdin)和应用和应用众数不受极端值影响具有(jyu)不惟一性数据分布偏斜程度较大时应用中位数不受极端值影响数据分布偏斜程度较大时应用平均数易受极端值影响数学性质优良数据对称分布或接近对称分布时应用第40页/共82页第四十一页,共82页

32、。习题1、一家汽车零售店中10名员工在某个月售出的汽车数量按升序排列如下:2,4,10,10,12,12,14,15。计算售出汽车数量的(a)均值(jn zh);(b)中位数;(c)众数。2、八名销售员售出的中央空调数按升序排列如下:5,8,11,11,11,14,16.计算这八名销售员销售量的四分位数。第41页/共82页第四十二页,共82页。1、解:(a)均值(jn zh)(b)中位数(c)众数为10.第42页/共82页第四十三页,共82页。2、解:第43页/共82页第四十四页,共82页。3.2 离中趋势离中趋势(qsh)的测度的测度 数据分布的另一个重要特征数据分布的另一个重要特征数据分布

33、的另一个重要特征数据分布的另一个重要特征 反映各变量值远离其中心值的程度(离散程度)反映各变量值远离其中心值的程度(离散程度)反映各变量值远离其中心值的程度(离散程度)反映各变量值远离其中心值的程度(离散程度)从另一个侧面说明了集中趋势测度值的代表程度从另一个侧面说明了集中趋势测度值的代表程度从另一个侧面说明了集中趋势测度值的代表程度从另一个侧面说明了集中趋势测度值的代表程度 注注注注意意意意(zh(zh y)y):数数数数据据据据的的的的离离离离散散散散程程程程度度度度越越越越大大大大,集集集集中中中中趋趋趋趋势势势势的的的的测测测测度度度度值值值值对对对对该该该该组组组组数数数数据据据据的

34、的的的代代代代表表表表性性性性越越越越差差差差;数数数数据据据据的的的的离离离离散散散散程程程程度度度度越越越越小小小小,集集集集中中中中趋趋趋趋势势势势的的的的测测测测度度度度值值值值对对对对该该该该组组组组数数数数据据据据的的的的代代代代表表表表性性性性越好。越好。越好。越好。不同类型的数据有不同的离散程度测度值不同类型的数据有不同的离散程度测度值不同类型的数据有不同的离散程度测度值不同类型的数据有不同的离散程度测度值第44页/共82页第四十五页,共82页。下面是两个总体关于年龄分布的数据下面是两个总体关于年龄分布的数据下面是两个总体关于年龄分布的数据下面是两个总体关于年龄分布的数据,相对

35、而言相对而言相对而言相对而言,那个总体的年龄分布分散那个总体的年龄分布分散那个总体的年龄分布分散那个总体的年龄分布分散(fnsn),(fnsn),差异大些差异大些差异大些差异大些?n n46、47、48、49、50、n n51、52、53、54n n8、15、20、30、50n n70、80、85、92总体(zngt)1总体(zngt)2第45页/共82页第四十六页,共82页。离中趋势;数据远离中趋势;数据远离中趋势;数据远离中趋势;数据远离中心的趋势离中心的趋势离中心的趋势离中心的趋势 (分散程度分散程度分散程度分散程度)总体总体总体总体(z(zngtngt)2)2总体总体总体总体(zngt

36、)1(zngt)1第46页/共82页第四十七页,共82页。n)分类数据分类数据(shj):异众比率(:异众比率(variation ratio)n)顺序数据)顺序数据(shj):四分位差(:四分位差(quartile range)n3.2.3)数值型数据数值型数据(shj):n 极差(极差(range)n 平均差(平均差(mean deviation)n 方差和标准差(方差和标准差(Variance and standard deviation)n 相对位置的度量:标准分数(相对位置的度量:标准分数(standard score)n 相对离散程度:离散系数(相对离散程度:离散系数(Coeffi

37、cient of Variation)离中趋势离中趋势离中趋势离中趋势(qsh)(qsh)的测度的测度的测度的测度第47页/共82页第四十八页,共82页。分类数据分类数据(shj):异众比率:异众比率 (variation ratio)注意:注意:对分类数据离散程度的测度对分类数据离散程度的测度非众数组的频数非众数组的频数(pn sh)(pn sh)占总频数占总频数(pn(pn sh)sh)的比率的比率计算公式为计算公式为 用于衡量用于衡量(hng ling)(hng ling)众数的代表性众数的代表性第48页/共82页第四十九页,共82页。异众比率(例题(lt)分析)解:解:解:解:在在所所

38、调调查查的的5050人人当当中中,购购买买其其他他品品牌牌饮饮料料的的人人数数占占70%70%,异异众众比比率率比比较较大大。因因此此,用用“可可口口可可乐乐”代代表表消消费费者者购购买买饮饮料料品品牌牌的的状状况况,其代表性不是很好其代表性不是很好不同品牌饮料的频数分布不同品牌饮料的频数分布 饮料品牌饮料品牌频数频数比例比例百分比百分比(%)可口可乐可口可乐 旭日升冰旭日升冰茶茶 百事可乐百事可乐 汇源果汁汇源果汁 露露露露1511 9 6 90.300.220.180.120.183022181218合计合计501100第49页/共82页第五十页,共82页。3.2.2 四分四分(s fn)

39、位差(位差(quartile range)注意:注意:注意:注意:对顺序数据离散程度的测度对顺序数据离散程度的测度对顺序数据离散程度的测度对顺序数据离散程度的测度也称为内距或四分间距也称为内距或四分间距也称为内距或四分间距也称为内距或四分间距上四分位数与下四分位数之差上四分位数与下四分位数之差上四分位数与下四分位数之差上四分位数与下四分位数之差 Qd=QU QL Qd=QU QL反映反映反映反映(f(fnyng)nyng)了中间了中间了中间了中间50%50%数据的离散程度数据的离散程度数据的离散程度数据的离散程度不受极端值的影响不受极端值的影响不受极端值的影响不受极端值的影响用于衡量中位数的代

40、表性用于衡量中位数的代表性用于衡量中位数的代表性用于衡量中位数的代表性第50页/共82页第五十一页,共82页。例:假设例:假设(ji(jish)sh)某班有某班有3 3个学习小组,统计学期个学习小组,统计学期中考试成绩如下表所示:中考试成绩如下表所示:要求:计算三个小组的四分位差。要求:计算三个小组的四分位差。序号1234567第一小组65657575758585第二小组55657575758595第三小组405565858595100第51页/共82页第五十二页,共82页。解:由题意(t y),可得:第52页/共82页第五十三页,共82页。数值型数据离散数值型数据离散(lsn)程度的度量程度

41、的度量1、极差(R)(range)离散程度的最简单测度值易受极端值影响未考虑数据(shj)的分布7 7 8 8 9 910107 7 8 8 9 9 1010 R R =max(=max(x xi i)-min()-min(x xi i)计算公式为计算公式为第53页/共82页第五十四页,共82页。2 2、平均差(、平均差(mean deviation各变量值与其均值离差绝对值的平均数各变量值与其均值离差绝对值的平均数能全面反映一组数据的离散程度能全面反映一组数据的离散程度(chngd)数学性质较差,实际中应用较少数学性质较差,实际中应用较少计算公式为计算公式为未分组数据未分组数据未分组数据未分

42、组数据(shj)(shj)组距分组数据组距分组数据组距分组数据组距分组数据(shj)(shj)第54页/共82页第五十五页,共82页。平均差平均差(例题例题(lt)分析分析)某电脑公司销售量数据平均差计算表某电脑公司销售量数据平均差计算表 按销售量分组按销售量分组组中值组中值(Mi)频数频数(fi)140150150 160160 170170 180180 190190 200200 210210 220220 230230 240145155165175185195205215225235 4 91627201710 8 4 540302010 0102030405016027032027

43、0 0170200240160250合计合计1202040第55页/共82页第五十六页,共82页。含含含含义义义义:每每每每天天天天电电电电脑脑脑脑的的的的日日日日销销销销售售售售量量量量有有有有高高高高有有有有低低低低,与与与与日日日日销销销销售量平均数相比售量平均数相比售量平均数相比售量平均数相比(xin b)(xin b),差异有大有小。,差异有大有小。,差异有大有小。,差异有大有小。平平平平均均均均差差差差表表表表明明明明:以以以以日日日日平平平平均均均均销销销销售售售售量量量量为为为为中中中中心心心心,每每每每天销售量与平均日销售量的平均差距为天销售量与平均日销售量的平均差距为天销售

44、量与平均日销售量的平均差距为天销售量与平均日销售量的平均差距为1717台台台台.第56页/共82页第五十七页,共82页。3.方差方差(fn ch)和标准差(和标准差(Variance and standard deviation)方差方差(fn ch)(variance)各变量值与其平均数离差)各变量值与其平均数离差 平方的平方的平均数平均数第57页/共82页第五十八页,共82页。方差方差(fn ch)和标准差(和标准差(Variance and standard deviation)标准差标准差(standard deviation)即方差的算术)即方差的算术 平方根;其单位平方根;其单位(

45、dnwi)与原变量与原变量X的单位的单位(dnwi)相同。相同。第58页/共82页第五十九页,共82页。样本方差样本方差(fn ch)和标准差(记住)和标准差(记住)(simple variance and standard deviation)n未分组数据(shj):组距分组数据组距分组数据(shj)(shj):未分组数据:未分组数据:组距分组数据:组距分组数据:方差的计算公式方差的计算公式方差的计算公式方差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式注意:注意:样本方差用样本方差用自由度自由度n-1去去除除!第59页/共82页第六十页,共82页。方差方差(fn

46、 ch)(fn ch)和标准差的计算(未分组资料)和标准差的计算(未分组资料)编号编号甲甲x xi i乙乙x xi i丙丙x xi i甲甲2 2乙乙2 2丙丙2 21 1440 480 490 1936002304002401002 2460 490 495 2116002401002450253 3500 500 500 2500002500002500004 4540 510 505 2916002601002550255 5560 520 510 313600270400260100合计合计25002500 25002500 25002500126040012510001250250标准

47、差标准差50.9915.817.91第60页/共82页第六十一页,共82页。样本标准差(例题(lt)分析)(某电脑公司销售量数据平均差计算表某电脑公司销售量数据平均差计算表 按销售量分组按销售量分组组中值组中值(Mi)频数频数(fi)140150150 160160 170170 180180 190190 200200 210210 220220 230230 240145155165175185195205215225235 4 91627201710 8 4 540302010 01020304050160270320270 0170200240160250合计合计12055400第61

48、页/共82页第六十二页,共82页。含义:每一天的销售量 与 平 均 数 相 比(xin b),平均相差台第62页/共82页第六十三页,共82页。3.2.4 标准分数标准分数 (standard score)n n注意注意注意注意(zh y)(zh y):n n 也称标准化值也称标准化值也称标准化值也称标准化值n n对某一个值在一组数据中相对位置的度对某一个值在一组数据中相对位置的度对某一个值在一组数据中相对位置的度对某一个值在一组数据中相对位置的度 量量量量n n可用于判断一组数据是否有离群点可用于判断一组数据是否有离群点可用于判断一组数据是否有离群点可用于判断一组数据是否有离群点n n用于对

49、变量的标准化处理用于对变量的标准化处理用于对变量的标准化处理用于对变量的标准化处理n n 计算公式为计算公式为计算公式为计算公式为第63页/共82页第六十四页,共82页。标准分数标准分数(性质性质(xngzh)n n注注意意:z z分分数数只只是是将将原原始始数数据据进进行行了了线线性性变变换换,它它并并没没有有改改变变(gibin)(gibin)一一个个数数据据在在改改组组数数据据中中的的位位置置,也也没没有有改改变变(gibin)(gibin)该该组组数数分分布布的的形形状状,而只是将该组数据变为均值为而只是将该组数据变为均值为0 0,标准差为,标准差为1 1。第64页/共82页第六十五页

50、,共82页。标准分数标准分数(性质性质(xngzh)均值等于(dngy)02.方差等于(dngy)1第65页/共82页第六十六页,共82页。标准化值标准化值(例题例题(lt)分析分析)9个家庭人均月收入标准化值计算表个家庭人均月收入标准化值计算表 家庭编号家庭编号人均月收入(元)人均月收入(元)标准化值标准化值 z 1234567891500 750 7801080 850 960200012501630 0.695-1.042-0.973-0.278-0.811-0.556 1.853 0.116 0.996第66页/共82页第六十七页,共82页。)离散(lsn)系数(coefficient

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 管理文献 > 管理工具

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com