专题一-统计数据分析——统计数据概述..ppt

上传人:得****1 文档编号:75131638 上传时间:2023-03-02 格式:PPT 页数:46 大小:864.50KB
返回 下载 相关 举报
专题一-统计数据分析——统计数据概述..ppt_第1页
第1页 / 共46页
专题一-统计数据分析——统计数据概述..ppt_第2页
第2页 / 共46页
点击查看更多>>
资源描述

《专题一-统计数据分析——统计数据概述..ppt》由会员分享,可在线阅读,更多相关《专题一-统计数据分析——统计数据概述..ppt(46页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、专题一专题一 统计数据概述统计数据概述商务统计商务统计本章主要介绍了:本章主要介绍了:u数据来源数据来源u数据的计量尺度数据的计量尺度u数据的类别数据的类别u数据的整理数据的整理第一节第一节 数据来源数据来源 (data source)data source)数据的来源一般有直接和间接两种来源:数据的来源一般有直接和间接两种来源:直接来源直接来源间接来源间接来源原始数据(原始数据(rawdata)一般通过统计调查、统计实验等手段获得;一般通过统计调查、统计实验等手段获得;次级数据(次级数据(secondarydata)一般通过查阅、购买等手段获得。一般通过查阅、购买等手段获得。数据获得渠道数据

2、获得渠道 对于公司来说,所需要的数据主要是公司自对于公司来说,所需要的数据主要是公司自身的数据,这可以从公司的各种记录中得到;行身的数据,这可以从公司的各种记录中得到;行业数据、市场数据等可以通过自己组织调查或从业数据、市场数据等可以通过自己组织调查或从咨询调查公司购买得到;宏观数据则可以从政府咨询调查公司购买得到;宏观数据则可以从政府部门发布的年鉴、报告获得。还有一种就是通过部门发布的年鉴、报告获得。还有一种就是通过统计实验活动数据。统计实验活动数据。对于政府发布的数据,一个重要获得途径是对于政府发布的数据,一个重要获得途径是政府网站。政府网站。Example:公司内部数据公司内部数据职员记

3、录职员记录:姓名、地址、社会保障号码、工薪、任姓名、地址、社会保障号码、工薪、任职状况、其他个人情况;职状况、其他个人情况;生产记录生产记录:部件或产品、生产量、管理成本、原料部件或产品、生产量、管理成本、原料成本等;成本等;销售记录销售记录:产品、销售量、区域销售量、客户类型产品、销售量、区域销售量、客户类型销售量、营销成本等;销售量、营销成本等;信用记录信用记录:客户名称、地址、电话、信用限额、应客户名称、地址、电话、信用限额、应收帐款余额;收帐款余额;客户记录客户记录:年龄、性别、收入水平、家庭情况、地年龄、性别、收入水平、家庭情况、地址、爱好。址、爱好。Example:从专门收集和维护

4、数据的组织中获从专门收集和维护数据的组织中获得商务和经济数据得商务和经济数据国外国外如:邓布拉斯公司如:邓布拉斯公司(Dun&Bradstreet)、道、道-琼斯公司是两个向客户提琼斯公司是两个向客户提供大量商业数据的公司供大量商业数据的公司;国内国内 如:央视调查咨询中心、零点市场如:央视调查咨询中心、零点市场调查与分析公司调查与分析公司。Example:试验数据试验数据例如:制药公司通过实验了解一种新药是否会影响例如:制药公司通过实验了解一种新药是否会影响血压或其他副作用;血压或其他副作用;又如,在正式实施某一策略前,进行小规模的试点,又如,在正式实施某一策略前,进行小规模的试点,等等等等

5、Example:政府机构是数据的重要来源政府机构是数据的重要来源中国统计年鉴及各省市地区统计年鉴中国统计年鉴及各省市地区统计年鉴各级政府工作报告各级政府工作报告国务院各有关部委发布的公告国务院各有关部委发布的公告其他官方资料其他官方资料Appendix:常用的一些免费数据网络地址常用的一些免费数据网络地址中国国家统计局以及各省市统计局官方网站中国国家统计局以及各省市统计局官方网站http:/中国劳动社会保障部中国劳动社会保障部http:/国家外汇管理局国家外汇管理局http:/ of Commerce Bureau of Economic Analysis)http:/www.bea.gov美

6、国劳工部(美国劳工部(BLS,U.S.Department of Labor Bureau of Labor Statistics)http:/www.bls.gov第二节第二节 数据的计量尺度数据的计量尺度 (Scales of Measurement)统计数据统计数据是对客观现象采用某种计量尺度对事物是对客观现象采用某种计量尺度对事物进行计量的结果进行计量的结果。Data are the facts and figures that are collected,analyzed,and summarized for presentation and interpretation.按照对事物

7、计量的精确程度,可将所采用的按照对事物计量的精确程度,可将所采用的计量尺度由低级到高级分为四个层次:计量尺度由低级到高级分为四个层次:定类尺度定类尺度(NominalScale)定序尺度定序尺度(OrdinalScale)定距尺度定距尺度(IntervalScale)定比尺度定比尺度(RatioScale)定类尺度(列名尺度),按照事物的某种属性对其进行平定类尺度(列名尺度),按照事物的某种属性对其进行平行的分类或分组。行的分类或分组。例例1 1:人的性别(男、女);企业的所有制性质(国有、:人的性别(男、女);企业的所有制性质(国有、私营等)私营等)u 特点特点1 1、定类尺度只测度了事物之

8、间的类别差,而对各类之间、定类尺度只测度了事物之间的类别差,而对各类之间的其他差别却无法从中得知,因此各类地位相同,顺序可以的其他差别却无法从中得知,因此各类地位相同,顺序可以任意改变;具有对称性和传递性的特点。任意改变;具有对称性和传递性的特点。(对称性:对称性:A A对对B B的关系,也就是的关系,也就是B B对对A A的关系;的关系;传递性:传递性:A=B B=CA=B B=C,也即,也即A=CA=C)2 2、对定类尺度的计量结果,可以且只能计算每一类别中、对定类尺度的计量结果,可以且只能计算每一类别中各元素个体出现的频数各元素个体出现的频数(frequency)。注意注意 对事物进行分

9、类时,必须符合穷尽对事物进行分类时,必须符合穷尽(exhaustive)和互斥和互斥(mutuallyexclusive)要求要求。一、定类尺度一、定类尺度定序尺度(顺序尺度),是对事物之间等级或顺序差别定序尺度(顺序尺度),是对事物之间等级或顺序差别的一种测度。的一种测度。例例2 2:产品等级(一等品、二等品、产品等级(一等品、二等品、)考试成绩(优、良、中、可、差)考试成绩(优、良、中、可、差)u特点特点:1 1、不仅可以测度类别差(分类),还可以测度次序差、不仅可以测度类别差(分类),还可以测度次序差(比较优劣或排序);具有传递性(比较优劣或排序);具有传递性(ABAB,BC,BC,则则

10、ACAC),不),不具有对称性。具有对称性。2 2、无法测出类别之间的准确差值,因此该尺度的计量结、无法测出类别之间的准确差值,因此该尺度的计量结果只能排序,不能进行算术运算果只能排序,不能进行算术运算。二、定序尺度二、定序尺度定距尺度(间隔尺度),是对事物类别或次序之间间距定距尺度(间隔尺度),是对事物类别或次序之间间距的测度。的测度。例例3 3:100100分制考试成绩;分制考试成绩;摄氏温度对不同地区温度的测量。摄氏温度对不同地区温度的测量。u特点特点:1 1、具有定序尺度的所有特征,不仅能将事物区分为不同、具有定序尺度的所有特征,不仅能将事物区分为不同类型并进行排序,而且可准确指出类别

11、之间的差距是多少;类型并进行排序,而且可准确指出类别之间的差距是多少;2 2、定距尺度通常以自然或物理单位为计量尺度,因此测、定距尺度通常以自然或物理单位为计量尺度,因此测量结果表现为数值;量结果表现为数值;3 3、计量结果可以进行加减运算、计量结果可以进行加减运算(加减运算有意义加减运算有意义);4 4、“0 0”是测量尺度上的一个测量点,并不代表是测量尺度上的一个测量点,并不代表“没有没有”三、定距尺度三、定距尺度定比尺度(比率尺度):是能够测算两个测度值之间比值定比尺度(比率尺度):是能够测算两个测度值之间比值的一种计量尺度。的一种计量尺度。例例4 4:职工月收入;企业产值;公制的距离、

12、重量:职工月收入;企业产值;公制的距离、重量u特点特点:1 1、与定距尺度属于同一层次,具有定距尺度的所有特征,、与定距尺度属于同一层次,具有定距尺度的所有特征,而且存在绝对零点。计量结果表现为数值;而且存在绝对零点。计量结果表现为数值;2 2、除了具有其他三种计量尺度的计算特点外,还具有可计、除了具有其他三种计量尺度的计算特点外,还具有可计算两个测度值之间比值的特点;算两个测度值之间比值的特点;3 3、“0 0”表示表示“没有没有”,即它有一固定的绝对,即它有一固定的绝对“零点零点”,因此它可进行加、减、乘、除运算。因此它可进行加、减、乘、除运算。四、定比尺度四、定比尺度注意注意:定距尺度中

13、的定距尺度中的“0 0”并不表示并不表示“没有没有”,不是一个绝对的,不是一个绝对的“零点零点”;而定比尺度中的;而定比尺度中的“0 0”表示表示“没有没有”,是一个绝对的,是一个绝对的“零点零点”。摄氏温度中的摄氏温度中的0 0度不是绝对零点;度不是绝对零点;热力学温度中的热力学温度中的0K0K可以认为是绝对零点。可以认为是绝对零点。1 1、四种计量尺度对事物的计量层次是由低级到高级、由、四种计量尺度对事物的计量层次是由低级到高级、由粗略到精确逐步递进的。粗略到精确逐步递进的。2 2、高层次的计量尺度可以计量低层次计量尺度能够计量、高层次的计量尺度可以计量低层次计量尺度能够计量的事物,但反之

14、不行;的事物,但反之不行;3 3、可将高层次计量尺度的计量结果转换为低层次计量尺、可将高层次计量尺度的计量结果转换为低层次计量尺度的计量结果,但不能反过来。度的计量结果,但不能反过来。Summarization:四种计量尺度的区别与联系四种计量尺度的区别与联系 Exercises指出下面变量的测量尺度:指出下面变量的测量尺度:学生住址距学校的距离;学生住址距学校的距离;学生某门课的一次测验成绩(百分制);学生某门课的一次测验成绩(百分制);学生的出生地;学生的出生地;按年级分类的高校学生;按年级分类的高校学生;每周学生学习的小时数;每周学生学习的小时数;夏季室外温度。夏季室外温度。第三节第三节

15、 数据的分类数据的分类u 从数据的表现形式不同:从数据的表现形式不同:定性数据和定量数据定性数据和定量数据u 从计量尺度的不同:从计量尺度的不同:定类数据、定序数据、定距数据和定比数据定类数据、定序数据、定距数据和定比数据u 从数据的反映方式不同:从数据的反映方式不同:绝对数、相对数和平均数绝对数、相对数和平均数u 从样本性质不同:从样本性质不同:截面数据、时间序列和面板数据截面数据、时间序列和面板数据u 从数据反映的范围不同:从数据反映的范围不同:总体数据和样本数据总体数据和样本数据u 从数据内容不同:宏观经济数据、微观经济数据、从数据内容不同:宏观经济数据、微观经济数据、社会学数据、自然科

16、学数据等等社会学数据、自然科学数据等等 从不同的角度可以对数据进行分类从不同的角度可以对数据进行分类一、数据表现形式不同一、数据表现形式不同u 定性数据定性数据(Qualitative data)说明的是事物的品质特征,不能用数值表示(可以采用说明的是事物的品质特征,不能用数值表示(可以采用一定技术手段进行定量化),由定类尺度或定序尺度计量形一定技术手段进行定量化),由定类尺度或定序尺度计量形成;成;u 定量数据定量数据 (Quantitative data)说明的是事物的数量特征,能够用数值表示,由定距尺说明的是事物的数量特征,能够用数值表示,由定距尺度或定比尺度计量形成度或定比尺度计量形成

17、。对不同类型的数据,采用的统计方法会有所不同对不同类型的数据,采用的统计方法会有所不同 定性数据采用的分析方法较少:如组频率、非参数统计定性数据采用的分析方法较少:如组频率、非参数统计方法等;定量数据除了可采用定性数据的分析方法外,还可方法等;定量数据除了可采用定性数据的分析方法外,还可以采用更多的统计分析方法以采用更多的统计分析方法。二、按计量尺度的数据分类二、按计量尺度的数据分类u定类数据定类数据:对称性和传递性(如性别、门牌号、生产日期)对称性和传递性(如性别、门牌号、生产日期)u定序数据定序数据:传递性(如产品等级、学历等):传递性(如产品等级、学历等)u定距数据定距数据:可比较相对大

18、小(如温度)可比较相对大小(如温度)u定比数据定比数据:具有绝对零点,可比较相对大小和绝对大小:具有绝对零点,可比较相对大小和绝对大小(如收入、支出、产值、人口数等)(如收入、支出、产值、人口数等)定类数据和定序数据属于定性数据,定距数据和定比数据定类数据和定序数据属于定性数据,定距数据和定比数据属于定量数据属于定量数据。商务统计商务统计 实践中,对于通过计数和数学运算得到的定量数据具有三种实践中,对于通过计数和数学运算得到的定量数据具有三种基本表现形式:绝对数、相对数和平均数。(均可现实解释)基本表现形式:绝对数、相对数和平均数。(均可现实解释)三、数据反映形式不同(经济统计中)三、数据反映

19、形式不同(经济统计中)1 1、绝对数、绝对数(Absolutenumber)绝对数是统计数据的最基本表现形式,表明事物(现绝对数是统计数据的最基本表现形式,表明事物(现象)的绝对数量特征,即绝对规模或水平。象)的绝对数量特征,即绝对规模或水平。如:人口、如:人口、GDPGDP、进口额、出口额、商品零售额等、进口额、出口额、商品零售额等绝对数由于反映的是现实中的现象规模和水平,因此具有绝对数由于反映的是现实中的现象规模和水平,因此具有计量单位:计量单位:实物单位(吨、公里)实物单位(吨、公里)价值单位(元、万元)、价值单位(元、万元)、复合单位(吨公里、千瓦时)复合单位(吨公里、千瓦时)双重双重

20、/多重单位(马力多重单位(马力/台、吨台、吨/(立方米(立方米座座年)年)时期数和时点数特点时期数和时点数特点:1 1、时期数可连续计量,并可累加;、时期数可连续计量,并可累加;2 2、时点数只可间断计量,一般不能累加(累加无现实解、时点数只可间断计量,一般不能累加(累加无现实解释)。释)。绝对数按其反映事物现象的时间状况不同可分为时期数绝对数按其反映事物现象的时间状况不同可分为时期数和时点数:和时点数:时期数(时期数(periodicalnumber)反映事物现象在一定反映事物现象在一定时期内的总量,如:产量、产值、出生人口;时期内的总量,如:产量、产值、出生人口;时点数时点数(time-p

21、ointnumber)反映事物现象在某一瞬反映事物现象在某一瞬间时刻上的总量,如:人口数、土地面积等。间时刻上的总量,如:人口数、土地面积等。2 2、相对数(、相对数(relativenumber)相对数是一般是两个绝对数的比值,反映事物的相对水相对数是一般是两个绝对数的比值,反映事物的相对水平;但有时也可以是两个相对数或者两个平均数的对比。平;但有时也可以是两个相对数或者两个平均数的对比。u相对数的表现形式:相对数的表现形式:比例、比率。比例、比率。例例5 5:一数量为一数量为N N的总体被分为的总体被分为K K个部分,各部分的数量分别个部分,各部分的数量分别为为 N Ni i,则比例定义为

22、:,则比例定义为:N Ni i/N/N。显然有:。显然有:比例比例(ProportionProportion):总体中各个部分的数量占总体数量的比重,反映总总体中各个部分的数量占总体数量的比重,反映总体的构成或结构体的构成或结构。一般以百分数等表示一般以百分数等表示。百分数(百分数(PercentagePercentage):将对比的基数抽象化为):将对比的基数抽象化为100100而计算的相对数。而计算的相对数。比率比率(RationRation):各不同类别的数量比值。各不同类别的数量比值。可以是同一总体中不同部分的比较可以是同一总体中不同部分的比较(系数、倍数)(系数、倍数)如,人口中:男

23、性人口数如,人口中:男性人口数/女性人口数;女性人口数;GDPGDP中:投资中:投资/消费;消费;可以是同一现象在不同空间上的对比可以是同一现象在不同空间上的对比(系数、倍数(系数、倍数)如,不同地区如,不同地区GDPGDP之比之比 两个地区经济水平差异两个地区经济水平差异 可以是同一总体同一现象在不同时空的对比,即速度可以是同一总体同一现象在不同时空的对比,即速度(%)如,不同年份如,不同年份GDPGDP之比之比 经济发展速度经济发展速度 可以是不同现象绝对数之间的对比,即强度相对数可以是不同现象绝对数之间的对比,即强度相对数 如,人均如,人均GDPGDP、数字电视普及率、外贸依存度等、数字

24、电视普及率、外贸依存度等 可以是不同相对数或平均数对比(系数、倍数)可以是不同相对数或平均数对比(系数、倍数)如,需求价格弹性、相对汇率等如,需求价格弹性、相对汇率等 3 3、平均数(、平均数(average numberaverage number)一般来说,经济统计中平一般来说,经济统计中平均数是两个绝对数之比,分子均数是两个绝对数之比,分子反映总体某种特征总量,分母则是总体(总体可是某个时间反映总体某种特征总量,分母则是总体(总体可是某个时间跨度)中所包含的元素(元素可以是时期或时点)总数。可跨度)中所包含的元素(元素可以是时期或时点)总数。可以分为空间(静态)平均数和序时(动态)平均数

25、。以分为空间(静态)平均数和序时(动态)平均数。经济统计中,一般要求计算过程和计算结果有实际含义经济统计中,一般要求计算过程和计算结果有实际含义(时点数计算过程除外),因此:(时点数计算过程除外),因此:计算相对数或者平均数的空间(静态)平均数时,总计算相对数或者平均数的空间(静态)平均数时,总是先转化为分子绝对数和分母绝对数,再对比;是先转化为分子绝对数和分母绝对数,再对比;计算相对数或者平均数的序时(动态)平均数时,则是计算相对数或者平均数的序时(动态)平均数时,则是先计算相对数或者平均数分子绝对数、分母绝对数的序先计算相对数或者平均数分子绝对数、分母绝对数的序时平均数,再对比。时平均数,

26、再对比。四、按样本性质不同四、按样本性质不同u截面数据截面数据(Cross-sectional dataCross-sectional data):同一时点或时期的:同一时点或时期的总体各单位的数据。总体各单位的数据。u时间序列数据时间序列数据(Time series dataTime series data):将若干个时间上:将若干个时间上搜集来的反映相同内容的数据按时间先后顺序排列在一起,搜集来的反映相同内容的数据按时间先后顺序排列在一起,便形成了时间序列数据。便形成了时间序列数据。u面板数据(面板数据(Panel dataPanel data):截面数据和时间序列数据交织):截面数据和时

27、间序列数据交织在一起所形成的数据集。面板数据既具有截面数据的特征,在一起所形成的数据集。面板数据既具有截面数据的特征,又具有时间序列数据的特征。又具有时间序列数据的特征。年份年份进口总额进口总额20032003119.3119.32002200293.793.72001200188.088.02000200081.281.21999199955.255.21998199846.946.9表表1 1 辽宁省各年进口总额辽宁省各年进口总额单位:亿美元单位:亿美元资料来源:资料来源:中国统计年鉴中国统计年鉴20042004Example:Time series data地地 区区消费品零售总额消费品

28、零售总额(亿元人民币)(亿元人民币)进口总额进口总额(亿美元)(亿美元)北京北京1916.71916.7516.1516.1天津天津922.3922.3149.9149.9河北河北1841.61841.630.530.5山西山西729.3729.38.28.2内蒙古内蒙古676.8676.816.716.7辽宁辽宁2330.82330.8119.3119.3表表2 20032 2003年中国各地区主要经济指标年中国各地区主要经济指标资料来源:资料来源:中国统计年鉴中国统计年鉴20042004Example:Cross-sectional dataExample:Panel data地区 年份2

29、00320022001200019991998北京1916.71744.81593.51443.31313.31167.2天津922.3941.4832.7736.6657.3587.1河北1841.61968.31778.31613.91458.81332.6山西729.3755.4679.9629.1587.1547.1内蒙古676.8606537.3484437.4399.5辽宁2330.82258.42034.91847.61696.11568.7表表3 3 中国各地区社会消费品零售总额中国各地区社会消费品零售总额资料来源:资料来源:中国统计年鉴中国统计年鉴20042004单位:亿元单

30、位:亿元第四节第四节 数据整理数据整理(Summarizing Data)Summarizing Data)按照升序(按照升序(ascending)ascending)或者降序(或者降序(descendingdescending)将所)将所有数据排列,这是整理的第一步。有数据排列,这是整理的第一步。u排序目的排序目的 通过浏览数据发现一些明显的特征趋势或解决问题的通过浏览数据发现一些明显的特征趋势或解决问题的线索;线索;有助于数据的检查纠错;有助于数据的检查纠错;为分组提供依据。为分组提供依据。一、排序(一、排序(orderingdata)二、数据分组和分布数列二、数据分组和分布数列数据分组数

31、据分组/分类分类(data grouping/classificationdata grouping/classification)统计整理的重要手段。数据分组就是根据研究的需要,统计整理的重要手段。数据分组就是根据研究的需要,将总体按照一定的标志区分为若干个组成部分的一种统计将总体按照一定的标志区分为若干个组成部分的一种统计方法。进行排序分组后,再计算出组频数或频率,列成一方法。进行排序分组后,再计算出组频数或频率,列成一定的表式就是分布数列(定的表式就是分布数列(distribution series)。)。u目的目的 将总体中的具有不同性质元素进行分类,以对数据的将总体中的具有不同性质元

32、素进行分类,以对数据的内部结构进行了解,以便进一步进行统计分析。内部结构进行了解,以便进一步进行统计分析。组内差异小和组间差异大组内差异小和组间差异大 确定组数确定组数 确定组距确定组距(按组按组)整理成分布频数表整理成分布频数表三、分组及频数计算基本步骤三、分组及频数计算基本步骤例例6一会计事务所对其一会计事务所对其2020家客户家客户(clients)(clients)年底帐目辑核年底帐目辑核(audits)(audits)时间(天)统计如下表:时间(天)统计如下表:Table 4 Year-End Audit Times(in days)12 14 19 18 15 15 18 17 2

33、0 27 22 23 22 21 33 28 14 18 16 13这里分组主要指组距数列的分组。这里分组主要指组距数列的分组。u 第一步,确定组数第一步,确定组数(Number of classes)(Number of classes)。组数的确定一。组数的确定一般视数据本身的特点及数据的多少而定。般视数据本身的特点及数据的多少而定。经验上以经验上以5 52020之间为好,尤其注意不要确定太多的组之间为好,尤其注意不要确定太多的组数,使得每组包含的数据太少。数,使得每组包含的数据太少。其中其中N N为数据的个数,一般对结果取整数。为数据的个数,一般对结果取整数。例例9 9中:中:K=1+l

34、g20/lg2=1+4.32=5.32K=1+lg20/lg2=1+4.32=5.32 5 5 实际分组时常按斯特格斯(实际分组时常按斯特格斯(SturgesSturges)提出的经验公)提出的经验公式来确定组数式来确定组数K K:u 第二步,确定组距第二步,确定组距(Width of classes)(Width of classes):组距是一个:组距是一个组的上限与下限之差,可根据全部数据的最大值和最小组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定:值及所分的组数来确定:组距组距=(最大值(最大值 -最小值)最小值)/组数组数 例例6 6中,组距中,组距=(33-1

35、2)/5=4.2=(33-12)/5=4.2,可取整数,可取整数5 5为最后选定为最后选定的组距。的组距。u第三步,确定各组组限第三步,确定各组组限(Class limits)(Class limits)并据此整理频数并据此整理频数分布表分布表。分组所遵循的主要原则是分组所遵循的主要原则是“不重不漏不重不漏”(each data value(each data value belongs to one class and only one class)belongs to one class and only one class)。因此,。因此,最低组限最低组限(The lower class

36、 limit)(The lower class limit)数据的最小值数据的最小值 最大组限最大组限(The upper class limit)(The upper class limit)数据的最大值数据的最大值注意:注意:对离散型数据,可采用相邻两组组限间断的办法解决对离散型数据,可采用相邻两组组限间断的办法解决“不不重重”的问题(如的问题(如6 61010,11111515,16162020等);等);对连续型数据,往往采用相邻两组组限重叠,根据对连续型数据,往往采用相邻两组组限重叠,根据“上限上限不在内原则不在内原则”解决解决“不重不重”问题(如问题(如 5 5,1010),(,(

37、1010,1515),1515,2020)等)。等)。例例6 6是离散型数据(天),采用组限间断方法,因此可得频是离散型数据(天),采用组限间断方法,因此可得频数分布表如下:数分布表如下:Table5Frequencydistribution,relativefrequencyandpercentfrequencydistributionfortheaudit-timedataAuditFrequencyRelativePercentTime(days)FrequencyFrequency10144 0.20 20 1519 8 0.40 40 2024 5 0.25 25 2529 2 0.

38、10 10 3034 1 0.05 5 Total 20 1.00 100 在最大值与最小值与其他数据相差悬殊时,为避免空白组在最大值与最小值与其他数据相差悬殊时,为避免空白组出现,第一组和最后一组可采用出现,第一组和最后一组可采用“XXXX以下以下”及及“XXXX以上以上”这这样的开口组;样的开口组;在组距分组时,如果各组组距相等则称为等距分组,否则在组距分组时,如果各组组距相等则称为等距分组,否则为不等距分组。为不等距分组。不等距分组各组的频数受组距大小不同的影响,因此需不等距分组各组的频数受组距大小不同的影响,因此需要计算频数密度(要计算频数密度(=频数频数/组距),才能准确反映频数分布

39、的组距),才能准确反映频数分布的实际;实际;有时为了统计需要,需进一步计算累积频数(某数值以上有时为了统计需要,需进一步计算累积频数(某数值以上或以下的频之数和)。或以下的频之数和)。一些注意事项一些注意事项四、组中值计算(四、组中值计算(class mark/class midpiont)闭口组:闭口组:开口组:开口组:例例7 7 组中值计算组中值计算 将学生成绩分为:将学生成绩分为:6060分以下,分以下,60607070分,分,70708080分,分,80809090分,分,9090分以上分以上 ,则各组组中值为:,则各组组中值为:60 60以下:以下:60 607070:7070808

40、0:9090以上:以上:五、累计次数分布(五、累计次数分布(cumulative frequency distribution)与计算与计算累计次数分布累计次数分布:某一数值以上或者以下包含的次数或者某一数值以上或者以下包含的次数或者比率总和。两种方法:比率总和。两种方法:向上累计向上累计:低于某变量值的次数或频率总和:低于某变量值的次数或频率总和单项数列:低于某变量值单项数列:低于某变量值组距数列:低于某组上限组距数列:低于某组上限向下累计向下累计:高于某变量值的次数或频率总和:高于某变量值的次数或频率总和单项数列:高于某变量值单项数列:高于某变量值组距数列:高于某组下限组距数列:高于某组下

41、限同一数值的向上累计和向下累计次数之和等于总次数,同一数值的向上累计和向下累计次数之和等于总次数,频率之和等于频率之和等于1 1(100%100%)。)。某班学生统计学成绩累计次数分布表某班学生统计学成绩累计次数分布表4040合合 计计2 27 7111112128 86060以下以下60-7060-7070-8070-8080-9080-909090以上以上向下累计向下累计向上累计向上累计次数次数成绩成绩2 29 920203232404040403838313120208 8例例8 8 等距数列次数分布及累计次数分布等距数列次数分布及累计次数分布Exercises 一家航空公司接受电话订票

42、,下面的资料是随机抽一家航空公司接受电话订票,下面的资料是随机抽出的出的2020个电话订票所花的时间(单位:分钟)个电话订票所花的时间(单位:分钟)2.14.85.510.43.33.54.85.85.35.52.83.65.96.67.810.57.56.04.54.8试根据以上资料,编制频数和频率分布,并计算组中值、试根据以上资料,编制频数和频率分布,并计算组中值、向上和向下累积次数分布。向上和向下累积次数分布。首先确定组数:首先确定组数:再确定组距:再确定组距:订票时间订票时间(分钟)(分钟)订票电话订票电话个数个数订票电话订票电话比率比率%组中值组中值向上累计向上累计向下累计向下累计1-321022203-573549185-7735616117-921081849-1121011202合计合计20100航空公司订票时间分布航空公司订票时间分布

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 工作报告

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com