统计学第三章统计整理新.ppt

上传人:赵** 文档编号:82667017 上传时间:2023-03-26 格式:PPT 页数:89 大小:1,023.50KB
返回 下载 相关 举报
统计学第三章统计整理新.ppt_第1页
第1页 / 共89页
统计学第三章统计整理新.ppt_第2页
第2页 / 共89页
点击查看更多>>
资源描述

《统计学第三章统计整理新.ppt》由会员分享,可在线阅读,更多相关《统计学第三章统计整理新.ppt(89页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、主要内容主要内容2.2数据整理和显示数据整理和显示原始资料杂乱无章,需加整理,才能为人所用。统计资料原始资料杂乱无章,需加整理,才能为人所用。统计资料的整理,其基础是统计分组。通过统计分组以便为在统计分的整理,其基础是统计分组。通过统计分组以便为在统计分析中提炼各种有用信息打下基础。析中提炼各种有用信息打下基础。统计表统计表变量数列的编制变量数列的编制统计图统计图统计分组统计分组一、统计整理的概念一、统计整理的概念1、统计整理:、统计整理:是指根据统计研究目的,对统计所收集是指根据统计研究目的,对统计所收集到的数据进行科学的加工处理,使之条理化、系统化到的数据进行科学的加工处理,使之条理化、系

2、统化成为能反映总体数量特征的统计数据的过程。成为能反映总体数量特征的统计数据的过程。2、统计整理的任务、统计整理的任务(目的目的):一是对原始数据的整理,将反映个体的原始资料进行科一是对原始数据的整理,将反映个体的原始资料进行科学的分类、加工和汇总,转化为说明总体数量特征学的分类、加工和汇总,转化为说明总体数量特征的数据。的数据。二是对次级数据的再整理,使之满足新要求。二是对次级数据的再整理,使之满足新要求。二、统计整理的作用和要求二、统计整理的作用和要求n作用作用n1 1、是统计工作的中间环节起着承上启下的作、是统计工作的中间环节起着承上启下的作用用n2 2、是认识的飞跃。感性认识上升到理性

3、认识。、是认识的飞跃。感性认识上升到理性认识。n要求要求n科学性(质的界限)、充分性(方法和技术)科学性(质的界限)、充分性(方法和技术)和条理性(逻辑关系)和条理性(逻辑关系)n三、统计整理的步骤三、统计整理的步骤n1 1、整理方案设计、整理方案设计n2 2、数据预处理、数据预处理n审核数据(对原始数据从准确性和完整性检查,次级审核数据(对原始数据从准确性和完整性检查,次级资料主要是适用性和时效性检查)资料主要是适用性和时效性检查)n数据筛选(剔除不符合要求的数据或筛选出符合要求数据筛选(剔除不符合要求的数据或筛选出符合要求的数据)的数据)n数据排序(发现数据的特征和趋势)数据排序(发现数据

4、的特征和趋势)n3 3、统计分组和汇总(关键)、统计分组和汇总(关键)n4 4、统计数据的显示。编制统计表、图(表现形式)、统计数据的显示。编制统计表、图(表现形式)n5 5、统计数据的保存和公布。、统计数据的保存和公布。2.2.3 2.2.3 统计分组统计分组一、统计分组的定义与性质一、统计分组的定义与性质 1 1、定义、定义 根据统计研究目的和现象总体的内在特点,把统计总体按照根据统计研究目的和现象总体的内在特点,把统计总体按照一定标志划分为若干性质不同而又有联系的一定标志划分为若干性质不同而又有联系的几个部分几个部分的统计方的统计方法,称为统计分组。法,称为统计分组。2 2、目的:、目的

5、:组内同质,组间异质组内同质,组间异质 3 3、方向:、方向:对于总体而言,是对于总体而言,是“分分”,对于总体单位而言,是,对于总体单位而言,是“合合”。故分组可以有两个方向:识(判)别与聚类。故分组可以有两个方向:识(判)别与聚类。4 4、关键:、关键:选择分组标志和划分各组界限选择分组标志和划分各组界限 5 5、原则:、原则:n穷尽原则穷尽原则,使总体中的每一个单位都应有组可归,或者说,使总体中的每一个单位都应有组可归,或者说各分组的空间足以容纳总体所有的单位。各分组的空间足以容纳总体所有的单位。n互斥原则互斥原则,在特定的分组标志下,总体中的任何一个单位,在特定的分组标志下,总体中的任

6、何一个单位的只能归属于某一组,而不能同时或可能归属于几个组。的只能归属于某一组,而不能同时或可能归属于几个组。统计分组的性质统计分组的性质n1 1、统计分组兼有分和合的功能、统计分组兼有分和合的功能n2 2、统计分组必须遵循互斥原则和穷尽原则、统计分组必须遵循互斥原则和穷尽原则n3 3、统计分组目的是要使、统计分组目的是要使组内同质,组间异质组内同质,组间异质n4 4、统计分组在某一标志的统计分组在某一标志的组间异质的同时却组间异质的同时却可能掩盖其他标志的组间差异可能掩盖其他标志的组间差异n5 5、统计分组关键选择分组标志划分各组界限、统计分组关键选择分组标志划分各组界限非运动员非运动员运动

7、员运动员属于哪一组?(待识别)属于哪一组?(待识别)性别分组性别分组运动与否分组运动与否分组把总把总体按体按两个两个标志标志切成切成四块四块n正确选择分组标志的原则:正确选择分组标志的原则:n1 1、根据研究目的选择、根据研究目的选择n2 2、选择反映本质特征的标志、选择反映本质特征的标志(研究人们生活水研究人们生活水平的高低用工资水平还是家庭成员平均收入水平的高低用工资水平还是家庭成员平均收入水平为标志呢平为标志呢)n3 3、根据历史和经济条件的变化选择、根据历史和经济条件的变化选择二、统计分组的作用二、统计分组的作用 1 1、划分现象总体的类型、划分现象总体的类型、划分现象总体的类型、划分

8、现象总体的类型 例如,对经济活动单位按产业进行分类,例如,对经济活动单位按产业进行分类,例如,对经济活动单位按产业进行分类,例如,对经济活动单位按产业进行分类,有第一次产业(大农有第一次产业(大农有第一次产业(大农有第一次产业(大农业)业)业)业)、第二次产业(工业与建筑业)第二次产业(工业与建筑业)第二次产业(工业与建筑业)第二次产业(工业与建筑业)、第三次产业(流通与服务第三次产业(流通与服务第三次产业(流通与服务第三次产业(流通与服务部门)部门)部门)部门)。对经济活动单位按所有制性质进行分类对经济活动单位按所有制性质进行分类对经济活动单位按所有制性质进行分类对经济活动单位按所有制性质进

9、行分类 2 2 2 2、反映总体内部的构成及其变化、反映总体内部的构成及其变化、反映总体内部的构成及其变化、反映总体内部的构成及其变化例如,产业结构、消费结构、人口结构(年龄结构、性别结构、例如,产业结构、消费结构、人口结构(年龄结构、性别结构、例如,产业结构、消费结构、人口结构(年龄结构、性别结构、例如,产业结构、消费结构、人口结构(年龄结构、性别结构、民族结构)。恩格尔定律民族结构)。恩格尔定律民族结构)。恩格尔定律民族结构)。恩格尔定律例:某市按例:某市按GDP计算的三次产业结构(计算的三次产业结构(%)2006年年 2007年年2008年年 2009年年GDP100100100100第

10、一产业第一产业3.24.32.52.3第二产业第二产业75.763.854.552.2第三产业第三产业21.131.943.045.5n某省城镇居民人均消费性支出构成表n城镇居民n2007%2008%n消费性支出100.0100.0n食品51.336.3n衣着12.98.4n家庭设备用品及支出9.611.7n医疗保健2.66.7n交通和通讯3.38.7n娱乐教育文化9.113.4n居住6.09.1n杂项商品和服务5.25.7n从表中可明显看出,某省城镇居民消费支出中,食品消费、衣着消费支出所占比重下降,而交通和通讯、娱乐教育文化、医疗保健等方面的支出上升,消费结构不断优化。3研究现象之间的依存

11、关系研究现象之间的依存关系例:某年中国农民家庭按收入分组的恩格尔系数例:某年中国农民家庭按收入分组的恩格尔系数按收入分组(元)按收入分组(元)2003004005006008001000恩格尔系数(恩格尔系数(%)64.960.256.754.450.549.943.6三、统计分组的种类三、统计分组的种类按分组目的或按分组目的或者作用划分者作用划分类型分组类型分组结构分组结构分组分析分组分析分组按分组标志按分组标志性质划分性质划分品质标志分组品质标志分组数量标志分组数量标志分组按分组标志按分组标志多少划分多少划分简单分组简单分组复合分组复合分组品品质质标标志志分分组组:人人口口按按性性别别、职

12、职业业、地地区区、职职称称分分类等。类等。数数量量标标志志分分组组:按按收收入入、成成绩绩的的多多少少等等等等,通通过过这这种种分分组组,可可以以反反映映各各组组间间的的数数量量差差异异及及其其质质方方面的变化。面的变化。教师按职称分组教师按职称分组人数人数年人均科研分值年人均科研分值正高正高副高副高中级中级初级初级1253204105538.512.38.82.1合计合计910教师按开课门数分组教师按开课门数分组人数人数比重比重%123456190450160722810合计合计910XXXX大学教师按职称分组的科研统计大学教师按职称分组的科研统计XXXX大学教师按开课门数分组情况大学教师按

13、开课门数分组情况 简简单单分分组组是是指指按按一一个个标标志志进进行行的的分分组组,只只说说明明社社会会现现象象在在某某一一方方面面的的特特征征。如如人人口口按按性性别别分组,居民按消费支出分组等。分组,居民按消费支出分组等。复复合合分分组组是是社社会会现现象象按按两两个个或或两两个个以以上上的的标标志志层层叠叠进进行行分分组组。如如企企业业职职工工在在按按性性别别分分组组的同时又按文化程度分组。的同时又按文化程度分组。复复合合分分组组适适合合于于被被研研究究的的社社会会现现象象所所包包含含的的单位数较多的情况。单位数较多的情况。2.2.42.2.4分分(配配)布数列布数列一、分配数列的概念、

14、组成要素及分类一、分配数列的概念、组成要素及分类1、概念、概念在统计分组的基础上,把总体的所有单位按组归类,并计算在统计分组的基础上,把总体的所有单位按组归类,并计算各组的个体数,就形成分配数列,也称为统计分布。各组的个体数,就形成分配数列,也称为统计分布。2、要素、要素分配数列包括两个要素:分配数列包括两个要素:(1)统计分组所形成的各组统计分组所形成的各组(2)各组次数(频数)或者频率各组次数(频数)或者频率n所谓频数所谓频数f f(次数):分配在各组的个体数称为频数,次数):分配在各组的个体数称为频数,分别以分别以f f1 1f f2 2表示。各组频数之和等于总频数。表示。各组频数之和等

15、于总频数。n所谓频率,就是指各组频数在总频数(总次数)中所谓频率,就是指各组频数在总频数(总次数)中所占的比重,以所占的比重,以 表示。表示。3 3、种类、种类n根据统计分组标志的性质不同,分布数列有:根据统计分组标志的性质不同,分布数列有:n品质数列品质数列:按品质标志分组所形成的分布数列。:按品质标志分组所形成的分布数列。体现现象质上的差别且较稳定。体现现象质上的差别且较稳定。变量数列变量数列:按数量标志分组所形成的分布数列。:按数量标志分组所形成的分布数列。体现现象量上的差别且有多种编制方法。体现现象量上的差别且有多种编制方法。变量数列单项数列 组距数列等距数列 异距数列(1 1)组限(

16、上限,)组限(上限,下限)下限)(2 2)组距)组距=上限上限-下限下限 =U-L=D=U-L=D二、编制步骤二、编制步骤 计算全距计算全距1 1、分析资料、分析资料变量的性质变量的性质 变量值的分布是否均匀变量值的分布是否均匀n单项数列单项数列na)概念概念单一变量值为一组的变量数列;单一变量值为一组的变量数列;nb)适适用用范范围围:变变动动范范围围不不大大的的离离散散变变量量和和取取整整数的连续变量。数的连续变量。nc)特点:保持资料真实性,特点:保持资料真实性,nd)编编制制步步骤骤:确确定定组组数数,把把总总体体单单位位分分配配在在相相应各组。应各组。n组距数列的编制组距数列的编制:

17、na.)概念概念以区间表示一个组的变量数列以区间表示一个组的变量数列;nb.)适适用用范范围围:连连续续变变量量、变变动动范范围围大大的的离离散散变量变量;nc.)特点:掩盖资料真实性,特点:掩盖资料真实性,nd.)步步骤骤:确确定定组组距距、组组数数;确确定定等等距距或或异异距距;确定组限确定组限;计;计算组中值。算组中值。居民按家庭储蓄居民按家庭储蓄存款额分组存款额分组居民户数居民户数(户)(户)平均每户年总平均每户年总收入(万元)收入(万元)5万元以下万元以下510万元万元1020万元万元2050万元万元50100万元万元100万元以上万元以上12035056028090201.522.

18、854.9512.6025.8648.60合计合计1420某地区不同存款规模家庭的年收入情况某地区不同存款规模家庭的年收入情况职工按年龄分组职工按年龄分组人数人数2030304040505060120280300210合计合计910企业职工按年龄分组企业职工按年龄分组数量标志分组数量标志分组(不等距分不等距分组组).适用于现象性质变化适用于现象性质变化不均匀的连续型变量及取不均匀的连续型变量及取值范围很大的离散型变量值范围很大的离散型变量数量标志分组数量标志分组(等距分组等距分组).适用于现象性质变化均匀适用于现象性质变化均匀的连续型变量及取值范围的连续型变量及取值范围很大的离散型变量很大的离

19、散型变量2 2、确定组距和组数、确定组距和组数 原则:能清晰反映数据的分布特征原则:能清晰反映数据的分布特征。注意的问题n(1 1)一般情况下应采用等距数列)一般情况下应采用等距数列 便便于于进进行行统统计计分分析析时时不不受受组组距距不不等等的的影影响,也便于制图、计算。响,也便于制图、计算。n(2 2)经经验验表表明明,对对于于任任一一个个特特征征来来说说,分组组数不应多于分组组数不应多于2020个。个。(3 3)为为了了选选择择组组距距长长度度的的最最佳佳值值,既既不不使使变变量量数数列列很很庞庞大大,又又不不使使现现象象的的特特征征被被掩掩盖盖,通通常常采采用用下下列公式计算:列公式计

20、算:式式中中x xmaxmax和和x xminmin分分别别表表示示总总体体中中的的最最大大值值和和最最小小值值,N N表示总体单位的总数,表示总体单位的总数,1gN1gN表示数表示数N N的十进位对数。的十进位对数。例如,在所研究的总体里例如,在所研究的总体里(N=1000)(N=1000),年龄如果在年龄如果在2020岁至岁至6060岁之间变化,那么:岁之间变化,那么:即区间(组距)长度应等于即区间(组距)长度应等于4 4岁岁此外对于等距数列来说,其组数的确定还此外对于等距数列来说,其组数的确定还可参考如下两个公式:可参考如下两个公式:n=R/d n=1+3.322 (N为总体单位数)(4

21、 4)根据标志值性质编制异距数列,根据标志值性质编制异距数列,异距异距数列在分析时,为消除组距的影响需计算频数列在分析时,为消除组距的影响需计算频数(率)密度。数(率)密度。频数(率)密度频数(率)密度=频数(率)频数(率)/组距组距n例如,按例如,按“家庭藏书的数目家庭藏书的数目”这一特征对家庭这一特征对家庭分组时,根据已经了解到的情况,多数家庭的分组时,根据已经了解到的情况,多数家庭的藏书在藏书在500500册以下,很少有藏书一万册的家庭,册以下,很少有藏书一万册的家庭,这时应采用长度不等的组距:这时应采用长度不等的组距:n150150,5110051100,101200101200,20

22、1300201300,301500301500,501700501700,70110007011000,1001100120002000,2001500020015000,500110000500110000。小孩按年龄分组小孩按年龄分组人数(人)人数(人)比重比重%次数密度次数密度%1岁以下(新生儿)岁以下(新生儿)8881-3(婴儿)(婴儿)17178.54-6(幼儿)(幼儿)272713.57-14(儿童)(儿童)48486.86合计合计100100n3 3、组距数列的界限和组中值的确定、组距数列的界限和组中值的确定。n对对于于离离散散型型特特征征来来说说,区区间间界界限限的的确确定定是

23、上限和下限不重叠。是上限和下限不重叠。n对对于于连连续续型型特特征征来来说说,上上限限和和下下限限重重叠叠并遵循并遵循“上限不在内上限不在内”原则。原则。n此此外外如如资资料料中中出出现现极极大大值值或或极极小小值值还还可可编制开口组即编制开口组即xxxx以下或以下或xxxx以上以上n组距数列组中值的计算。假定各组次数组距数列组中值的计算。假定各组次数分布是均匀的条件下分布是均匀的条件下n组中值组中值=(上限(上限+下限)下限)/2/2n意义意义:近似代表一组变量值的平均水平近似代表一组变量值的平均水平n开口组的组中值计算:按邻组组距推算开口组的组中值计算:按邻组组距推算4 4、各单位依组归类

24、就形成变量数列、各单位依组归类就形成变量数列我们下面举例说明变量数列的编制。例如假定某研究所30位研究人员的月工资资料如下:n106、84、110、91、109、91、111、107、121、105、99、94、119、88、118、97、103、106、95、106、85、106、101、105、96、105、107、128、111、101。n从资料看可知最大值为128元,最小值为84元。可选择10为组距,编制等距区间数列如表所示:某研究所研究人员月工资分配表月工资分组(元)月工资分组(元)人人 数数80-9080-90390-1007100-11013110-1205120-1302合计合

25、计30n编制变量数列的目的是从数据中提取对编制变量数列的目的是从数据中提取对我们探索内在数量规律有用的信息。我们探索内在数量规律有用的信息。n经整理后,我们大致可以看出该所研究经整理后,我们大致可以看出该所研究人员月工资的分布规律,人员月工资的分布规律,即大多数人的即大多数人的工资在工资在100-110100-110元间,形成两头小中间大元间,形成两头小中间大的规律的规律。但。但80-10080-100元低收入的两组人数元低收入的两组人数比比110-130110-130元之间的高收入两组人数多,元之间的高收入两组人数多,因而是不对称分布。因而是不对称分布。n但但是是经经整整理理编编制制分分布布

26、数数列列后后,原原始始数数据据丢丢失失,看看不不出出各各个个单单位位具具体体的的标标志志值值,计算出来的指标都是近似值计算出来的指标都是近似值n三、频率分布三、频率分布n(一)频率分布性质(一)频率分布性质n1、01n2、n(二)频率分布图:(二)频率分布图:根据变量的层次,反映定类和定序变量的频率分布根据变量的层次,反映定类和定序变量的频率分布可用条形图,反映定距及以上的变量的分布可用直方图、折线图和曲线可用条形图,反映定距及以上的变量的分布可用直方图、折线图和曲线图。图。n1条条形形图图:是是用用长长条条的的高高度度来来表表示示资资料料的的次次数数类类别别的的次次数数或或频频率率。而而长长

27、条条的的宽宽度度没没有有意意义义,一一般般都都画画成成等等宽宽长长条条。如如果果是是定定类类变变量量,图图形形画画成成离离散散的的长长条条,如如果果是是定定序序变变量量,则则长长条条的的排排列列次次序序应应与与变变量量取取值值的的次次序序相一致,且图形可画成紧挨的长条或离散的长条。:相一致,且图形可画成紧挨的长条或离散的长条。:n人数人数n600n500n400n300n200n100n教授教授 副教授副教授讲师讲师助教助教其他其他2、直方图:直方的面积表示次数分布。、直方图:直方的面积表示次数分布。直方图从图形来直方图从图形来看,也是由紧挨的长条所组成,但它与看,也是由紧挨的长条所组成,但它

28、与条形图不同条形图不同,直方,直方图的宽度是有意义的。一般说,直方图是以长条的面积图的宽度是有意义的。一般说,直方图是以长条的面积(长与宽的乘积)来表示频数或频率。而条形的长度,即(长与宽的乘积)来表示频数或频率。而条形的长度,即纵轴高度表示的是频数密度或频率密度。对于等距分组,纵轴高度表示的是频数密度或频率密度。对于等距分组,用频数或频数密度作为条形的高度,图形的相对比例关系用频数或频数密度作为条形的高度,图形的相对比例关系是不变的,因此仍可以用频数作为条形高度。是不变的,因此仍可以用频数作为条形高度。但异距数列就必须用频数密度但异距数列就必须用频数密度,否则会产生错误。,否则会产生错误。n

29、例如:婚龄统计例如:婚龄统计 直接比较频数不对直接比较频数不对。n26-27 3026-27 30n40-50 3540-50 35n3 3、折线图:用直线连接直方图中条形顶端、折线图:用直线连接直方图中条形顶端的中点,就得折线图。折线图可使资料的的中点,就得折线图。折线图可使资料的频数分布趋势更一目了然。频数分布趋势更一目了然。n4 4、曲线图:当组距逐渐减少时,折线将逐、曲线图:当组距逐渐减少时,折线将逐渐平滑为曲线。渐平滑为曲线。例如:某股票按开盘价格分组例如:某股票按开盘价格分组按开盘价格分组按开盘价格分组交易日数交易日数比重比重%累计比重累计比重%45元以下元以下4555元元5565

30、元元6575元元75元以上元以上591213611.1120.0026.6728.8913.3311.1131.1157.7886.67100.00合计合计45100.0011.11%20%26.67%28.89%13.33%直方图直方图45以下以下45555565657575以上以上11.11%20%26.67%28.89%13.33%折线图折线图45以下以下45555565657575以上以上11.11%20%26.67%28.89%13.33%曲线图曲线图45以下以下45555565657575以上以上这种频率分布采用光滑的曲线来拟这种频率分布采用光滑的曲线来拟合,曲线下方面积为频率之和

31、等于合,曲线下方面积为频率之和等于100%100%(三)常见的频率分布形式(三)常见的频率分布形式(1 1)钟型分布:中间大,两头小。最常见。分为对称钟型分布、)钟型分布:中间大,两头小。最常见。分为对称钟型分布、左偏分布、右偏分布。如收入的分布,企业按产出规模划分的分左偏分布、右偏分布。如收入的分布,企业按产出规模划分的分布,上证或者深证总指数的分布,等等。布,上证或者深证总指数的分布,等等。(2 2)U U型分布:两头大,中间小。如年龄别的死亡人口数。型分布:两头大,中间小。如年龄别的死亡人口数。(3 3)J J型分布(或者反型分布(或者反J J型分布)。型分布)。“越来越多越来越多”或者

32、或者“越来越少越来越少”。如。如,西方经济学中的供给、需求曲线,供给曲线是正西方经济学中的供给、需求曲线,供给曲线是正J J形分布形分布曲线,表现为随价格的增加,供给量以更快的速度增加;需求曲曲线,表现为随价格的增加,供给量以更快的速度增加;需求曲线是反线是反J J形分布曲线,表现为随价格的形分布曲线,表现为随价格的增加增加,需求量减少。需求量减少。右偏分布右偏分布左偏分布左偏分布对称分布对称分布死亡人死亡人口数口数年龄年龄U 型分布型分布从事科研从事科研时间(年)时间(年)成果件数成果件数J 型分布型分布来杭州的来杭州的次数次数人数人数反反J J 型分布型分布下表是诺贝尔获奖者的年龄分布表。

33、下表是诺贝尔获奖者的年龄分布表。(1)请根据数据请根据数据制作直方图和折线图;(制作直方图和折线图;(2)将折线图修匀为一条曲线)将折线图修匀为一条曲线图,并描述该曲线的特点。图,并描述该曲线的特点。年龄年龄获奖人数获奖人数25岁以下岁以下2530303535404045455050岁以上岁以上15347068533728合计合计305n(四)分布的重要性n分布的形状不仅可帮助我们更好的了解变量,分布的形状不仅可帮助我们更好的了解变量,而且可帮助我们比较变量。而且可帮助我们比较变量。n例如一个国家收入的分布图是对称的,另一个例如一个国家收入的分布图是对称的,另一个国家收入的分布图是不对称的,可

34、知两个国家国家收入的分布图是不对称的,可知两个国家的社会经济结果有很大不同。又如两个国家的的社会经济结果有很大不同。又如两个国家的产业分布图如下所示:产业分布图如下所示:n一产二产三产n1 1、所谓累计频率分布、所谓累计频率分布n表示的是表示的是小于小于或或大于大于某一变量值的累计某一变量值的累计频数或频率是多少。频数或频率是多少。n它有两种形式:向上累计和向下累计它有两种形式:向上累计和向下累计(五)累计频率分布向上累计:向上累计:是将各组频数(率)由标志值低的组向标志值是将各组频数(率)由标志值低的组向标志值高的组依次累计,说明至某组高的组依次累计,说明至某组上限以下上限以下的各组的各组频

35、数(率)累计分布状况。频数(率)累计分布状况。向下累计:向下累计:是将各组频数(率)由标志高的组向标志值低是将各组频数(率)由标志高的组向标志值低的组依次累计,说明至某组的组依次累计,说明至某组下限以上下限以上各组频数各组频数(率)累计分布状况。(率)累计分布状况。根据累计频率分布表,就可绘制成根据累计频率分布表,就可绘制成累计曲线累计曲线图。图。学生按考试成学生按考试成绩分组绩分组学生人数学生人数(分布分布)向上累计向上累计向下累计向下累计人数人数(人人)比重比重%人数人数(人人)比重比重%人数人数(人人)比重比重%60以下以下60707080809090以上以上41224301051530

36、37.512.54164070805205087.5100807664401010095805012.5合计合计80100 xf(x)xF(x)1.0n2 2、累计频数分布特点、累计频数分布特点n1 1)第一组的累计频数等于第一组本身的频数;)第一组的累计频数等于第一组本身的频数;n2 2)最后一组累计频数等于总体单位数。)最后一组累计频数等于总体单位数。n累计频率同样也具有两个特点:累计频率同样也具有两个特点:n1 1)第一组的累计频率等于第一组本身的频率;)第一组的累计频率等于第一组本身的频率;n2 2)最后一组的累计频率等于)最后一组的累计频率等于1 1。n累计频数(频率)分布图分为向上

37、累计频数(频率)累计频数(频率)分布图分为向上累计频数(频率)分布图和向下累计频数(频率)分布图。以分组变量分布图和向下累计频数(频率)分布图。以分组变量为横轴,以累计频数(频率)为纵轴。为横轴,以累计频数(频率)为纵轴。n在直角坐标点系上将各组组距在直角坐标点系上将各组组距的上限与其相应的累计的上限与其相应的累计频数频数(频率)所构成坐标点,依次用直线(或光滑曲(频率)所构成坐标点,依次用直线(或光滑曲线)相连,即是线)相连,即是向上累计曲线。向上累计曲线。n在直角坐标系上将各组组距在直角坐标系上将各组组距下限与其相应累计频数下限与其相应累计频数(频率)(频率)所构成坐标点,依次用直线(或光

38、滑曲线)所构成坐标点,依次用直线(或光滑曲线)相连,即是相连,即是向下累计分布曲线图。向下累计分布曲线图。n3 3、累计频率图和累计频率表应用、累计频率图和累计频率表应用n(1 1)可以比较个体在总体的位置。)可以比较个体在总体的位置。n例如甲乙两人在各自班上都考了例如甲乙两人在各自班上都考了8080分,那么谁分,那么谁在班上的成绩好。可计算累计表。为比较方便,在班上的成绩好。可计算累计表。为比较方便,设两班人数都为设两班人数都为100100人。人。n可得甲:可得甲:=95 =95 9595%n 乙:乙:=60 =60 6060%n可知甲在班上成绩好于乙。可知甲在班上成绩好于乙。(2)洛仑兹曲

39、线和基尼系数洛仑兹曲线和基尼系数洛仑兹(洛仑兹(Lorenz)曲线乃反映社会收入分配平均曲线乃反映社会收入分配平均程度的一种累计百分数曲线,其特点是在纵轴和横轴程度的一种累计百分数曲线,其特点是在纵轴和横轴上都进行累计。(下凹程度愈大,收入分配愈不平均)上都进行累计。(下凹程度愈大,收入分配愈不平均)n当当所所有有家家庭庭具具有有相相同同收收入入时时,X(累累计计人人口口)的的取取值值与与Y(累累计计收收入入)的的取取值值相相同同,称称为为完完全全的的平平均均分分配配,见见下下表表nX020%40%50%60%80%100%nY020%40%50%60%80%100%反反之之,当当社社会会财财

40、富富集集中中在在极极少少数数人人手手中中,极极限限的的情情况况如如下下表表所所示示,称称为为完完全全的的分分配配不不均均。而而实实际际情情况况将将是是介介于于两两者者间间的的曲曲线线,又又称称洛洛伦伦茨茨曲曲线线。收收入入分分配配愈愈不不平平均均,洛伦茨曲线愈下凸(见图)。洛伦茨曲线愈下凸(见图)。nX020%40%50%60%80%100%nY00%0%0%0%0%100%n基尼系数基尼系数意大利经济学家基尼意大利经济学家基尼(Gini)根据洛仑兹曲线提出了根据洛仑兹曲线提出了判断收入分配平均程度的指标。判断收入分配平均程度的指标。合理界限合理界限0.20.3;警戒线;警戒线0.4;红线;红

41、线0.6。(中(中国,国,2003,0.46)2.3统计数据的显示n2.3.1 2.3.1 统计表统计表n一、概念:一、概念:n经过汇总,得到一系列总量指标的数字经过汇总,得到一系列总量指标的数字资料,把这些数字按一定的逻辑顺序在资料,把这些数字按一定的逻辑顺序在表格上表现出来,这种表称为统计表表格上表现出来,这种表称为统计表n所以,所以,统计表是反映统计整理结果的表统计表是反映统计整理结果的表格。格。n二、统计表的作用统计表的作用n1 1、系统合理安排大量数据,具有条理清、系统合理安排大量数据,具有条理清楚、简明扼要特点。楚、简明扼要特点。n2 2、能反映总体特征和各部分关系,便于、能反映总

42、体特征和各部分关系,便于进行对比和计算各部分指标是进行统计进行对比和计算各部分指标是进行统计分析的重要工具。分析的重要工具。n3 3、是积累和保保存统计资料的最主要手、是积累和保保存统计资料的最主要手段。段。2002年我国城乡人口情况年我国城乡人口情况按城乡分按城乡分比重(比重(%)人口数(万人)人口数(万人)12845339.0960.917824150212总标题总标题乡村乡村城镇城镇100.00合计合计纵栏标题纵栏标题统计数值统计数值横行标题横行标题n三、统计表的结构三、统计表的结构n从外型看由:从外型看由:n总标题总标题n横行标题横行标题n纵栏标题纵栏标题n数字资料数字资料n四要素构成

43、。四要素构成。n1 1、总标题就是统计表的名称,它简便地、总标题就是统计表的名称,它简便地说明表中统计资料的内容,一般写在表说明表中统计资料的内容,一般写在表的顶端中部。的顶端中部。n2 2、横行标题,通常写在表的左边,用以、横行标题,通常写在表的左边,用以说明总体各组的名称。说明总体各组的名称。n3 3、纵栏标题,通常放在表的右上方。用、纵栏标题,通常放在表的右上方。用来表示统计指标的名称。来表示统计指标的名称。n4 4、数字资料,是统计表的主体,用来表、数字资料,是统计表的主体,用来表明有关指标的数量,一般用绝对数、相明有关指标的数量,一般用绝对数、相对数、平均数表示。对数、平均数表示。n

44、从内容上看由:从内容上看由:n统计表由主词和宾词两个部分组成。统计表由主词和宾词两个部分组成。n主词,就是统计表所要说明的总体或总主词,就是统计表所要说明的总体或总体的各个组、各个单位的名称,通常排体的各个组、各个单位的名称,通常排在表的左边。在表的左边。n宾词,就是统计表用来说明主词的各种宾词,就是统计表用来说明主词的各种指标,通常排在表的右边。指标,通常排在表的右边。统计表的结构见表统计表的结构见表某年某企业青年职工文化程度状况表某年某企业青年职工文化程度状况表总标题 文化程度文化程度 人数人数 比重比重%(纵栏标题)(纵栏标题)横横 大学大学 120 11.4120 11.4行行 中学中

45、学 850 81.0850 81.0 数字数字标标题题 小学小学 80 7.680 7.6 合计合计 1050 100.0 1050 100.0 (主词)(主词)(宾词)(宾词)n四、统计表的种类四、统计表的种类n统计表有:统计表有:n简单表简单表(未分组表未分组表)n分组表分组表(简单分组表简单分组表)n复合表复合表n1 1、简单表、简单表(未分组表未分组表):这种统计表是指:这种统计表是指对总体不进行任何分组的统计表。它一对总体不进行任何分组的统计表。它一般是将主词按时间的先后顺序排列,或般是将主词按时间的先后顺序排列,或将总体内各单位依次罗列。将总体内各单位依次罗列。n2 2、分分组组表

46、表(简简单单分分组组表表):就就是是总总体体按按一一个标志对总体进行分组的结果。个标志对总体进行分组的结果。n3 3、复合表:则是总体按两个或两个以上、复合表:则是总体按两个或两个以上的标志对总体进行分组的结果。的标志对总体进行分组的结果。n五五、统统计计表表的的宾宾词词设设计计:宾宾词词指指标标的的设设计计也也就就是是统统计计表表中中指指标标体体系系的的设设置置顺顺序序问问题题。这这直直接接关关系系到到统统计计表表的的作作用用大大小小。一一般般要要求求设设置置指指标标一一要要根根据据指指标标说说明明问问题题的的主主次次先先后后,二二要要保保持持指指标之间的逻辑关系标之间的逻辑关系。n宾词指标

47、的设计分宾词指标的设计分简单设计和复合设计简单设计和复合设计两种。两种。n(一)简单设计:就是各指标作平行设置,不重叠。(一)简单设计:就是各指标作平行设置,不重叠。n(二二)复复合合设设计计:就就是是将将统统计计指指标标重重叠叠设设置置。这这种种设设计计比比简简单单设设计计更更能能综综合合反反映映总总体体特特征征。但但复复合合设设计计情情况况下下,主主词词栏栏的的统统计计分分组组不不能能太太复复杂杂,即即分分组组标标志志不不宜宜过过多多,否则整个表会显得过于繁杂,不便阅读。否则整个表会显得过于繁杂,不便阅读。中国人口年龄结构状况中国人口年龄结构状况单位:单位:%年龄组1953年1964年19

48、82年1990年2000年014岁156465岁上36359344407557363366154927766.75622970170资料来源|:2003中国统计年鉴第99页。简单分组表简单分组表复合分组表复合分组表我国社会福利主要费用情况我国社会福利主要费用情况单位:亿元单位:亿元项目1998199920002001(一)优抚对象补助金额(一)优抚对象补助金额国家支出集体供给(二)农村传统救济金额(二)农村传统救济金额国家支出集体供给(三)城乡各种福利院支出(三)城乡各种福利院支出国家支出集体供给6803243562987022820210399914511403285792062311379

49、4107660746931783234287190971081695386295121174405264141合计合计1180143016801781资料来源|:2003中国统计年鉴第838页。n六、编制统计表应注意的问题六、编制统计表应注意的问题n1总总标标题题要要简简练练、明明确确,能能概概括括反反映映统统计计资资料料的的基基本本内内容容,包包括括资资料料所所属的时间和地点。属的时间和地点。n2表表内内主主词词各各行行与与宾宾词词各各栏栏的的排排列列次次序序要要合合乎乎逻逻辑辑,一一般般先先局局部部,后后全全部,合计在后。部,合计在后。n3如如果果表表的的栏栏数数较较多多,通通常常要要给给

50、栏栏编编号号。一一般般主主词词和和计计量量单单位位栏栏用用“甲甲、乙、丙乙、丙”等文字标注,宾词栏用(等文字标注,宾词栏用(1)、()、(2)、()、(3)等数字编号。)等数字编号。n4表表中中数数字字应应上上下下整整齐齐填填写写,并并不不留留空空白白格格。数数字字为为0时时要要填填上上,无无数数字或不用填的要在格内填上字或不用填的要在格内填上“”,缺资料格内用,缺资料格内用“”标明。标明。n5 5应应注注明明表表内内各各项项资资料料的的计计量量单单位位。当当全全表表只只用用一一种种计计量量单单位位时时,可可注注在在表表的的右右上上方方。如如果果表表中中各各栏栏计计量量单单位位不不同同,可可给

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 高考资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com