统计学原理 第三章 统计整理.ppt

上传人:s****8 文档编号:67344245 上传时间:2022-12-24 格式:PPT 页数:60 大小:671.50KB
返回 下载 相关 举报
统计学原理 第三章 统计整理.ppt_第1页
第1页 / 共60页
统计学原理 第三章 统计整理.ppt_第2页
第2页 / 共60页
点击查看更多>>
资源描述

《统计学原理 第三章 统计整理.ppt》由会员分享,可在线阅读,更多相关《统计学原理 第三章 统计整理.ppt(60页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、第三章第三章 统计整理统计整理本章的教学目的:统计数据的整理由统计分组、统计汇总和统计表构成。这三部分相互联系构成整个统计资料整理的全过程。本章要求掌握统计分组的方法和汇总技术;学会编制变量数列和统计表;认识统计资料整理在统计研究中承先启后的地位。第一节 统计整理的意义和内容 一统计整理 根据根据统计研究任务的统计研究任务的要求要求,对调查所搜索的原始资料进行,对调查所搜索的原始资料进行分分组、汇总组、汇总,使使其其条理化、系统化条理化、系统化的工作过程。的工作过程。统计整理包括对原始资料和次级资料(二手资料)的整理。二。统计整理的意义 统计整理实现了从个别单位的统计整理实现了从个别单位的标志

2、值标志值向说明总体数量特征的向说明总体数量特征的指指标值标值过渡,是人们对社会经济现象从感性认识上升到理性认识过渡,是人们对社会经济现象从感性认识上升到理性认识的过渡阶段,为统计分析提供基础。的过渡阶段,为统计分析提供基础。在整个统计工作中发挥着承上启下的作用。例如:通过调查取得例如:通过调查取得100100个商业企业某月销售额资料:个商业企业某月销售额资料:(单位:万元)(单位:万元)2020,6060,4545,9090,105105,5656,250250,8989,130130,3030,9898,300300。将这些数据资料按将这些数据资料按“销售额销售额”的多少进行整理,得到下的多

3、少进行整理,得到下列整理结果:列整理结果:销售额(万元)企业数(个)0 50 12 50 100 25 100 150 30 150 200 23 250 300 10 合 计 100审核分组汇总编制统计图表三三、统计整理的内容、统计整理的内容1.统计分组 选择应整理的指标和确定应分的组;是基础2.统计汇总 对各项指标进行汇总,确定 各组和总体的单位数和标志总量;是中心内容 汇总技术:汇总技术:手工汇总:划记法、过录法、折叠法、卡手工汇总:划记法、过录法、折叠法、卡片法。片法。电子计算机汇总:电子计算机汇总:3编制统计表 用统计表体现分组、汇总的结果。是最有效的形式四、数据的审核四、数据的审核

4、1.及时性:及时性:是否按时报送了有关资料。对不报、漏报或迟报的现象都要及时查清。2.完整性:完整性:调查单位或填报单位是否齐全;项目是否有答案,资料是否符合规定。3.准确性准确性:资料是否准确可靠。常用审核准确性方法有两种:(1)计算检查 各项指标的计算口径、计量单位是否符合规定,并通过各种计算方法来检查各指标间的数值的计算结果。(2)逻辑检查 首先,从理论上或常识上检查资料是否有悖常理、有无不切实际或不符合逻辑的地方。第二节 统计分组一统计分组的意义 根据统计研究任务的要求和研究现象总体的内在特点,把现象总体按某一标志某一标志划分为若干性质不同但又有联系的几个部分称为统计分组统计分组。总体

5、的变异性是统计分组的客观依据。统计分组是在总体内进行的一种定性分类,它把总体划分为一个个性质不同的范围更小的总体。总体经过分组以后,各组内部的差异缩小趋于同质,组与组之间的差异拉大以表明现象间质的差别或量的不同。分组前分组前分组前分组前分组后分组后分组后分组后253342统计分组前后对照图统计分组前后对照图 统计分组的作用:(1)划分社会经济现象的类型;(2)说明总体内部结构以及整个结构的类型和特征;(3)分析现象的依存关系。母项二、统计分组的要求1、统计分组三要素2、统计分组在技术上的要求子项分组标志标志同一性互斥性周延性三、统三、统 计计 分分 组组 的的 种种 类类统计分组的分类统计分组

6、的分类统计分组的分类统计分组的分类按按分组标志的多少分组标志的多少按按分组标志的性质分组标志的性质按其按其任务和作用任务和作用类型分组类型分组分析分组分析分组结构分组结构分组简单分组简单分组复合分组复合分组变量分组变量分组品质分组品质分组按其任务和作用不同按其任务和作用不同:类型分组 结构分组 依存关系分组 (1)类型分组 例:按所有制性质划分,我国现有以下经济类例:按所有制性质划分,我国现有以下经济类型:型:国有经济;集体经济;私营经济;个体经国有经济;集体经济;私营经济;个体经济、联营经济;股份制经济;外商投资经济、联营经济;股份制经济;外商投资经济;港、澳、台投资经济。济;港、澳、台投资

7、经济。(2)结构分组)结构分组例:上海市按例:上海市按GDP计算的三次产业结构(计算的三次产业结构(%)1980年年 1990年年 1996年年 1997年年 GDP 100 100 100 100 第一产业第一产业 3.2 4.3 2.5 2.3 第二产业第二产业 75.7 63.8 54.5 52.2 第三产业第三产业 21.1 31.9 43.0 45.5 (3)依存关系分组)依存关系分组 例:中国农民家庭按收入分组的恩格尔系数例:中国农民家庭按收入分组的恩格尔系数按收入分组(元)按收入分组(元)200 300 400 500 600 800 1000恩格尔系数(恩格尔系数(%)64.9

8、 60.2 56.7 54.4 50.5 49.9 43.6 按分组标志的多少按分组标志的多少:简单分组 复合分组 举例举例:理科学生组理科学生组 文科学生组文科学生组 本科学生组本科学生组 本科学生组本科学生组 男学生组男学生组 男学生组男学生组 女学生组女学生组 女学生组女学生组 专科学生组专科学生组 专科学生组专科学生组 男学生组男学生组 男学生组男学生组 女学生组女学生组 女学生组女学生组 按按分组标志的性质:分组标志的性质:品质分组分组:如人口按性别、民族、职业、文化程度;工业企业按经济类型、部门、轻重工业。变量分组变量分组 如人口按年龄;工业企业按职工人数、生产能力分组。四 分组体

9、系与分组标志的选择(一)分组体系统计分组后所形成的一系列互相联系、互相补充的多种分组的整体称分组体系分组体系。分组体系有平行分组体系和复合分组体系两种。对同一总体选择两个或两个以上的标志分别进行简单分组,就形成平行分组体系,如对我国工业企业总体构成,可以分别按经济类型,企业规模进行简单分组,就形成平行分组体系;对同一总体选择两个或两个以上的标志层叠起来进行分组,就形成复合分组体系,如为了认识我国高等院校在校学生状况,可以同时选择学科、本科、性别等三个标志进行复合分组。(二)、分组标志的选择 分组标志的选择是统计分组的关键。1 根据研究的目的选择分组标志;2 选择能够反映现象本质或主要特征的标志

10、;3 应考虑现象所处的具体历史条件和经济条件第三节 变量数列一分配数列的概念 将总体按某一标志分组,计算出总体单位在各组的分布次数或称频数频数,就形成了分配数列,也叫频数分布或次数分布。分配数列由两部分组成:分组与分配次数。二分配数列的类型1品质数列。按品质标志分组 2变量数列。按数量标志分组 变量数列的种类。单项式数列 每一组只有一个值进行分组形成的数列。组距式数列 按组距式分组形成的分配数列。n 某厂职工人数统计表某厂职工人数统计表按性别分组按性别分组男男 职职 工工女女 职职 工工合合 计计人数(人)人数(人)(频数)频数)比率()比率()(频率)(频率)25311536868.7531

11、.25100.00某厂职工家庭人口分组统计某厂职工家庭人口分组统计按家庭人口分组按家庭人口分组1合合 计计职工户数职工户数(频数)频数)比率()比率()(频率)(频率)723456381055431202.915.241.320.512.18.0255100某班学生按考试成绩分组某班学生按考试成绩分组 按成绩分组按成绩分组(分)(分)人数(人)人数(人)比率比率(%)6060以下以下 7 7 8.88.8 60706070 2121 26.226.2 70807080 2525 31.231.2 80908090 1919 23.823.8 9090以上以上 8 8 10.010.0 合合 计

12、计 8080 100.0100.03 3、组距数列的有关问题、组距数列的有关问题(1 1)组数)组数(2 2)组限)组限(3 3)开口组和闭口组)开口组和闭口组()组距()组距 (5 5)组中值)组中值 (缺上限的开口组)(缺上限的开口组)(缺下限的开口组)(缺下限的开口组)2003年某地区年龄和性别分人口数及组中值三、变量数列编制的步骤1、组数:组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,可以按 Sturges(斯特奇斯)提出的经验公式来确定组数k2.2.确确定定各各组组的的组组距距:组组距距(Class(Class Width)Width)是是一一个个组组的的上上限限与

13、与下下限限之之差差,可可根根据据全全部部数数据据的的最最大大值值和和最最小小值值及及所分的组数来确定,即所分的组数来确定,即 组距组距组距组距(最大值最大值最大值最大值 -最小值)最小值)最小值)最小值)组数组数组数组数 等距分组和不等距分组 等距分组是各组保持相等的组距,也就是说各组标志值的变动都限于相同的范围。各组组距均相等。如:1020,2030,3040,等。组距为10。这种分组适用于均匀分布的总体。不等距分组即各组组距不相等的分组。如:1020,2050,5060,6070等。其中第二 组与其它各组组距不同。这种分组适用于资料分布离差较大或特殊的研究目的。统计分组时采用等距分组还是不

14、等距分组,取决于研究对象的性质特点。在标志值变动比较均匀的情况下宜采用等距分组。等距分组便于各组单位数和标志值直接比较,也便于计算各项综合指标。等距分组表(上下组限重叠)某车间某车间50名工人日加工零件数分组表名工人日加工零件数分组表按零件数分组按零件数分组频数(人)频数(人)频率(频率(%)105110110115115120120125125130130135135140358141064610162820128合计合计50100 在标志值变动很不均匀的情况下宜采用不等距分组。在变量分布比较密集的区间,采用较短的组距;在变量分布比较稀少的区间,采用较长的组距。不等距分组有时更能说明现象的本

15、质特征。在不等距分组中,由于各组组距的大小对各组的分布次数有影响,这时的次数分布不能反映总体的分布特征,因此需要消除组距不等的影响,方法是用各组组距去除相应的分布次数,即用次数密度或称频数密度反映现象的分布状况。组限和组中值组距两端的数值称组限。其中,每组的起点数值称为下限,每组的终点数值称为上限。组限的表示方法常见的有两种,一是上下限重叠式(连续组距式);二是上下限不重叠式(间断组距式)。对于连续型变量,只能采用上下限重叠式的组限表示法;对于离散型变量,二者都可以采用。若采用上下限重叠式的表示法,应遵循“上组限不包括在内”的统计原则。3.3.根据分组整理成频数分布表根据分组整理成频数分布表

16、四频数和频率统计分组后各组对应的单位数称为频数,也叫次数;各组单位数占总体单位总数的比重称为频率。各组的频率大于,所有组的频率总和等于。在变量分布数列中,频数(频率)表明对应组标志值的作用程度。频数(频率)数值越大表明该组标志值对于总体水平所起的作用也越大,反之,频数(频率)数值越小,表明该组标志值对于总体水平所起的作用越小。工资分组工资分组 职工人数(人)职工人数(人)各组人数所占比重各组人数所占比重 (元)(元)(次数或频数)(次数或频数)(%)(频率)(频率)500600 100 25600700 200 50700800 100 25 合合 计计 400 100频率:各组的频率大于频率

17、:各组的频率大于0 0,各组的频率总和等于,各组的频率总和等于1 1或或100%100%。在具体的研究中,经常会观察某个数值以上或以下的分布次数(频数)之和,这就需要计算累计次数(累计频数),继而计算累计频率。在计算时,由变量值小的向变量值大的方向累计称为向上累计。由变量值大的向变量值小的方向累计称为向下累计。序 计划完成 工人数 比重 向上累计 向下累计号 程度(%)(人)(%)人数 比重 人数 比重 1 60 70 2 1.0 2 70 80 5 2.5 3 80 90 14 7.0 4 90 100 31 15.5 5 100110 65 32.5 6 110120 52 26.0 7

18、120130 23 11.5 8 130140 8 4.0 合 计 200 100 累计频数或频率分配数列通过累计频数分配数列可以反映累计到某一组出现的总次数或总频率。想一想:第四组的累计结果说明什么问题?2721521171691922001.03.510.526.058.584.596.0100831831481791931982004.015.541.574.089.596.599.0100第四节 统计数据的显示一、统计表 1统计表的概念与意义 统计表是由纵横交叉的线条所绘制表现统计资料的一种表格形式。统计表有以下几方面的作用:(1)它能使统计资料条理化,更清晰地表述统计资料的内容;(2

19、)采用统计表格表达统计资料比用叙述的方式表述统计资料简明易懂,节省篇幅;(3)统计表便于比较各项目(指标)之间的关系,而且便于计算;(4)利用统计表易于检查数字的完整性和正确性。2.统计表的构成 从形式上看,统计表是由总标题,横行标题、纵栏标题和指标数值四部分组成;从内容上看,统计表是由主词栏和宾词栏两部分构成。主词栏是统计表所要说明的对象及其组成部分;宾词栏是用来说明主词的一系列统计指标。我国我国20022002年国内生产总值年国内生产总值按三次产业分按三次产业分国内生产总值国内生产总值(亿元)(亿元)比上年增长比上年增长率率(%(%)第一产业第一产业 14883 14883 2.92.9

20、第二产业第二产业 5298252982 9.99.9 第三产业第三产业 3452234522 7.37.3 合合 计计 102398102398 8.08.0横横标标题题纵纵标标题题数数字字资资料料主词主词宾词宾词3、统计表的种类 (1)统计表根据主词是否分组及分组情况分为简单表、分组表和复合表。简单表简单表是指主词不经过任何分组的统计表。分组表分组表是指主词按一个标志进行分组的统计表,也称为简单分组统计表。复合表复合表是指主词按两个或两个以上的标志进行分组的统计表,也称为复合分组统计表。简单表简单表1 1、我国三个城市的人口数、我国三个城市的人口数(1990(1990年年7 7月月1 1日日

21、0 0时时)城城 市市 人口数人口数(人人)较较19821982年年7 7月月1 1日日0 0时增长时增长%北京市北京市 1081940710819407 17.2117.21 天津市天津市 87854028785402 13.1513.15 上海市上海市 1334189613341896 12.5012.50我国我国8 8拥有电话户数拥有电话户数(万户万户)年份年份 固定电话固定电话 移动电话移动电话 19981998 87428742 23862386 19991999 1087210872 43304330 20002000 1448314483 84538453 20012001 18

22、03718037 1452214522 20022002 2144221442 2066220662分组表分组表我国我国20022002年国内生产总值年国内生产总值按三次产业分按三次产业分国内生产总值国内生产总值(亿元)(亿元)比上年增长比上年增长率率(%(%)第一产业第一产业 14883 14883 2.92.9 第二产业第二产业 5298252982 9.99.9 第三产业第三产业 3452234522 7.37.3 合合 计计 102398102398 8.08.0复合表复合表 某年末某地区人口资料某年末某地区人口资料 按按城乡及性城乡及性别分组别分组人口数(万人)人口数(万人)增长率(

23、)增长率()(与上年比)(与上年比)城镇人口城镇人口男性人口男性人口女性人口女性人口农村人口农村人口男性人口男性人口女性人口女性人口合计合计 返回返回返回(2)统计表按用途或作用不同分为调查表、汇总表和分析表。调查表调查表指在统计调查中用于登记、搜集原始资料的表格,表中的数字可以是未经综合的各个单位的标志值,它不是严格意义上的统计表。汇总表汇总表是在统计整理中用于整理过程和结果的表格,表中的数字是经过汇总的总量指标。分析表分析表指在统计分析中对整理所得的统计资料进行统计定量分析的表格。表中的数字即有总量指标,又有相对指标,分析表又称为计算表。(3)统计表按数列的性质不同可分为空间表、时间数列表

24、、时空数列结合表。空间表是指反映在同一时间条件下不同空间范围内的某项或某几项统计数列的表格。又称为静态表。时间数列表是指反映在同一空间条件下不同时间阶段上的某项或某几项统计数列的表格。又称为动态表。时空数列结合表。指同时反映上述两方面内容的统计表。4、统计表的编制规则统计表的编制规则(1)统计表的各种标题应该简明扼要。(2)表中主词各行和宾词各栏的次序排列,一般多是合计或总计栏在各部分栏之后。(3)如果统计栏较多,可以添加编号;(4)表中数字应该填写整齐,对准位数。(5)统计表必须注明各指标的计量单位。(6)注解或资料来源。在统计表下应注明资料来源。(7)统计表左右两侧采用开口二、统计图数据的

25、图形表示能以醒目的方式揭示频数(频率),常见的有条形图、饼分图、折线图和直方图等。例:某高校2003年各系教师在国内核心杂志发表论文情况如下表:编号系别论文数1数学系402物理系1203化学系1404无线电系805管理科学系1001、条形图(bar chart)条形图常用于描述离散型数据,用宽度相等而高度为频数(率)的线段或狭条表示。2、饼分图饼分图常用来表示各成分在总体中所占地百分比。3、折线图 在直方图的基础上,将各长方形顶边中点(即各组组中值)用直线连接起来,就形成了频数分布的折线图。折线图应和横轴形成一个封闭的图形,因此左右两边折线要继续延伸,通过各自长方形竖边中点至横轴。4、曲线图

26、常见的频数分布曲线的主要类型有:钟型分布 特征是“两头大,中间小”,即靠近中间的变量值分布的次数多,靠近两边的变量分布次数少,形若古钟。型分布 其特征与钟型分布正相反,靠近中间的变量值分布的次数少,靠近两端的变量值分布次数多,形成“两头大,中间小”的字型分布。J型分布 在社会经济现象中,一些统计总体分布曲线呈J型。洛伦兹分布 洛伦兹曲线专门用以检定社会收入分布的平等程度。钟型形分布 特征:两头小,中间大 说明靠近中间的变量值分布的次数多,靠近两边的变量值分布的次数少。正态分布右偏态左偏态正态分布特点:两头小、中间大、左右对称。U型分布特征:两头大、中间小如人口死亡现象按年龄分布。J型分布 例:

27、洛伦兹(Lorenz)曲线常用来描述财富的分配是否公平。数据如下表:人群人口比例累积百分比财富百分比累积财富百分比A50501010B25752030C10851040D10951555E3982580F210020100公平线税后税前 右下图中的对角线为公平线,散点图折线离公平线越远,说明财富分配越不公平。洛伦茨分布练习题:1.计算下表资料中的组距、组中值、频率及向上累计次数、向下累计次数及累积频率。考试成绩(分)学生人数(人)60以下 5 6070 27 7080 36 8090 24 90100 8 合 计 100 2.已知某企业50名工人的生产定额完成情况(%)资料如下:137.4 1

28、28.2 137.6 115.8 122.0 127.5 114.6 106.3 125.4 78.1 134.2 116.0 108.1 107.1 127.3 155.6 121.3 133.7 121.0 102.0 135.0 112.4 117.5 80.6 112.3 124.3 114.0 128.6 132.6 143.0 110.8 102.8 140.2 125.3 158.5 118.2 152.6 112.5 124.0 148.3 138.4 116.4 101.2 129.0 95.0 124.5 98.4 146.5 126.0 126.6 要求对以上资料进行分组

29、:(1)分8组,组距为10%,为全开口式。(2)分4组,组距为20%,为全开口式。例:某企业工人日产量资料如下例:某企业工人日产量资料如下要求:要求:1 1、指出上述变量数列属于哪一种变量数列?这个、指出上述变量数列属于哪一种变量数列?这个数列说明什么问题?数列说明什么问题?2 2、指出统计表中的变量、变量值、上限、下限、次数、指出统计表中的变量、变量值、上限、下限、次数、频率、总体单位总数频率、总体单位总数3 3、计算组距和各组组中值、计算组距和各组组中值日产量分组(件)日产量分组(件)工人数工人数日产量分组(件)日产量分组(件)工人数工人数5060690100156070910011018

30、708012110120208090141201308四、次数分布的编制四、次数分布的编制例如,某生产车间例如,某生产车间5050名工人日加工零件数如下:名工人日加工零件数如下:117 122 124 129 139 107 117 122 124 129 139 107 117 130 122 125 108 131 117 130 122 125 108 131 125 117 122 133 126 122 125 117 122 133 126 122 118 108 110 118 123 126 118 108 110 118 123 126 133 134 127 123 118

31、 112 133 134 127 123 118 112 112 134 127 123 119 113 112 134 127 123 119 113 120 123 127 135 137 114 120 123 127 135 137 114 120 128 124 115 139 128 120 128 124 115 139 128 124 121124 121 编制过程编制过程首先,对上面的数据进行排序首先,对上面的数据进行排序107 108 108 110 112 112 113 107 108 108 110 112 112 113 114 115 117 117 117 11

32、8 118 114 115 117 117 117 118 118 118 119 120 120 121 122 122 118 119 120 120 121 122 122 122 122 123 123 123 123 124 122 122 123 123 123 123 124 124 124 125 125 126 126 127 124 124 125 125 126 126 127 127 127 128 128 129 130 131 127 127 128 128 129 130 131 133 133 134 134 135 137 139 133 133 134 13

33、4 135 137 139 139139第二步,确定组数和组距第二步,确定组数和组距 组数组数=4=4 组距可以根据(最大值组距可以根据(最大值-最小值)最小值)组数组数=8=8来确定,来确定,组距组距=10=10第三步,计算各组次数、频率及累计次数、频率第三步,计算各组次数、频率及累计次数、频率 5050名工人日产零件数次数分布表名工人日产零件数次数分布表按按零件零件数分组数分组次数次数频率频率(%)向上累计向上累计 向下累计向下累计次数次数频率频率(%)次数次数频率频率(%)110以以下下 3 6 3 6 50 100110120 13 26 16 32 47 94120130 24 48 40 80 34 68130140 10 20 50 100 10 20合计合计 50100

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 生活常识

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com