统计数据的收集和整理.ppt

上传人:wuy****n92 文档编号:73987083 上传时间:2023-02-23 格式:PPT 页数:120 大小:3.35MB
返回 下载 相关 举报
统计数据的收集和整理.ppt_第1页
第1页 / 共120页
统计数据的收集和整理.ppt_第2页
第2页 / 共120页
点击查看更多>>
资源描述

《统计数据的收集和整理.ppt》由会员分享,可在线阅读,更多相关《统计数据的收集和整理.ppt(120页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、第二章第二章 统计数据的收集和整理统计数据的收集和整理第一节、第一节、统计数据的收集统计数据的收集第二节、统计分组第二节、统计分组第三节、次数分布及其显示第三节、次数分布及其显示学习目的:学习目的:了了了了解解解解统统统统计计计计工工工工作作作作的的的的两两两两个个个个重重重重要要要要步步步步骤骤骤骤,即即即即数数数数据据据据收收收收集集集集和和和和整理的基本思想和方法整理的基本思想和方法整理的基本思想和方法整理的基本思想和方法。重难点:重难点:统统统统计计计计调调调调查查查查的的的的种种种种类类类类;普普普普查查查查、重重重重点点点点调调调调查查查查、典典典典型型型型调调调调查查查查的的的的

2、方方方方法法法法;调调调调查查查查方方方方案案案案和和和和问问问问卷卷卷卷。统统统统计计计计分分分分组组组组方方方方法法法法;分分分分布布布布数数数数列的相关概念和编制方法;统计图的绘制列的相关概念和编制方法;统计图的绘制列的相关概念和编制方法;统计图的绘制列的相关概念和编制方法;统计图的绘制 。第一节第一节 统计数据的收集统计数据的收集一、数据来源一、数据来源二、统计调查设计二、统计调查设计三、统计调查种类三、统计调查种类四、调查方法四、调查方法五、统计调查误差五、统计调查误差一、数据来源一、数据来源从从统统计计数数据据本本身身的的来来源源看看,统统计计数数据据都都来来源源于于直直接的调查或

3、实验;接的调查或实验;从从使使用用者者的的角角度度看看,统统计计数数据据主主要要来来源源于于两两种种渠渠道道:直直接接的的调调查查和和科科学学实实验验(直直接接数数据据或或一一手手数数据据);别别人人调调查查或或实实验验的的数数据据(间间接接数数据据或或二二手手数据)数据)实实验验法法是是在在所所设设定定的的特特殊殊实实验验场场所所、特特殊殊状状态态下下,对研究对象进行实验以获取数据资料的方法。对研究对象进行实验以获取数据资料的方法。直直接接调调查查法法包包括括直直接接观观察察法法、访访问问法法、问问卷卷法法、电脑辅助调查法电脑辅助调查法等。等。指直接从各调查指直接从各调查单位收集的用来单位收

4、集的用来反映个体特征的反映个体特征的数据资料数据资料统计调查是整个统计认识活动的基础,统计调查是整个统计认识活动的基础,决定着统计认识过程及其结果的成败决定着统计认识过程及其结果的成败 收集收集原始数据资料原始数据资料 的统计活动过程的统计活动过程统计调查统计调查要求:要求:准确、及时、准确、及时、全面、效益全面、效益二、二、统计调查设计统计调查设计调查方案设计调查方案设计1、调查目的、调查目的1.调查要达到的具体目标调查要达到的具体目标2.回答回答“为什么调查?为什么调查?”3.调查之前必须明确调查之前必须明确2、调查对象、调查单位、报告单位、调查对象、调查单位、报告单位1.调查对象:调查研

5、究的调查对象:调查研究的总体总体或调查或调查范围范围2.调查单位:需要对之进行调查的调查单位:需要对之进行调查的单位单位。可以是。可以是调查对象的全部单位(全面调查),也可以是调查对象的全部单位(全面调查),也可以是调查对象中的一部分单位(非全面调查)调查对象中的一部分单位(非全面调查)3.回答回答“向谁调查?向谁调查?”调查对象调查对象调查对象调查对象调查单位?调查单位?调查单位?调查单位?第五次全国人口普查办法第五次全国人口普查办法第六条规定,第六条规定,“人口普查的对象是具有中华人民共和国国籍并人口普查的对象是具有中华人民共和国国籍并在中华人民共和国境内常住的人在中华人民共和国境内常住的

6、人”。第七条规第七条规定,定,“人口普查,采用按常住人口登记的原则。人口普查,采用按常住人口登记的原则。每个人必须在常住地进行登记。一个人只能在每个人必须在常住地进行登记。一个人只能在一个地方登记一个地方登记”。人口普查以户为单位进行登记。以家庭成员关人口普查以户为单位进行登记。以家庭成员关系为主的人口,居住一处共同生活的作为一个系为主的人口,居住一处共同生活的作为一个家庭户;单身居住独自生活的,也作为一个家家庭户;单身居住独自生活的,也作为一个家庭户。相互之间没有家庭成员关系,集体居住庭户。相互之间没有家庭成员关系,集体居住在单位内集体宿舍及其他住所、共同生活的人在单位内集体宿舍及其他住所、

7、共同生活的人口,作为集体户。集体户以一个居住房间为一口,作为集体户。集体户以一个居住房间为一户进行普查登记。户进行普查登记。报报告告单单位位是是负负责责向向上上级级报报告告资资料料的的单位。单位。注意:调查单位与报告单位的区别。注意:调查单位与报告单位的区别。调查目的:调查目的:了解武汉市国有工业企业经营效益状况了解武汉市国有工业企业经营效益状况调查对象:调查对象:武汉市国有工业企业武汉市国有工业企业调查单位:调查单位:武汉市每一家国有工业企业武汉市每一家国有工业企业填报单位:填报单位:武汉市每一家国有工业企业武汉市每一家国有工业企业w调查目的:调查目的:了解武汉市私家车使用状况了解武汉市私家

8、车使用状况w调查对象:调查对象:武汉市私家车武汉市私家车w调查单位:调查单位:武汉市每一辆私家车武汉市每一辆私家车w填报单位:填报单位:武汉市每一个私家车主武汉市每一个私家车主3 3、确确 定定 调调 查查 项项 目目,拟拟 订订 调调 查查 表表 即调查哪些内容即调查哪些内容调查项目是调查的具体内容,即要登记哪些标志?调查项目是调查的具体内容,即要登记哪些标志?它可以是调查单位的数量特征,它可以是调查单位的数量特征,如一个人的年龄、收入,如一个人的年龄、收入,一个企业的职工人数、产值;一个企业的职工人数、产值;可以是调查单位的某种属性特征可以是调查单位的某种属性特征如一个人的性别、职业,如一

9、个人的性别、职业,一个企业的经济类型等。一个企业的经济类型等。调调查查表表是是用用于于登登记记调调查查数数据据的的一一种种表表格格。调调查查表表一一般分为一览表和单一表。般分为一览表和单一表。一览表一览表把把许许多多调调查查单单位位和和相相应应的的项项目目按按次次序序登登记记在在一一张张表表格格里里。这这便便于于汇汇总总,但但缺缺点点是是分分不开,故调查深度不够。不开,故调查深度不够。单一表单一表将将一一个个调调查查单单位位的的项项目目登登记记在在一一张张表表或或一一种种卡卡片片上上。这这便便于于容容纳纳较较多多的的项项目目,且且便便于于整整理、分类,缺点是繁琐。理、分类,缺点是繁琐。Q Q1

10、 1 Q Q2 2 Q Q3 3 Q Q4 4 第五次全国人口普查表共有:第五次全国人口普查表共有:普查表短表、普查表短表、普查表长表、死亡人口调查表和暂住人口调查表。普查表长表、死亡人口调查表和暂住人口调查表。(一)姓名(一)姓名 (二)与户主关系(二)与户主关系 (三)性别(三)性别 (四)年龄(四)年龄 (五)民族(五)民族 (六)户口登记状况(六)户口登记状况 (七)户口性质(七)户口性质 (八)出生地(八)出生地 (九)何时来本乡镇街道居住(九)何时来本乡镇街道居住 (十)从何地来本乡镇街道居住(十)从何地来本乡镇街道居住 (十一)迁出地类型(十一)迁出地类型 (十二)迁移原因(十二

11、)迁移原因 (十三)五年前常住地(十三)五年前常住地 (十四)是否识字(十四)是否识字 (十五)受教育程度(十五)受教育程度 (十六)学业完成情况(十六)学业完成情况 (十七(十七)是否有工作是否有工作 (十八)工作时间(十八)工作时间 (十九)行业(十九)行业 (二十)职业(二十)职业 (二十一)未工作者状况(二十一)未工作者状况 (二十二)未工作者主要生活来源(二十二)未工作者主要生活来源 (二十三)婚姻状况(二十三)婚姻状况 (二十四)初婚年月(二十四)初婚年月 (二十五)生育子女数(二十五)生育子女数 (二十六)(二十六)的生育状况的生育状况 普查表长表普查表长表 (按人填报的项目)(

12、按人填报的项目)普查表长表普查表长表 (按户填报的项目)(按户填报的项目)第一部分第一部分(一)户编号(一)户编号 (二)户别(二)户别 (三)本户普查登记人数(三)本户普查登记人数 (四)本户户籍人口中外出不满半年人数(四)本户户籍人口中外出不满半年人数 (五)本户户籍人口中外出半年以上人数(五)本户户籍人口中外出半年以上人数 (六六)暂住本乡、镇、街道,离开户口登记地不满半暂住本乡、镇、街道,离开户口登记地不满半年人数年人数 (七)本户(七)本户 1999.11.1-2000.10.31 1999.11.1-2000.10.31 出生人数出生人数 (八)本户(八)本户 1999.11.1-

13、2000.10.31 1999.11.1-2000.10.31 死亡人数死亡人数 第二部分第二部分(九)本户住房间数(九)本户住房间数 (十)本户住房建筑面积(十)本户住房建筑面积 (十一)住房用途(十一)住房用途 (十二)本住房中是否有其他合住户(十二)本住房中是否有其他合住户 (十三)住房建成时间(十三)住房建成时间 (十四)建筑层数(十四)建筑层数 (十五)住宅外墙墙体材料(十五)住宅外墙墙体材料 (十六)住房内有无厨房(十六)住房内有无厨房(十七)主要炊事燃料(十七)主要炊事燃料 (十八)是否饮用自来水(十八)是否饮用自来水 (十九)住房内有无洗澡设施(十九)住房内有无洗澡设施 (二十

14、)住房内有无厕所(二十)住房内有无厕所 (二十一)住房来源(二十一)住房来源(H21)(H21)(二十二)购建住房费用(二十二)购建住房费用 (二十三)月租房费用(二十三)月租房费用 4、调查时间和调查工作的期限、调查时间和调查工作的期限1.调查时间:调查时间:调查资料所属的时间调查资料所属的时间2.工作期限:工作期限:调查工作的起止时间调查工作的起止时间例例如如:第第六六次次人人口口普普查查规规定定的的标标准准时时间间是是“20102010年年1111月月1 1日日0 0时时”,并并要要求求在在“20102010年年1111月月1 1日日至至1010日日完完成成普查的登记工作普查的登记工作”

15、。20102010年年1111月月1 1日日0 0时就是调查时间,时就是调查时间,20102010年年1111月月1 1日至日至1010日就是调查期限日就是调查期限。5.5.制制定调查的组织实施计划定调查的组织实施计划(1 1)调查调查工作完成的期限和工作进度。工作完成的期限和工作进度。(2 2)确)确定调查的定调查的方式与汇总的方法。方式与汇总的方法。(3 3)组织领导。)组织领导。(4 4)调查前的其他准备工作)调查前的其他准备工作统计调查方案的内 容调查对象和调查单位调查对象和调查单位调查项目和调查表调查项目和调查表调查时间和期限调查时间和期限调查目的调查目的调查工作调查工作 的组织实施

16、计划的组织实施计划按调查单位的范围大小分为按调查单位的范围大小分为全面调查全面调查非全面调查非全面调查一次性调查一次性调查经常性调查经常性调查统计报表统计报表专门调查专门调查三、统计调查的种类三、统计调查的种类按调查时间是否连续分为按调查时间是否连续分为按调查的组织方式不同分为按调查的组织方式不同分为普查普查抽样调查抽样调查典型调查典型调查重点调查重点调查指国家为详尽了解某项重要的国情指国家为详尽了解某项重要的国情国力而专门组织的一次性全面调查国力而专门组织的一次性全面调查特点特点(1)普查是一次性全面调查。)普查是一次性全面调查。(2)普普查查的的对对象象多多为为时时点点现现象象,即即某某一

17、一时时点点上上总总数数量量及及其其构构成成情情况况。(如:人口普查)(如:人口普查)(3)普查有标准时点(瞬间)。)普查有标准时点(瞬间)。统计调查的组织方式统计调查的组织方式作用作用局限局限可以为抽样调查提供抽样框可以为抽样调查提供抽样框可以收集统计报表所不能提供的反可以收集统计报表所不能提供的反映重大国情国力的基本统计信息映重大国情国力的基本统计信息由于需要大量的人力、物力和财由于需要大量的人力、物力和财力,不宜经常进行力,不宜经常进行普查应注意的问题:普查应注意的问题:统一规定调查资料所属的统一规定调查资料所属的标准时点标准时点。正确选择普查时期。正确选择普查时期。普查范围和期限。普查范

18、围和期限。普查项目的确定。普查项目的确定。标准时点?标准时点?普查种类普查种类 普查周期普查周期 (年)(年)普查年份普查年份人口普查人口普查第三产业普查第三产业普查工业普查工业普查农业普查农业普查基本单位普查基本单位普查 1010 10 10 10 10 10 10 5 5 逢逢0年份年份 逢逢3年份年份 逢逢5年份年份 逢逢6年份年份逢逢1、6年份年份(二)统计报表制度(二)统计报表制度1 1、概念和特点、概念和特点 统统计计报报表表是是按按国国家家统统一一规规定定的的表表式式、统统一一的的指指标标项项目目、统统一一的的报报送送时时间间,自自下下而而上上定定期期提提供供统统计资料的一种报告

19、制度。计资料的一种报告制度。特点:特点:统一性统一性全面性全面性可靠性可靠性优点优点局限局限能保证统计资料的全面性和连续性能保证统计资料的全面性和连续性能保证统计资料的统一性和及时性能保证统计资料的统一性和及时性能满足各级部门对统计资料的需要能满足各级部门对统计资料的需要统计报表过多会增加基层负担统计报表过多会增加基层负担有可能由于虚报瞒报而影响统计资有可能由于虚报瞒报而影响统计资料质量料质量按实施范围分为按实施范围分为:国家统计报表国家统计报表 部门统计报表部门统计报表 地方统计报表地方统计报表2、统统计计报报表表的的种种类类:按按 填填 报报 单单 位位 分分 为为:基基 层层 统统 计计

20、 报报 表表 综综 合合 统统 计计 报报 表表按按报报送送方方式式分分为为:电电讯讯统统计计报报表表 邮邮 寄寄 统统 计计 报报 表表 按报送周期长短不同分为:按报送周期长短不同分为:4 4、统统 计计 报报 表表 的的 资资 料料 来来 源源(1 1)原始记录)原始记录(2 2)统统计计台台账账()表表式式报报表表的的具具体体形形式式()填填 表表 说说 明明 填填 报报 范范 围围 分分 类类 目目 录录 指标解释指标解释 按照按照 随机原则随机原则 从调查对象中抽从调查对象中抽取一部分样本单位进行调查,再用取一部分样本单位进行调查,再用样本资料推断把握总体的数量特征样本资料推断把握总

21、体的数量特征的一种非全面调查组织方式的一种非全面调查组织方式指样本单位的抽指样本单位的抽指样本单位的抽指样本单位的抽取不受主观因素取不受主观因素取不受主观因素取不受主观因素及其他系统性因及其他系统性因及其他系统性因及其他系统性因素的影响,每个素的影响,每个素的影响,每个素的影响,每个总体单位都有均总体单位都有均总体单位都有均总体单位都有均等的被抽中机会等的被抽中机会等的被抽中机会等的被抽中机会特特点点优优点点按随机原则抽取样本单位按随机原则抽取样本单位按随机原则抽取样本单位按随机原则抽取样本单位目的是推断总体的数量特征目的是推断总体的数量特征目的是推断总体的数量特征目的是推断总体的数量特征抽样

22、误差可以事先计算并控制抽样误差可以事先计算并控制抽样误差可以事先计算并控制抽样误差可以事先计算并控制能用较少的人力、物力和时间能用较少的人力、物力和时间能用较少的人力、物力和时间能用较少的人力、物力和时间达到全面调查的目的达到全面调查的目的达到全面调查的目的达到全面调查的目的调查资料的准确性较高、受人调查资料的准确性较高、受人调查资料的准确性较高、受人调查资料的准确性较高、受人为干扰的可能性较小为干扰的可能性较小为干扰的可能性较小为干扰的可能性较小统计调查的组织方式统计调查的组织方式抽样调查研究抽样调查研究Sampling Study为什么要抽样?为什么要抽样?1.涉及破坏受试对象涉及破坏受试

23、对象质量控制质量控制2.取得精确可靠的结果取得精确可靠的结果3.实际情况的约束实际情况的约束时间,成本等时间,成本等 抽样调查方法抽样调查方法 第五章介绍第五章介绍 样样样样本本本本总总总总体体体体为了解总体基本情况,在调查对象为了解总体基本情况,在调查对象中只选择一部分中只选择一部分重点单位重点单位 进行调查进行调查的一种非全面调查组织方式的一种非全面调查组织方式作用作用局限局限能以较少的投入和较快能以较少的投入和较快的速度取得总体基本情的速度取得总体基本情况及变动趋势的资料况及变动趋势的资料只适用于客观存在着只适用于客观存在着重点单位的情况重点单位的情况不能推断不能推断这些单位数目这些单位

24、数目这些单位数目这些单位数目不多,但其标不多,但其标不多,但其标不多,但其标志值在总体标志值在总体标志值在总体标志值在总体标志总量中占有志总量中占有志总量中占有志总量中占有较大比重,能较大比重,能较大比重,能较大比重,能反映总体的基反映总体的基反映总体的基反映总体的基本情况本情况本情况本情况统计调查的组织方式统计调查的组织方式 重点调查应注意的问题:重点调查应注意的问题:一一般般不不能能由由重重点点单单位位的的调调查查结结果果从从数数量量上上推推断总体。断总体。重点单位的确定。重点单位的确定。总体单位总体单位重点单位重点单位 3 3、典型调查:、典型调查:特点特点:能取得详细的资料。能取得详细

25、的资料。能取得代表性较高的资料。能取得代表性较高的资料。调查方式灵活。调查方式灵活。先先对对总总体体进进行行分分析析,然然后后有有意意识识地地选选取取若若干干具具有有典典型意义的或具有代表性的单位进行非全面调查。型意义的或具有代表性的单位进行非全面调查。方法:方法:1、“解解剖剖麻麻雀雀式式”的的典典型型调调查查。直直接接对对个个别别典典型型单单位位进进行行调查。调查。2、“划划类类选选典典式式”的的典典型型调调查查。在在分分类类的的基基础础上上,选选择择一一部分典型单位调查。部分典型单位调查。作作用用:了了解解事事物物的的一一般般情情况况和和发发展展规规律律。补补充充和和验验证证全全面面调查

26、的不足。调查的不足。典型调查应注意的问题:典型调查应注意的问题:典型单位的选择典型单位的选择。根据不同的选典方法来反映总体的情况。根据不同的选典方法来反映总体的情况。庭院深深庭院深深空几许?空几许?五、统计调查误差五、统计调查误差抽抽样样误误差差即即指指随随机机误误差差,这这是是抽抽样样调调查查固有的误差,是无法避免的。固有的误差,是无法避免的。六、次级资料的收集六、次级资料的收集次级资料次级资料指已经被收集、加工整理成型的指已经被收集、加工整理成型的数据信息数据信息次级资料的主要收集渠道:次级资料的主要收集渠道:查阅公开出版物;查阅公开出版物;向政府统计机构咨询;向政府统计机构咨询;向其他机

27、构咨询;向其他机构咨询;网上查询。网上查询。常用的统计数据来源中国统计年鉴中国统计年鉴中国统计摘要中国统计摘要中国统计信息网(国家统计局网站)中国统计信息网(国家统计局网站)常用的统计数据来源美国经济分析局美国经济分析局美国人口普查局美国人口普查局美国劳工统计局美国劳工统计局美联储经济数据库美联储经济数据库美国联邦统计美国联邦统计世界银行世界银行国际货币基金组织国际货币基金组织OECD 第二节第二节 统计分组统计分组 一、统计整理的意义和步骤一、统计整理的意义和步骤 二、统计分组的方法二、统计分组的方法统计整理统计整理将统计调查得到的原始资料进行将统计调查得到的原始资料进行科学的分组和汇总形成

28、综合统计科学的分组和汇总形成综合统计资料的工作过程资料的工作过程是统计调查的继续,统计分析的是统计调查的继续,统计分析的前提和基础前提和基础地位地位统计数据的处理:统计数据的处理:统计资料的分组、汇总及制表统计资料的分组、汇总及制表统计数据的管理:统计数据的管理:数据的传输、贮存、更新及输出数据的传输、贮存、更新及输出内内容容制定统计整理方案制定统计整理方案对原始资料进行审核对原始资料进行审核数数 据据 处处 理理(分组和汇总分组和汇总)制作统计表或统计图制作统计表或统计图统计整理的步骤统计整理的步骤将总体中所有单位按将总体中所有单位按一定一定的标志分的标志分为性质不同但又有联系的若干部分为性

29、质不同但又有联系的若干部分的过程的过程统计分组统计分组统计分组统计分组(classification)总体经过分组,能够突出组与组之间的差异总体经过分组,能够突出组与组之间的差异而抽象掉组内各单位之间的差异,使数据变而抽象掉组内各单位之间的差异,使数据变得条理化,便于进一步分析研究。得条理化,便于进一步分析研究。分组前分组前分组后分组后253342对个体是对个体是“合合”对总体是对总体是“分分”两层两层含义含义统计分组有什么作用?统计分组有什么作用?1 1.划分现象的类型划分现象的类型男人男人女人女人婴儿婴儿青青年年老人老人2.2.揭示现象的内部结构揭示现象的内部结构3.3.分析现象间的依存关

30、系分析现象间的依存关系身高与体重有关系吗?身高与体重有关系吗?哇哇!咦!咦!例例“十五十五”期间某地区国内生产总值构成(期间某地区国内生产总值构成(%)年份年份20012002200320042005第一产业第一产业 20.4 19.1 18.6 17.6 15.9第二产业第二产业 49.5 50.0 49.3 49.4 50.9第三产业第三产业 30.1 30.9 32.1 33.0 33.2合计合计100.0100.0100.0100.0100.0例例耕作深度分组耕作深度分组(cm)地块数地块数平均收获率平均收获率(公斤公斤/亩亩)10-12 740012-141046014-161654

31、016-1818-2012 5620680某乡某种农作物的耕作深度与收获率的关系某乡某种农作物的耕作深度与收获率的关系 要根据研究问题的目的和要求来选择要根据研究问题的目的和要求来选择 要选择最能反映被研究现象本质特征的标志要选择最能反映被研究现象本质特征的标志 要结合现象所处的具体历史条件或经济条件来选择要结合现象所处的具体历史条件或经济条件来选择 1 1、分组标志的选择、分组标志的选择统计分组的关键:统计分组的关键:选择分组标志选择分组标志和和划定各组界限划定各组界限品品质标志分组质标志分组 反映事物属性差异反映事物属性差异 2 2、分组的种类、分组的种类按标志的表现形式不同有:按标志的表

32、现形式不同有:按存款种类分组按存款种类分组 活期存款活期存款 定期存款定期存款关键:选择分组关键:选择分组标志标志 数数量标志分组量标志分组 反映事物数量差异反映事物数量差异 工人按月工资分组工人按月工资分组(元元 )1000-2000 2000-3000 3000-4000 关键:选择分组标志关键:选择分组标志和划定各组数量界限和划定各组数量界限工人平均日产量(件)工人平均日产量(件)5 6 7 8 9单项式分组单项式分组 一个变量值对应一组;一个变量值对应一组;组组距距式式分分组组把把整整个个变变量量值值依依次次划划分分为为几几个个区区间间,一一 个区间对应一组个区间对应一组按数量标志进行

33、分组,可能有两种情况:按数量标志进行分组,可能有两种情况:对对于于离离散散变变量量,如如果果变变量量值值的的变变动动幅幅度度小小,就就可可以以一一个个变变量量值值对对应应一一组组,如如居居民民家家庭庭按按儿儿童童数数或或人人口口数数分分组组,均均可可采采用用单单项项式式分分组组。如如果果变变量量值值的的变变动动幅幅度度很很大大,变变量量值值的的个个数数很很多多,则则把把整整个个变变量量值值依依次次划划分分为为几几个个区区间间,进行组距式分组。进行组距式分组。对对于于连连续续变变量量,由由于于不不能能一一一一列列举举其其变变量量值值,只只能能采采用用组组距距式式的的分分组组方方式式,且且相相邻邻

34、的的组组限限必必须须重重叠叠。如如以以总总产产值值、商商品品销销售售额额、劳劳动动生生产产率率、工工资资等等为为标标志志进进行行分分组组,就只能是相邻组限重叠的组距式分组。就只能是相邻组限重叠的组距式分组。按按分组分组标志的标志的多少有多少有:简简单分组单分组 按一个标志对总体进行分组。按一个标志对总体进行分组。按存款性质分组按存款性质分组 企业存款企业存款 储蓄存款储蓄存款 财政性存款财政性存款再如:人口性别分组、人口年龄分组等。再如:人口性别分组、人口年龄分组等。复复合分组合分组 按两个或两个以上标志对总体进行分组。按两个或两个以上标志对总体进行分组。存款同时按其性质及期限分组存款同时按其

35、性质及期限分组 企业存款企业存款 活期活期 定期定期 储蓄存款储蓄存款 活期活期 定期定期 财政性存款财政性存款 活期活期 定期定期复合分组的特点:复合分组的特点:1、总总体体选选择择两两个个或或两两个个以以上上标标志志进进行行重重叠叠分分组组,可可以以从从几几个个不不同同角角度度了了解解总总体体内内部部的的差差别别和和关关系,研究问题更全面、更深入。系,研究问题更全面、更深入。2、复复合合分分组组的的组组数数随随分分组组标标志志的的增增加加而而成成倍倍增增加加,因因而而在在采采用用复复合合分分组组时时,选选择择的的分分组组标标志志的的数数量量要要适适量量,并并且且要要考考虑虑只只有有在在总总

36、体体包包括括的的单位数较多单位数较多时,才宜于采用复合分组。时,才宜于采用复合分组。我国工业企业复合分组表我国工业企业复合分组表 公有经济公有经济非公有经济非公有经济国有经济国有经济其中:大型企业其中:大型企业 中型企业中型企业 小型企业小型企业集体经济集体经济其中:大型企业其中:大型企业 中型企业中型企业 小型企业小型企业私有经济私有经济其中:大型企业其中:大型企业 中型企业中型企业 小型企业小型企业港澳台经济港澳台经济其中:大型企业其中:大型企业 中型企业中型企业 小型企业小型企业外商经济外商经济其中:大型企业其中:大型企业 中型企业中型企业 小型企业小型企业分组体系分组体系指同时使用两个

37、以上标志分指同时使用两个以上标志分组时,分组标志的组合形式。组时,分组标志的组合形式。各分组标志并列使用各分组标志并列使用各分组标志交叉结合使用各分组标志交叉结合使用平行分组体系平行分组体系复合(交叉)分组体系复合(交叉)分组体系 平行分组体系平行分组体系对教师对教师的分类的分类按性别分类按性别分类男性男性女性女性按职称分类按职称分类按年龄分类按年龄分类高级高级中级中级初级初级青年青年中年中年共计共计7组组 2+3+2 复合分组体系复合分组体系按性别按性别分类分类按职称按职称分类分类按年龄按年龄分类分类男男女女高级高级中级中级初级初级青年青年中年中年共计共计12组组232对教师对教师的分类的分

38、类第三节第三节 次数分布及其显示次数分布及其显示一、分布数列的定义及种类一、分布数列的定义及种类二、变量数列的编制二、变量数列的编制三、累计次数与累计频率三、累计次数与累计频率四、统计图四、统计图指总体按一个或几个标志分组后,指总体按一个或几个标志分组后,所形成的按一定顺序排列总体各单所形成的按一定顺序排列总体各单位在各组的分布。位在各组的分布。它是在统计分组的基础上,将总体它是在统计分组的基础上,将总体的所有单位按组归类,并把所有的的所有单位按组归类,并把所有的组及其单位数按一定顺序排列而成组及其单位数按一定顺序排列而成的。的。分布数列分布数列分布数列包括分布数列包括两个要素两个要素:一是总

39、体按某标志所分的组;一是总体按某标志所分的组;二是各组所占有的总体单位数二是各组所占有的总体单位数 意意义义:分分配配数数列列是是统统计计分分组组结结果果的的主主要要表表现现形形式式,也也是是统统计计分分析析的的一一种种重重要要方方法法。它它可可以以表表明明总总体体单单位位在在各各组组的的分分布布特特征征、结结构构状状况况,并并在在这这个个基基础础上上来来进进一一步研究标志的构成、平均水平及其变动规律性。步研究标志的构成、平均水平及其变动规律性。各组的单位数叫次数(各组的单位数叫次数(频频数数),记为,记为f f。各组的单位数与总体单位总数之比叫各组的单位数与总体单位总数之比叫 频频率率,记为

40、记为例例月工资分组月工资分组(元元)工人数工人数(人人)占总数比重占总数比重(%)1000 以下以下210 39.61000-1500187 35.31500 以上以上133 25.1合合 计计530100.0 例例月工资分组月工资分组(元元)工人数工人数(人人)占总数比重占总数比重(%)1000 以下以下210 39.61000-1500187 35.31500 以上以上133 25.1合合 计计530100.0 组别组别(变量变量)次数次数(频数频数)频率频率 变量数列变量数列品质数列品质数列分分类类异距数列异距数列等距数列等距数列组距数列组距数列单项数列单项数列品质标志的频数分布品质标志

41、的频数分布受教育程度受教育程度人口数(万人)人口数(万人)大学(指大专以上)大学(指大专以上)45714571高中(含中专)教育高中(含中专)教育1410914109初中教育初中教育4298942989小学教育小学教育4519145191未接受教育未接受教育1972319723合计合计126583126583表表3.1 中国人口受教育程度中国人口受教育程度练习练习 中国名人榜中国名人榜100100强强表表3.2 中国名人中国名人30强职业强职业运动员运动员演员演员运动员运动员演员演员歌手歌手导演导演演员演员歌手歌手演员演员演员演员演员演员演员演员歌手歌手演员演员演员演员运动员运动员运动员运动员

42、导演导演演员演员演员演员演员演员组合组合组合组合演员演员歌手歌手歌手歌手演员演员演员演员歌手歌手导演导演表表3.2 中国名人中国名人30强职业强职业职业运动员演员歌手导演组合合计划记频数41563230单项数列单项数列指每个组值只用一个具体的指每个组值只用一个具体的变量值表现的数列变量值表现的数列同时同时同时同时具备具备具备具备变量数列的编制变量数列的编制变量是离散变量变量是离散变量变量的不同取值个数较少变量的不同取值个数较少编制条件编制条件:【例例例例】己知某车间有己知某车间有24名工人,他们的日产量(件)名工人,他们的日产量(件)分别是:分别是:20,23,20,24,23,21,22,2

43、5,26,20,21,21,22,22,23,22,22,24,25,21,22,21,24,23.要求根据以上资料编制变量数列。要求根据以上资料编制变量数列。日产量(件)日产量(件)日产量(件)日产量(件)X X工人数(人工人数(人工人数(人工人数(人)f20202121222223232424252526263 35 56 64 43 32 21 1合计合计合计合计2424编制结果如下:编制结果如下:组距数列组距数列指每个组的变量值用一个区指每个组的变量值用一个区间来表现的变量数列间来表现的变量数列变量是连续变量;变量是连续变量;或:或:总体单位数较多,变量不同总体单位数较多,变量不同取值

44、个数也较多的离散变量。取值个数也较多的离散变量。编制条件编制条件:变量值变动区间的长度相等变量值变动区间的长度相等变量值变动区间的长度不完全相等变量值变动区间的长度不完全相等等距数列等距数列异距数列异距数列 相关概念相关概念指每组两端表示各组界限的变量值,指每组两端表示各组界限的变量值,各组的最小值为下限,最大值为上限各组的最小值为下限,最大值为上限组限组限每组变量值变动区间的长度,为上每组变量值变动区间的长度,为上下限之差下限之差组距组距每组变量取值范围的中点数值每组变量取值范围的中点数值 组中值组中值组距的上限、下限都齐全的叫组距的上限、下限都齐全的叫闭口组闭口组,在闭口组中,在闭口组中,

45、组距组距=上限上限下限下限 2组中值组中值=上限上限+下限下限编编制制组组距距数数列列时时,为为了了避避免免出出现现空空组组,同同时时又又能能使使个个别别极极大大或或极极小小的的数数据据不不至至于于无无组组可可归归,常常使使用用“x x x x 以以上上”或或“x x x x 以下以下”这种不确定具体组限的组,称为这种不确定具体组限的组,称为开口组开口组,在开口组中在开口组中缺上限的开口组组中值缺上限的开口组组中值=下限下限+邻组组距邻组组距2缺下限的开口组组中值缺下限的开口组组中值=上限上限邻组组距邻组组距2某地区某地区100个百货商店个百货商店月销售额与流通费用情况月销售额与流通费用情况销

46、售额(万销售额(万元)元)商店数商店数(个)(个)每百元商品销售每百元商品销售额中支付的流通额中支付的流通费(元)费(元)50以下以下50100100200200300300以上以上102030251514.211.410.19.28.5上限上限U下限下限L如:组距如:组距d=U-L=100-50=50(万元)(万元)如:组中值如:组中值x=(U+L)/2 =(100+200)/2=150(万元)(万元)编制等距数列编制等距数列适用于总体单位的标志值适用于总体单位的标志值变动比较均匀的情况变动比较均匀的情况实例实例己知某地区某年己知某地区某年己知某地区某年己知某地区某年5050个商店商品销售额

47、的资料如下(单个商店商品销售额的资料如下(单个商店商品销售额的资料如下(单个商店商品销售额的资料如下(单位:百万元):位:百万元):位:百万元):位:百万元):7.4 12.6 29.0 2.0 12.4 7.0 14.8 17.5 15.0 18.2 7.4 12.6 29.0 2.0 12.4 7.0 14.8 17.5 15.0 18.2 18.7 15.5 12.8 26.0 17.3 8.3 14.7 12.0 3.5 6.8 18.7 15.5 12.8 26.0 17.3 8.3 14.7 12.0 3.5 6.8 25.0 19.3 6.4 4.0 11.9 8.5 13.2

48、14.5 17.1 15.6 25.0 19.3 6.4 4.0 11.9 8.5 13.2 14.5 17.1 15.6 13.4 4.5 9.5 20.0 15.7 6.0 11.4 23.0 14.2 16.7 13.4 4.5 9.5 20.0 15.7 6.0 11.4 23.0 14.2 16.7 21.0 16.0 13.6 10.0 13.9 5.0 5.8 10.5 16.3 22.021.0 16.0 13.6 10.0 13.9 5.0 5.8 10.5 16.3 22.0要求编制组距数列。要求编制组距数列。编制步骤:编制步骤:求变异全距求变异全距确定组距及组数确定组距及

49、组数确定组距的原则:确定组距的原则:q要能区分各组的性质差异要能区分各组的性质差异q要能反映总体资料的分布特征要能反映总体资料的分布特征q为方便计算,尽可能为为方便计算,尽可能为5 5或或1010的整数倍的整数倍R组距组距(d)组数(组数(m)编制等距数列编制等距数列计算组数(组数不宜过多,也不宜太少)计算组数(组数不宜过多,也不宜太少)上例中,取上例中,取d=5d=5,则有,则有编制等距数列编制等距数列(当(当 的结果为整数时)的结果为整数时)(当(当 的结果为小数时)的结果为小数时)确定组限确定组限q对于离散变量,相邻组组限可以间断,也对于离散变量,相邻组组限可以间断,也可重叠;可重叠;q

50、对于连续变量,相邻组组限必须重叠;对于连续变量,相邻组组限必须重叠;q符合符合“上组限不计入上组限不计入”原则;原则;q首末两组可使用首末两组可使用“以下以下”及及“以以上上”的开口组。的开口组。组限的表示方法组限的表示方法计算次数计算次数编编制制结结果:果:销售额(百销售额(百万元)万元)组中值组中值商店数商店数5以下以下51010151520202525以上以上2.57.512.517.522.527.5410161343合计合计50(5+(5-5))/2=2.5(25+(25+5))/2=27.5 练习:练习:现有现有1010名工人日产量资料(件):名工人日产量资料(件):4545、46

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com