二章统计数据的搜集整理和显示教案.ppt

上传人:豆**** 文档编号:59578373 上传时间:2022-11-11 格式:PPT 页数:115 大小:1.02MB
返回 下载 相关 举报
二章统计数据的搜集整理和显示教案.ppt_第1页
第1页 / 共115页
二章统计数据的搜集整理和显示教案.ppt_第2页
第2页 / 共115页
点击查看更多>>
资源描述

《二章统计数据的搜集整理和显示教案.ppt》由会员分享,可在线阅读,更多相关《二章统计数据的搜集整理和显示教案.ppt(115页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、二章统计数据的搜集整理和显示 Still waters run deep.流静水深流静水深,人静心深人静心深 Where there is life,there is hope。有生命必有希望。有生命必有希望v统计学是一门有关统计数据处理的科统计学是一门有关统计数据处理的科学,统计学与统计数据密不可分。学,统计学与统计数据密不可分。v如何搜集到所需数据,并对这些数据如何搜集到所需数据,并对这些数据进行加工处理形成有用的信息,并用进行加工处理形成有用的信息,并用简洁明了的方式显示出来,是本章所简洁明了的方式显示出来,是本章所要讨论的问题。要讨论的问题。第一节第一节 统计资料的搜集统计资料的搜集

2、一一、统计调查定义统计调查定义二二、统计调查方案设计统计调查方案设计 三三、统计调查方法统计调查方法四四、统计调查组织形式统计调查组织形式五五、统计调查体系统计调查体系一、统计调查的定义一、统计调查的定义统计调查:它是根据统计研究预定的目的统计调查:它是根据统计研究预定的目的要求和任务,运用科学的调查方法有计划、要求和任务,运用科学的调查方法有计划、有组织地向客观实际搜集资料的过程。有组织地向客观实际搜集资料的过程。简言之,统计调查是搜集原始数据资料的统计活动过程。统计调查是整个统计认识活动的基础,统计调查是整个统计认识活动的基础,决定着统计认识过程及其结果的成败决定着统计认识过程及其结果的成

3、败 二、统计调查方案的设计二、统计调查方案的设计为使统计调查顺利进行,在组织调查之前必为使统计调查顺利进行,在组织调查之前必须首先设计一个周密、可行的调查方案,包须首先设计一个周密、可行的调查方案,包括:括:1.明确调查目的(明确调查目的(why)明确统计调查要解决什么问题。明确统计调查要解决什么问题。即回答即回答“为什么要进行统计调查为什么要进行统计调查”。2.确定调查对象和调查单位(确定调查对象和调查单位(who)(1 1)调查对象是调查研究的总体或调查范围。)调查对象是调查研究的总体或调查范围。调查对象调查对象=调查范围调查范围=统计总体统计总体 (2 2)调查单位是指要调查的具体单位,

4、它是)调查单位是指要调查的具体单位,它是进行调查登记的标志承担者。进行调查登记的标志承担者。(3 3)确定调查对象和调查单位,)确定调查对象和调查单位,即回答即回答“向谁向谁调查调查”的问题。的问题。当调查单位自己负责向上报告时,它同时也是填当调查单位自己负责向上报告时,它同时也是填报单位;当调查单位的资料由它的上级组织或其报单位;当调查单位的资料由它的上级组织或其它组织收集整理并向上报告时,填报单位与报告它组织收集整理并向上报告时,填报单位与报告单位则不一致。单位则不一致。注意注意调查单位调查单位与与填报单位填报单位 的区别:的区别:3.确定调查项目(确定调查项目(what)调查项目:向调查

5、单位调查的具体内容。调查项目:向调查单位调查的具体内容。它是有一系列品质标志和数量标志构成。它是有一系列品质标志和数量标志构成。确定调查项目,即回答确定调查项目,即回答“调查什么调查什么”的问的问题。题。Q Q1 1 Q Q2 2 Q Q3 3 Q Q4 4 4.设计调查表与问卷设计调查表与问卷把若干调查项目按照一定的顺序排列在表把若干调查项目按照一定的顺序排列在表格上就构成了格上就构成了调查表调查表。一般有两种:。一般有两种:一览表:全部被调查单位共一份 单一表:每个被调查单位一份问卷问卷以书面文字或表格的形式了解被调查以书面文字或表格的形式了解被调查者的意见,被调查者可自愿、自由回答问者的

6、意见,被调查者可自愿、自由回答问卷中的问题。卷中的问题。表头表头表体表体表尾表尾名称、编号、名称、编号、制表单位、填制表单位、填表日期等等表日期等等被调查者的基被调查者的基本情况、调查本情况、调查项目等等项目等等备注、说明、备注、说明、指标解释等指标解释等调查表的基本结构:调查表的基本结构:e.g.课本课本p23点点 名名 册册序号序号学号学号姓姓 名名性别性别第第 周周19901张晓岚张晓岚女女29902施元娜施元娜女女39903李李 浩浩男男49904刘刘 光光男男59905王王 英英女女69906陈陈 真真男男损损 益益 表表项项 目目本月数本月数本年累计数本年累计数一、产品销售收入一、

7、产品销售收入 减减:产品销售成本产品销售成本 产品销售费用产品销售费用 产品销售税金及附加产品销售税金及附加二、产品销售利润二、产品销售利润 加:其他业务利润加:其他业务利润 5.确定调查时间(确定调查时间(when)调查时间有两个含义:调查时间有两个含义:(1)调查时间指调查资料所属的时间。)调查时间指调查资料所属的时间。(具体有时点或时期资料具体有时点或时期资料)(2)调查期限是指进行调查工作的的时限)调查期限是指进行调查工作的的时限,即调查工作的起止时间。即调查工作的起止时间。e.g.我国第五次人口普查我国第五次人口普查(2000年年11月月1日零日零点点(调查时间,时点)(调查时间,时

8、点);2000年年11月月1日到日到10日日,(调查期限(调查期限10天)天))http:/ 洁银(洁银()b 两面针两面针()c 黑妹(黑妹()d 中华中华 ()e 黑人(黑人()f 佳洁士佳洁士()g 高露洁(高露洁()h 雕牌雕牌 ()(3题多项选择法)题多项选择法)4、评分标准、评分标准很好(很好(10分)分)好(好(8分)较分)较好(好(6分)一般(分)一般(4分)差分)差(2分)分)v请按以上的评分标准给第请按以上的评分标准给第三题中列出的牙膏质量评三题中列出的牙膏质量评定分数,分数填入括号内。定分数,分数填入括号内。(赋值选择法)(赋值选择法)v5、你对我厂生产的中华、你对我厂生

9、产的中华牌牙膏有什么意见?牌牙膏有什么意见?。(自由回答法)(自由回答法)实践作业:实践作业:请就仰恩大学新区食堂状请就仰恩大学新区食堂状况制定调查方案和调查问卷。况制定调查方案和调查问卷。(做到作业本上面,要求上交)(做到作业本上面,要求上交)三三、统计调查方法、统计调查方法1.直接观察法直接观察法2.报告法报告法3.采访法采访法4.登记法登记法5.卫星遥感法卫星遥感法6.电脑辅助法电脑辅助法 要求:参考课本简单了解各种方法。要求:参考课本简单了解各种方法。四四、统计调查的组织形式、统计调查的组织形式统计调查组织形式是指组织统计调查,统计调查组织形式是指组织统计调查,搜集统计资料的方式方法。

10、具体有:搜集统计资料的方式方法。具体有:统计报表统计报表普查普查抽样调查抽样调查重点调查重点调查 典型调查典型调查统计调查形式示意图统计调查形式示意图(p.24)统统计计调调查查形形式式调查调查范围范围全面全面:报表报表,普查普查非全面非全面:抽样抽样,重点重点,典型典型调查调查时间时间连续连续:如值班记录如值班记录不连续不连续:一次性一次性,周期性周期性调查调查形式形式定期报表定期报表专门专门:普查普查,抽样抽样,重点重点,典型典型1.统计报表制度统计报表制度 Report Form 我国各单位,按照法定表式,定期自下而上,逐级上报的一种行政经济管理制度。用于用于:管理有关系统的日常管理有关

11、系统的日常 经济运行情况经济运行情况统计报表制度的特点统计报表制度的特点 我国特有我国特有计划经济遗产计划经济遗产 项目稳定项目稳定国家法定国家法定 资料连续资料连续工作记录工作记录 逐级上报逐级上报 一般获得一般获得时期数据(时期数据与时间长时期数据(时期数据与时间长度有关;不同时期数据可加;流量指标)度有关;不同时期数据可加;流量指标)2.普查普查 General Investigation为特定目的而专门组织的一次性为特定目的而专门组织的一次性的全面调查。的全面调查。用于用于:掌握总体基本资源情况掌握总体基本资源情况特点特点:专门目的专门目的 全面调查全面调查 非连续性非连续性:一次性或

12、周期性一次性或周期性3.抽样调查抽样调查 按按随机原则随机原则,从总体中从总体中抽取部分单位抽取部分单位,进行的一种进行的一种非全面调查。非全面调查。随机原则随机原则:保证总体中每个单位被抽中的可保证总体中每个单位被抽中的可能性相等。能性相等。抽样调查的基本原理抽样调查的基本原理v基本原理基本原理 推断抽样调查的特点抽样调查的特点 样本单位采用随机原则抽取,排除了样本单位采用随机原则抽取,排除了主观因素的影响。主观因素的影响。抽样调查的目的是用部分信息推算总体抽样调查的目的是用部分信息推算总体信息。信息。抽样误差可以计算并且可以事先加以控抽样误差可以计算并且可以事先加以控制。制。抽样调查成本低

13、抽样调查成本低,效率高,时效性强。效率高,时效性强。抽样调查适用的场合抽样调查适用的场合不可能或不必要进行全面调查不可能或不必要进行全面调查.e.g.e.g.无限总体无限总体,产品寿命产品寿命(破坏性破坏性);螺钉;螺钉,汽水是否合格汽水是否合格(低值产品低值产品)。对普查资料进行必要的修正。对普查资料进行必要的修正。e.g.人口普查后,再做人口普查后,再做10%的抽样调查。的抽样调查。自动生产线上的自动生产线上的“实时实时”控制控制 e.g.螺钉生产螺钉生产,饮料灌装饮料灌装假设检验假设检验(见见p.146 5.2)p.146 5.2)e.g.海关快速商检海关快速商检抽样调查要遵循的原则抽样

14、调查要遵循的原则 科学组织抽样调查科学组织抽样调查,必须遵循一定的原则必须遵循一定的原则,以以保证抽样法符合概率论和数理统计有关定理保证抽样法符合概率论和数理统计有关定理的要求的要求,从而才能用这些定理进行推断。这些从而才能用这些定理进行推断。这些定理要求定理要求:所研究变量为随机变量所研究变量为随机变量 遵循最大抽样效果原则遵循最大抽样效果原则 4.重点调查重点调查(1 1)概念)概念从调查对象中选取一部分从调查对象中选取一部分重点单位重点单位进行的进行的非全面调查。非全面调查。优点:快捷,成本低。这些单位数目不多,这些单位数目不多,这些单位数目不多,这些单位数目不多,但其标志值在总体但其标

15、志值在总体但其标志值在总体但其标志值在总体标志总量中占有较标志总量中占有较标志总量中占有较标志总量中占有较大比重,能反映总大比重,能反映总大比重,能反映总大比重,能反映总体的基本情况体的基本情况体的基本情况体的基本情况(2)适用条件)适用条件当调查任务只要求掌握基本情况,而部分当调查任务只要求掌握基本情况,而部分单位又能比较集中地反映研究的项目,采单位又能比较集中地反映研究的项目,采用重点调查比较适宜。用重点调查比较适宜。e.g.e.g.要了解我国钢铁生产情况,就可以对要了解我国钢铁生产情况,就可以对我国钢铁行业重点单位鞍钢,首钢,包我国钢铁行业重点单位鞍钢,首钢,包钢,武钢,宝钢,攀钢进行调

16、查。钢,武钢,宝钢,攀钢进行调查。5.5.典型调查典型调查(1 1)概念)概念在对调查对象有一定了解的基础上,有意在对调查对象有一定了解的基础上,有意识地选择少数识地选择少数典型单位典型单位 进行调查的一种非进行调查的一种非全面调查组织方式全面调查组织方式目的:描述和揭示事物的本质特征和规律目的:描述和揭示事物的本质特征和规律指在数量表现上具指在数量表现上具有普遍意义和代表有普遍意义和代表性的总体单位。性的总体单位。(2)适用条件)适用条件要求对事物有深入的了解,要弄清事物的发要求对事物有深入的了解,要弄清事物的发展规律。展规律。典型调查适于深入典型单位,结合实际情典型调查适于深入典型单位,结

17、合实际情况,总结其成功的经验和失败的教训,有助况,总结其成功的经验和失败的教训,有助于全面工作的发展。于全面工作的发展。特别适用于了解新情况、解决新问题的调查。特别适用于了解新情况、解决新问题的调查。五、我国统计调查体系五、我国统计调查体系建立以必要的周期性普查为基础,经常性建立以必要的周期性普查为基础,经常性的抽样调查为主体,同时辅之以重点调查的抽样调查为主体,同时辅之以重点调查、科学推算和少量的全面报表综合运用的、科学推算和少量的全面报表综合运用的统计调查体系模式。统计调查体系模式。第二节第二节 数据整理数据整理一、统计整理的一般问题一、统计整理的一般问题二、统计分组二、统计分组一、统计整

18、理的一般问题一、统计整理的一般问题v 统计整理的概念统计整理的概念v 统计整理的内容和程序统计整理的内容和程序把把原始数据原始数据进行进行排序排序,分组分组,汇总汇总,编表编表和和绘图绘图,显示其显示其分布特征分布特征的工作过程。的工作过程。v广义的统计整理也包括对原来已经加工的综合资广义的统计整理也包括对原来已经加工的综合资料的再整理。料的再整理。如历史资料的整理、统计年鉴的编如历史资料的整理、统计年鉴的编辑、次级资料(如各出版物公布的)的加工整理辑、次级资料(如各出版物公布的)的加工整理等。等。v统计整理是统计工作的第二阶段。这个阶段是统计整理是统计工作的第二阶段。这个阶段是统统计调查计调

19、查的继续,的继续,统计分析统计分析的前提。的前提。(一)统计整理的含义(一)统计整理的含义承上启下的作用承上启下的作用(二)统计整理的内容和程序(二)统计整理的内容和程序1.审核统计资料。审核统计资料。包括:完整性、准确性。包括:完整性、准确性。2.进行统计分组。进行统计分组。这是统计整理的关键问题。这是统计整理的关键问题。3.进行统计汇总。进行统计汇总。统计汇总,即在统计分组的基础上,将统计资统计汇总,即在统计分组的基础上,将统计资料归并到各组中去,并计算各组和总体的合料归并到各组中去,并计算各组和总体的合计数(包括单位总数和标志总量)的工作过计数(包括单位总数和标志总量)的工作过程。程。4

20、.编制统计表或统计图。编制统计表或统计图。统计整理的结果。统计整理的结果。5.资料的积累、保管和公布。资料的积累、保管和公布。统计资料的审核统计资料的审核 审核的内容审核的内容v完整性审核完整性审核检查应调查的单位或个体是否有遗漏检查应调查的单位或个体是否有遗漏所有的调查项目是否填写齐全所有的调查项目是否填写齐全v准确性审核准确性审核检查数据是否真实反映客观实际情况,检查数据是否真实反映客观实际情况,内容是否符合实际内容是否符合实际检查数据是否有错误,计算是否正确等检查数据是否有错误,计算是否正确等二、统计分组二、统计分组v统计分组的含义统计分组的含义v统计分组的原则统计分组的原则v统计分组的

21、种类统计分组的种类v统计分组的方法统计分组的方法v组距、组中值的计算组距、组中值的计算(一一)统计分组的含义统计分组的含义1.概念概念根据统计总体内在的特征与统计研究的任务需要,将根据统计总体内在的特征与统计研究的任务需要,将统计总体按照一定的标志划分为若干组成部分的一种统计总体按照一定的标志划分为若干组成部分的一种统计方法。统计方法。统计分组兼有统计分组兼有“分分”和和“合合”的双重含义:的双重含义:对于现象总体,是对于现象总体,是“分分”;对于单位,是;对于单位,是“合合”。2.目的目的在于把同质总体中的按照某一标志具有不同性质的单在于把同质总体中的按照某一标志具有不同性质的单位分开,把性

22、质相同的单位合并在一起,保持各组内位分开,把性质相同的单位合并在一起,保持各组内统计资料的一致性和各组之间资料的差异性。统计资料的一致性和各组之间资料的差异性。1.穷尽原则(不漏)穷尽原则(不漏)即总体中每一个个体都必即总体中每一个个体都必须有组可归。须有组可归。e.g.对西藏民族学院学生按民族分为:藏族和汉族两对西藏民族学院学生按民族分为:藏族和汉族两组,则可能会漏了一些其他民族的学生。正确应该分为:组,则可能会漏了一些其他民族的学生。正确应该分为:2.互斥原则(不重)互斥原则(不重)即总体中任何一个单位都即总体中任何一个单位都只能属于一个组,而不能同时属于几个组。只能属于一个组,而不能同时

23、属于几个组。e.g.某商场把服装分为男装、女装和童装三类,就不符某商场把服装分为男装、女装和童装三类,就不符合互斥原则。若先把服装分为成年与儿童两类,然后再合互斥原则。若先把服装分为成年与儿童两类,然后再分为男女两组,就符合互斥原则。分为男女两组,就符合互斥原则。(二)统计分组的原则(二)统计分组的原则(三)统计分组的种类(三)统计分组的种类1.按分组标志的多少按分组标志的多少简单分组和复合分组。简单分组和复合分组。(1)简单分组简单分组就是对研究对象按一个标志进就是对研究对象按一个标志进行分组。行分组。e.g.学生总体按性别、专业等进行的分组学生总体按性别、专业等进行的分组。(2)复合分组复

24、合分组就是对研究对象按两个或两个就是对研究对象按两个或两个以上标志进行分组。以上标志进行分组。e.g.企业总体按经济类型进行分类后,各类再按企业总体按经济类型进行分类后,各类再按规模进行分类。(课本规模进行分类。(课本p31)2.按分组标志的性质不同按分组标志的性质不同品质分组和数品质分组和数量分组(变量分组)。量分组(变量分组)。(1)品质分组品质分组就是按照品质标志进行的分组。就是按照品质标志进行的分组。(2)数量分组数量分组也称变量分组,就是按照数量也称变量分组,就是按照数量标志进行的分组。标志进行的分组。数量分组时数量界限的确定必须反映事物数量分组时数量界限的确定必须反映事物质质的区别

25、。的区别。例例 1 为了了解某地区银行存款的构成,可以选用为了了解某地区银行存款的构成,可以选用存款性存款性质质和和期限期限两个标志分别进行分组:两个标志分别进行分组:按存款性质分组按存款性质分组 企业存款企业存款 储蓄存款储蓄存款 财政性存款财政性存款按存款期限分组按存款期限分组 活期存款活期存款 定期存款定期存款简单分组复合分组存款同时按其性质及期限分组存款同时按其性质及期限分组 企业存款企业存款 活期活期 定期定期 储蓄存款储蓄存款 活期活期 定期定期 财政性存款财政性存款 活期活期 定期定期例例2 企业职工按工龄分组企业职工按工龄分组:5年以下年以下 510年年 1015年年 1520

26、年年 20年以上年以上品质分组数量分组(四)统计分组的方法(四)统计分组的方法 统计分组的关键在于统计分组的关键在于选择分组标志选择分组标志和和划分各划分各组界限组界限。1、选择分组标志、选择分组标志统计分组的核心问题统计分组的核心问题分分组组标标志志是是将将总总体体区区分分为为各各个个性性质质不不同同的的组组的的标准或依据。标准或依据。选择分组标志的原则选择分组标志的原则是:根据统计研究的是:根据统计研究的目的目的和任务和任务,选用那些最能反映现象,选用那些最能反映现象本质特征本质特征的标的标志作为分组标志。志作为分组标志。e.g.工业企业按照规模、部门分类;产品按照质量分类等。工业企业按照

27、规模、部门分类;产品按照质量分类等。2、选择分组种类、选择分组种类品质分组品质分组数量分组数量分组单项式分组单项式分组组距式分组组距式分组主要根据研究任务来选择。主要根据研究任务来选择。根据数量变动的特征不同来选择根据数量变动的特征不同来选择具体来说:具体来说:(1)品质分组的方法:)品质分组的方法:品质标志的表现为定类和定序数据,这两类品质标志的表现为定类和定序数据,这两类数据本身就是对事物的一种分类,因此分类数据本身就是对事物的一种分类,因此分类标志确定后组数和组的名称也就相应确定。标志确定后组数和组的名称也就相应确定。3.确定组数、组距,划分各组的界限(对数量分组)确定组数、组距,划分各

28、组的界限(对数量分组)品质分组社会经济 企业 人口分 组(标志表现)分组标志分组对象部门 所有制 所属行业政治面貌 性别(2)数量分组的方法:)数量分组的方法:按数量标志进行分组,还要确定相应的组距和按数量标志进行分组,还要确定相应的组距和组数,然后确定组限进行分组。组数,然后确定组限进行分组。这种分组要注意以下两个问题:这种分组要注意以下两个问题:一是分组时各组数量组限的确定必须能反映事一是分组时各组数量组限的确定必须能反映事物物质质的差别。的差别。二是二是根据研究总体的数量特征,采用适当的分根据研究总体的数量特征,采用适当的分组形式,确定相宜的组距和组限。组形式,确定相宜的组距和组限。数(

29、变)量分组数(变)量分组单项式分组a.概念:概念:把把一个变量值一个变量值作为一组,总体中有多少个不同作为一组,总体中有多少个不同的变量值就要分多少个组。的变量值就要分多少个组。b.适用:适用:离散型变量且变量值变动范围不大的总体。离散型变量且变量值变动范围不大的总体。e.g.某厂工人按工龄、文化程度等分组。某厂工人按工龄、文化程度等分组。单项式分组表(实例)表表3-4 某车间某车间50名工人日加工零件数分组表名工人日加工零件数分组表零件数零件数(个个)频数频数(人人)零件数零件数(个个)频数频数(人人)零件数零件数(个个)频数频数(人人)107108110112113114115117118

30、121211133119120121122123124125126127121443223128129130131133134135137139211122112组距式分组组距式分组a.概念:概念:将总体分为若干个区间,把将总体分为若干个区间,把一段区间上一段区间上的变量值的变量值作为一组,这样的分组称为组距式分组。通常描作为一组,这样的分组称为组距式分组。通常描述述到到。e.g.某企业工人按工资进行分组,低于800,8001000,10001500,15002000,2000以上等。b.适用:适用:连续型的变量;连续型的变量;离散型变量且变动范围大。离散型变量且变动范围大。c.组距分组中的基

31、本概念组距分组中的基本概念()组数组数:就是将总体分为多少组。就是将总体分为多少组。组距式单项式 分组 变量变量值较多变量值不多(只能采用)不宜过多也不宜过少,不宜过多也不宜过少,一般一般 515 组组连续型离散型组组 数数()组限组限组限组限:相邻两组的界限相邻两组的界限相邻两组的界限相邻两组的界限组距分组中,每组包含许多变量值,每组组距分组中,每组包含许多变量值,每组组距分组中,每组包含许多变量值,每组组距分组中,每组包含许多变量值,每组变量值中,其最小值为下限变量值中,其最小值为下限变量值中,其最小值为下限变量值中,其最小值为下限(low limit)(low limit),最大值为上限

32、最大值为上限最大值为上限最大值为上限(upper limit)(upper limit)。vv闭口组闭口组闭口组闭口组 上下限都有的组;上下限都有的组;上下限都有的组;上下限都有的组;vv开口组开口组开口组开口组 只有上限或下限的组。只有上限或下限的组。只有上限或下限的组。只有上限或下限的组。连续分组时,重叠式组限采用连续分组时,重叠式组限采用连续分组时,重叠式组限采用连续分组时,重叠式组限采用“上限不上限不上限不上限不在组内在组内在组内在组内”的原则;的原则;的原则;的原则;()组距组距(class width):上下限之间的距上下限之间的距离。离。v组距与组数成组距与组数成反比反比关系;关

33、系;v开口组也有组距,其组距取其组距取相邻组相邻组的的组距。组距。v根据各组的组距是否相等,可以分为等根据各组的组距是否相等,可以分为等距分组和异距分组距分组和异距分组斯特杰斯经验公式:斯特杰斯经验公式:d.组距和组数的确定组距和组数的确定注:注:N为总体单位数为总体单位数()等距分组和异距分组)等距分组和异距分组等距分组:等距分组:标志值在各组保持相等组距的分标志值在各组保持相等组距的分组。组。异距分组:异距分组:标志值在各组的组距不等的分组标志值在各组的组距不等的分组v适用情况:适用情况:等距式分组适用于总体各单位的变量值由等距式分组适用于总体各单位的变量值由小到大呈现均匀变化的情况。小到

34、大呈现均匀变化的情况。异距式分组则适用异距式分组则适用(见课本(见课本p34)v各种分组举例如表各种分组举例如表4-3。e.组距式分组的分类组距式分组的分类()连续组距分组和间断组距分组)连续组距分组和间断组距分组v根据相邻两组是否有共同的组限可分为:根据相邻两组是否有共同的组限可分为:间断组距式分组:间断组距式分组:组限不相连的分组。组限不相连的分组。连续组距式分组:连续组距式分组:组限相连,即以同一数值作为组限相连,即以同一数值作为相邻两组的共同界限的分组。相邻两组的共同界限的分组。v适用:适用:离散型变量离散型变量的各相邻组的组限的各相邻组的组限可以可以间断间断,如例,如例2中中第一组的

35、上限为第一组的上限为999人,第二组的下限为人,第二组的下限为1000人。人。连续型变量连续型变量的各相邻组的组限的各相邻组的组限必须必须重叠,如例重叠,如例3中中第一组的上限为第一组的上限为80元,第二组的下限为元,第二组的下限为80元。元。连续分组时,重叠组限采用连续分组时,重叠组限采用“上限不在组内上限不在组内”原则原则工资工资(元)(元)800-1000800-10001000-15001000-15001500-20001500-20002000-25002000-250025002500以上以上年龄年龄(岁)(岁)3-53-56-96-910-1410-1415-2015-2021

36、213535成绩成绩(分)(分)9090以上以上80-9080-9070-8070-8060-7060-706060以下以下统计分组类型辨析统计分组类型辨析v开口组:成绩、工资;v闭口组:年龄;v异距分组:工资、年龄;v等距分组:成绩;v连续组距式分组:工资、成绩;v间断组距式分组:年龄;f.组距与组中值的计算组距与组中值的计算()组距的计算:)组距的计算:v连续组距式:连续组距式:组距上限组距上限下限限v间断组距式:间断组距式:组距上限组距上限下限限1v间断组距式和连续组距式通用:间断组距式和连续组距式通用:组距本组上组距本组上(下)限前组上限前组上(下)限限 开口组以相邻组的组距作为本组组

37、距。开口组以相邻组的组距作为本组组距。组中值是上下限之间的中点数值组中值是上下限之间的中点数值组中值组中值缺下限的最小组的组中值缺下限的最小组的组中值上限相邻组的组距上限相邻组的组距22缺上限的最大组的组中值缺上限的最大组的组中值下限相邻组的组距下限相邻组的组距22()组中值)组中值(class midpoint)组 距(分)组 中 值(分)60 以下60 7070 8080 9090 以上成 绩(分)练习练习第三节第三节 频数分布频数分布 一、相关概念一、相关概念 二、分布数列的编制二、分布数列的编制 三、累计频数(频率)分布三、累计频数(频率)分布 四、频数分布的类型四、频数分布的类型一、

38、相关概念一、相关概念1.在统计分组的基础上,把总体全部单位按组在统计分组的基础上,把总体全部单位按组归类整理,将其按一定顺序加以排列,形成总归类整理,将其按一定顺序加以排列,形成总体中每一个单位在各组间的分布,称为体中每一个单位在各组间的分布,称为频数分频数分布(布(frequency distribution)。2.分布在各组中的数据个数,称为分布在各组中的数据个数,称为频数频数(frequency)。)。3.各组频数与总频数的比率称为各组频数与总频数的比率称为频率频率。4.将各组的频数或频率按一定的顺序排列而成将各组的频数或频率按一定的顺序排列而成的数列,称为的数列,称为分布数列分布数列。

39、频率的计算及性质:频率的计算及性质:二、分布数列的编制二、分布数列的编制(一)分布数列的两个要素分布数列的两个要素 分组分组(各组名称,常用(各组名称,常用x 表示)表示)两个构成要素两个构成要素 频数频数(各组次数,常用(各组次数,常用f表示)表示)各组的次数有两种表现形式:各组的次数有两种表现形式:绝对数也即绝对数也即频数频数,用,用 f 表示表示 相对数也即相对数也即频率频率,用,用表示)表示)(二)分布数列的编制分布数列的编制1.编制分布数列的程序编制分布数列的程序(数量分组数量分组)(1)资料排序并求资料排序并求 最大值、最小值、全最大值、最小值、全距;距;(2)确定数列类型确定数列

40、类型 单项式单项式or组距式?组距式?(3)确定确定组数组数和和组距组距 等距等距or异距?异距?(4)确定组限确定组限 开口组开口组or闭口组闭口组?(5)计量各组次数计量各组次数编制分布数列。编制分布数列。2.单项式变量数列的编制单项式变量数列的编制单项式变量数列一经确定,组数也就相应确定单项式变量数列一经确定,组数也就相应确定了,只要将各单位分到相应的组计算各组的次了,只要将各单位分到相应的组计算各组的次数,按顺序排列就得到单项式变量数列。数,按顺序排列就得到单项式变量数列。【例】:调查了【例】:调查了500户家庭的人口数量,其家户家庭的人口数量,其家庭人口数的分布为庭人口数的分布为15

41、人之间,现将调查资料人之间,现将调查资料整理并编制成分布数列的形式,如下:整理并编制成分布数列的形式,如下:单项式分组5以上4321户 数(户)f家庭人口(人)X 4.4 24.0 64.0 6.0 1.6比 重()22120320 30 8500合 计100.03.组距式变量数列的编制组距式变量数列的编制实例实例己知某地区某年己知某地区某年50个商店商品销售额的资料如下个商店商品销售额的资料如下(单位:百万元):(单位:百万元):7.4 12.6 29.0 2.0 12.4 7.0 14.8 17.5 15.0 18.2 18.7 15.5 12.8 26.0 17.3 8.3 14.7 1

42、2.0 3.5 6.8 25.0 19.3 6.4 4.0 11.9 8.5 13.2 14.5 17.1 15.6 13.4 4.5 9.5 20.0 15.7 6.0 11.4 23.0 14.2 16.7 21.0 16.0 13.6 10.0 13.9 5.0 5.8 10.5 16.3 22.0要求编制组距式分布数列。要求编制组距式分布数列。编制步骤:编制步骤:2.求变异全距,看用什么样的分组类型求变异全距,看用什么样的分组类型3.确定组距及组数确定组距及组数(1 1)确定组距的原则:)确定组距的原则:)确定组距的原则:)确定组距的原则:q要能区分各组的性质差异要能区分各组的性质差异

43、q要能反映总体资料的分布特征要能反映总体资料的分布特征q为方便计算,为方便计算,尽可能为尽可能为5 5或或1010的整数倍的整数倍R组距组距(d)组数(组数(m)对数据进行排序对数据进行排序(2)计算组数(组数不宜过多,也不宜太少)计算组数(组数不宜过多,也不宜太少)上例中,取上例中,取d=5d=5,则有,则有(当(当 的结果为整数时)的结果为整数时)(当(当 的结果为小数时)的结果为小数时)4.确定组限确定组限q对于离散变量,相邻组组限可以对于离散变量,相邻组组限可以间断间断,也,也可可重叠重叠;q对于连续变量,相邻组组限对于连续变量,相邻组组限必须重叠必须重叠;q符合符合“上限不在内上限不

44、在内”原则;原则;q首末两组可使用首末两组可使用“以下以下”及及“以以上上”的开口组。的开口组。组限的表示方法组限的表示方法5.分配总体单位,计算次数分配总体单位,计算次数 销售额销售额(百万元)(百万元)组中值组中值商店数商店数5以下以下51010151520202525以上以上2.57.512.517.522.527.5410161343合计合计505(10-5)/2=2.525+(2520)/2=27.5练习:练习:某生产车间某生产车间5050名工人加工零件个数名工人加工零件个数117 122 124 129 139 107 117 130 122 125108 131 125 117

45、122 133 126 122 118 108110 118 123 126 133 134 127 123 118 112 112 134 127 123 119 113 120 123 127 135 137 114 120 128 124 115 139 128 124 121对数据进行排序对数据进行排序计算全距计算全距 R=139-107=32确定组数确定组数 K=1+LgN/Lg2=1+Lg50/Lg2=6.6则可分为则可分为7组组确定各组组距确定各组组距 d=R/K=32/7=4.6则组距取则组距取5根据分组整理成频数表根据分组整理成频数表零件个数频数(人)频率(%)105-110

46、110-115115-120120-125125-130130-135135-140358141064610162820128合计50100某厂工人生产零件分布表(三)累计频数(频率)分布(三)累计频数(频率)分布 1.概念概念v将变量数列各组的频数或频率逐组累计将变量数列各组的频数或频率逐组累计相加而成相加而成累计频数分布或累计频率分布累计频数分布或累计频率分布v它表明总体在某一标志水平以上或以下它表明总体在某一标志水平以上或以下总共包含的总体单位的频数或频率。总共包含的总体单位的频数或频率。2.计算方法计算方法累计频数累计频数(频率频率)有以下两种计算方法有以下两种计算方法:(1)向上累计

47、)向上累计向上累计,又称向上累计,又称“以下累计以下累计”,是将各组频数或,是将各组频数或频率由变量值低的组向变量值高的组累计。频率由变量值低的组向变量值高的组累计。各累计数的意义是各组上限以下的累计次数或各累计数的意义是各组上限以下的累计次数或比率。比率。(2)向下累计)向下累计向下累计,又称向下累计,又称“以上累计以上累计”,是将各组频数或,是将各组频数或频频率由变量值高的组向变量值低的组累计。率由变量值高的组向变量值低的组累计。各累计数的意义是各组下限以上的累计次数比率。各累计数的意义是各组下限以上的累计次数比率。销售额销售额(百万元)(百万元)商店商店数数频率频率()累计次数累计次数累

48、计频率累计频率()5以下以下51010151520202525以上以上410161343820322686合计合计50100例题例题例题例题 销售额销售额(百万元)(百万元)商店数商店数频率频率()累计次数累计次数累计频率累计频率()向上向上累计累计向上向上累计累计5以下以下51010151520202525以上以上41016134382032268641430434750828608694100合计合计50100 销售额销售额(百万元)(百万元)商店商店数数频率频率()累计次数累计次数累计频率累计频率()向上向上累计累计向下向下累计累计向上向上累计累计向下向下累计累计5以下以下5101015

49、1520202525以上以上410161343820322686414304347505046362073828608694100100927240146合计合计50100v累计次数分布折线图的画法:累计次数分布折线图的画法:(1)在直角坐标系上将各组组距的)在直角坐标系上将各组组距的上限上限与其与其相应的累计频数(频率)构成坐标点,依次相应的累计频数(频率)构成坐标点,依次用折线(或光滑曲线)相连,即是用折线(或光滑曲线)相连,即是向上累计向上累计分布图分布图。(2)在直角坐标系上将各组组距的)在直角坐标系上将各组组距的下限下限与其与其相应的累计频数(频率)构成坐标点,依次相应的累计频数(频

50、率)构成坐标点,依次用折线(或光滑曲线)相连,即是用折线(或光滑曲线)相连,即是向下累计向下累计分布图分布图。3.累计分布的图示累计分布的图示 累计频数(频率)分布曲线,可用于分累计频数(频率)分布曲线,可用于分析社会财富、土地和工资收入等的分配析社会财富、土地和工资收入等的分配是否公平的问题。是否公平的问题。这种累计分布曲线图最早是由美国统计这种累计分布曲线图最早是由美国统计学家洛伦茨博士提出,故又称为学家洛伦茨博士提出,故又称为洛伦茨洛伦茨曲线图。曲线图。4.累计分布曲线的应用累计分布曲线的应用按收入按收入所得水所得水平分组平分组人口人口收入收入累计收入的累计收入的(%)人口数人口数(万人

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 小学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com