描述统计:课件.ppt

上传人:石*** 文档编号:48382391 上传时间:2022-10-06 格式:PPT 页数:62 大小:3.17MB
返回 下载 相关 举报
描述统计:课件.ppt_第1页
第1页 / 共62页
描述统计:课件.ppt_第2页
第2页 / 共62页
点击查看更多>>
资源描述

《描述统计:课件.ppt》由会员分享,可在线阅读,更多相关《描述统计:课件.ppt(62页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、描述统计:描述统计:第1页,此课件共62页哦学学习目目标 学学学学习习本章后本章后本章后本章后,您您您您应该应该做到:做到:做到:做到:1.1.1.1.了解数据了解数据了解数据了解数据预处预处理的内容和要求;理的内容和要求;理的内容和要求;理的内容和要求;2.2.2.2.明确明确明确明确频频数分布、数据分数分布、数据分数分布、数据分数分布、数据分组组的概念及基本内容;的概念及基本内容;的概念及基本内容;的概念及基本内容;3.3.3.3.掌握定性数据、定量数据的相掌握定性数据、定量数据的相掌握定性数据、定量数据的相掌握定性数据、定量数据的相应频应频数分布表的数分布表的数分布表的数分布表的编编制;

2、制;制;制;4.4.4.4.理解并掌握各种理解并掌握各种理解并掌握各种理解并掌握各种统计图统计图形的特点与适用范形的特点与适用范形的特点与适用范形的特点与适用范围围;5.5.5.5.熟悉各种表格、熟悉各种表格、熟悉各种表格、熟悉各种表格、图图形的形的形的形的计计算机算机算机算机软软件(主要是件(主要是件(主要是件(主要是ExcelExcel软软件)件)件)件)应应用;用;用;用;6.6.6.6.描述描述描述描述统计统计数据表格与数据表格与数据表格与数据表格与图图形形形形显显示的示的示的示的现实应现实应用用用用问题问题。第2页,此课件共62页哦第一节第一节 数据的预处理数据的预处理一、数据审核一

3、、数据审核二、数据筛选二、数据筛选三、数据排序三、数据排序第3页,此课件共62页哦一、数据审核一、数据审核1.1.准确性准确性审核核n n审核的对象就是登记性误差(非抽样误差)n n采取的方法是逻辑检查和计算检查 n n逻辑检查,主要看调查数据的内容是否合理,项逻辑检查,主要看调查数据的内容是否合理,项目之间是否有矛盾的地方,以及与有关数据进行目之间是否有矛盾的地方,以及与有关数据进行对照,或者检查数据的平衡关系,以暴露逻辑上对照,或者检查数据的平衡关系,以暴露逻辑上的矛盾的矛盾n n计算检查,这主要是从数字上检查,如各分项之计算检查,这主要是从数字上检查,如各分项之和是否等于总计,计量单位是

4、否合适,计算方法和是否等于总计,计量单位是否合适,计算方法上是否合理等等上是否合理等等 第4页,此课件共62页哦2.2.全面性全面性审核核 就是要核对应调查的单位是否有遗漏,应调查的内容是否齐全3.3.及及时性性审核核 即是否按规定的时间获取数据资料 第5页,此课件共62页哦二、数据筛选二、数据筛选(data filter)1.1.当当数数据据中中的的错错误误不不能能予予以以纠纠正正,或或者者有有些些数数据据不不符符合合调调查查的的要要求求而而又又无无法法弥弥补补时时,需要对数据进行筛选需要对数据进行筛选2.2.数据筛选的内容数据筛选的内容将将某某些些不不符符合合要要求求的的数数据据或或有有明

5、明显显错错误误的的数数据予以剔除据予以剔除将将符符合合某某种种特特定定条条件件的的数数据据筛筛选选出出来来,而而不不符合特定条件的数据予以剔除符合特定条件的数据予以剔除3.数据筛选可借助计算机完成数据筛选可借助计算机完成数据筛选可借助计算机完成数据筛选可借助计算机完成第6页,此课件共62页哦三、数据排序三、数据排序1.1.按一定顺序将数据排列,以发现一些明显按一定顺序将数据排列,以发现一些明显的特征或趋势,找到解决问题的线索的特征或趋势,找到解决问题的线索2.2.排序有助于对数据检查纠错,以及为重新排序有助于对数据检查纠错,以及为重新归类或分组等提供依据归类或分组等提供依据3.3.在某些场合,

6、排序本身就是分析的目的之在某些场合,排序本身就是分析的目的之一一4.4.排序可借助于计算机完成排序可借助于计算机完成第7页,此课件共62页哦第二节第二节 定性数据的定性数据的 图表分析图表分析 一、频数分布一、频数分布二、定性数据的图形表示二、定性数据的图形表示第8页,此课件共62页哦一、频数分布一、频数分布(Frequency distribution)1.1.将统计数据分组后,各组数据出现的次数被称为将统计数据分组后,各组数据出现的次数被称为将统计数据分组后,各组数据出现的次数被称为将统计数据分组后,各组数据出现的次数被称为频数频数频数频数(Frequency)(Frequency),亦称

7、为次数,亦称为次数,亦称为次数,亦称为次数2.2.频率频率频率频率(relative frequencyrelative frequency):某一类别数据个数占全部:某一类别数据个数占全部:某一类别数据个数占全部:某一类别数据个数占全部数据个数的比值数据个数的比值数据个数的比值数据个数的比值3.3.把各个组以及相应的频数依一定的次序全部列出来,就把各个组以及相应的频数依一定的次序全部列出来,就把各个组以及相应的频数依一定的次序全部列出来,就把各个组以及相应的频数依一定的次序全部列出来,就形成了频数分布亦称为形成了频数分布亦称为形成了频数分布亦称为形成了频数分布亦称为次数分布次数分布次数分布次

8、数分布4.4.对于定性数据本身就是对事物的一种分类,因此对于定性数据本身就是对事物的一种分类,因此对于定性数据本身就是对事物的一种分类,因此对于定性数据本身就是对事物的一种分类,因此在列出所分的类别的同时,再列出对应的频数或在列出所分的类别的同时,再列出对应的频数或在列出所分的类别的同时,再列出对应的频数或在列出所分的类别的同时,再列出对应的频数或频率,就形成了名类数据的频数分布。频率,就形成了名类数据的频数分布。频率,就形成了名类数据的频数分布。频率,就形成了名类数据的频数分布。第9页,此课件共62页哦(一)生成频数分布表(一)生成频数分布表分类数据频数分布表分类数据频数分布表第10页,此课

9、件共62页哦顺序数据的频数分布表顺序数据的频数分布表甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别回答类别回答类别甲城市甲城市甲城市甲城市户数户数户数户数(户户户户)百分比百分比百分比百分比(%)(%)向上累积向上累积向上累积向上累积 向下累积向下累积向下累积向下累积 户数户数户数户数(户户户户)百分比百分比百分比百分比(%)(%)户数户数户数户数(户户户户)百分比百分比百分比百分比(%)(%)非常不满意非常不满意非常不满意非常不满意 不满意不满意不满意不满意 一般一般一般一般 满意满意满

10、意满意 非常满意非常满意非常满意非常满意 24 24108108 93 93 45 45 30 30 8 83636313115151010 24 24132132225225270270300300 8.0 8.0 44.0 44.0 75.0 75.0 90.0 90.0100.0100.0300300276276168168 75 75 30 30100.0100.09292565625251010合计合计合计合计300300100.0100.0第11页,此课件共62页哦顺序数据的整理顺序数据的整理(可计算的统计量可计算的统计量可计算的统计量可计算的统计量)1.累累积积频频数数(cumu

11、lative frequencies):各类别频数的逐级累加。包括向上累积和向下累积两类。2.累累积积频频率率(cumulative percentages):各类别频率(百分比)的逐级累加。包括向上累积和向下累积两类。第12页,此课件共62页哦列联表(交叉频数表)列联表(交叉频数表)n n作用作用:在实际分析中,除了需要对单个变量的数据分布情在实际分析中,除了需要对单个变量的数据分布情况进行分析外,还需要掌握多个变量在不同取值情况下的况进行分析外,还需要掌握多个变量在不同取值情况下的数据分布情况,从而进一步深入分析变量之间的相互影响数据分布情况,从而进一步深入分析变量之间的相互影响和关系,这

12、种分析就称为交叉列联表分析。和关系,这种分析就称为交叉列联表分析。n n概念:概念:以列表方式表示两个以列表方式表示两个(或多个或多个)变量或属性共同变量或属性共同出现的频率。出现的频率。或者是将两个属性变量的不同取值置或者是将两个属性变量的不同取值置于行和列的位置,在表格中填入变量组合取值的频于行和列的位置,在表格中填入变量组合取值的频数的表格数的表格 第13页,此课件共62页哦列联表(交叉频数表)列联表(交叉频数表)5050名大学生性名大学生性名大学生性名大学生性别别和持有手机品牌交叉和持有手机品牌交叉和持有手机品牌交叉和持有手机品牌交叉频频数分布表数分布表数分布表数分布表第14页,此课件

13、共62页哦(二)相对频数分布和百分数频数分布(二)相对频数分布和百分数频数分布1.1.1.1.比例(比例(proportionproportion)也称构成比)也称构成比,它是一个样,它是一个样本(或总体)中各类别的频数与全部频数本(或总体)中各类别的频数与全部频数之比,通常用于反映样本(或总体)的构之比,通常用于反映样本(或总体)的构成或结构。成或结构。2.2.将比例乘以将比例乘以100得到的数值称为得到的数值称为百分比百分比(percentage),用),用%表示。表示。3.3.由比例和百分比我们可以编制由比例和百分比我们可以编制相对频数分相对频数分布表和百分数频数分布表。布表和百分数频数

14、分布表。第15页,此课件共62页哦 5050名大学生持有手机品牌名大学生持有手机品牌名大学生持有手机品牌名大学生持有手机品牌频频数、数、数、数、相相相相对对数数数数频频数和百分数数和百分数数和百分数数和百分数频频数分布表数分布表数分布表数分布表 利用利用excel软件不能直接生成相对频数分布和百分数频数分布,软件不能直接生成相对频数分布和百分数频数分布,需要在频数分布表的基础上单独计算并列示需要在频数分布表的基础上单独计算并列示 第16页,此课件共62页哦二、定性数据的图形表示二、定性数据的图形表示 比较适用于定性数据的图形主要有:条形图、饼图、环形图条形图、饼图、环形图等。第17页,此课件共

15、62页哦统计图统计图条形图条形图(bar Chart)1.1.用宽度相同的条形的高度或长短来表示各类别数据的图形2.2.有单式条形图、复式条形图单式条形图、复式条形图等形式3.3.主要用于反映分类数据的频数分布4.4.绘制时,各类别可以放在纵轴,称为条条形图形图,也可以放在横轴,称为柱形图柱形图第18页,此课件共62页哦单式条形图单式条形图 学生持有手机品牌的单式条形图 第19页,此课件共62页哦复式条形图复式条形图 学生持有手机品牌的复式条形图学生持有手机品牌的复式条形图 第20页,此课件共62页哦分类数据的图示分类数据的图示饼图饼图(pie Chart)1.1.也称圆形图,是用圆形及圆内扇

16、形的面积来表示数值大小的图形2.2.主要用于表示总体或样本中各组成部分所占的比例,对于研究结构性问题十分有用3.3.绘制圆形图时,总体中各部分所占的百分比用圆内的各个扇形面积表示,这些扇形的中心角度,是按各部分数据百分比占3600的相应比例确定的第21页,此课件共62页哦饼图示例饼图示例50名大学生持有手机品牌的饼图名大学生持有手机品牌的饼图 第22页,此课件共62页哦饼图饼图-分离型三维图分离型三维图 50名大学生持有手机品牌的饼图名大学生持有手机品牌的饼图 第23页,此课件共62页哦环形图环形图(annular chart)1.1.环形图中间有一个“空洞”,总体中的每一部分数据用环中的一段

17、表示2.2.环形图与圆形图类似,但又有区别n n圆形图只能显示一个总体各部分所占的比例圆形图只能显示一个总体各部分所占的比例n n环环形形图图则则可可以以同同时时绘绘制制多多个个总总体体的的数数据据系系列列,每每一一个总体的数据系列为一个环个总体的数据系列为一个环3.3.环形图可用于结构比较研究环形图可用于结构比较研究 4.4.环形图主要用于展示分类和顺序数据第24页,此课件共62页哦环形图示例环形图示例 图中里图中里面的圆面的圆环是持环是持有手机有手机品牌,品牌,外面的外面的圆环是圆环是喜爱手喜爱手机品牌机品牌 第25页,此课件共62页哦第三节第三节 定量数据的定量数据的 图表分析图表分析

18、一、频数分布一、频数分布二、定量数据的图形表示二、定量数据的图形表示第26页,此课件共62页哦等距分组等距分组异距分组异距分组一、频数分布一、频数分布第27页,此课件共62页哦单变量值分组单变量值分组(要点要点)1.将一个变量值作为一组将一个变量值作为一组2.适合于离散变量适合于离散变量3.适合于变量值较少的情况适合于变量值较少的情况第28页,此课件共62页哦单变量值分组单变量值分组(实例实例)例例例例2.72.7某车间某车间A A生产小组生产小组2020名工人日加工零件数如下(单名工人日加工零件数如下(单位:件):试采用单变量值分组法编制频数分布表。位:件):试采用单变量值分组法编制频数分布

19、表。16 13 18 15 19 14 17 13 15 1716 13 18 15 19 14 17 13 15 1718 15 16 18 14 16 15 16 17 1618 15 16 18 14 16 15 16 17 16采用单变量值分组法编制频数分布数列表采用单变量值分组法编制频数分布数列表为了便于分组,要先对原始数据排序。排序结果如下:为了便于分组,要先对原始数据排序。排序结果如下:为了便于分组,要先对原始数据排序。排序结果如下:为了便于分组,要先对原始数据排序。排序结果如下:13 13 14 14 15 15 15 15 16 16 13 13 14 14 15 15 15

20、 15 16 16 16 16 16 17 17 17 18 18 18 1916 16 16 17 17 17 18 18 18 19第29页,此课件共62页哦20名工人日加工零件数频数分布表 日产量(件)频数(人)频率(%)13 14 15 16 17 18 19 2 2 4 5 3 3 1 10 10 20 25 15 15 5 合计 20 100第30页,此课件共62页哦组距分组组距分组 (要点要点)1.1.将变量值的一个区间作为一组将变量值的一个区间作为一组(有等距和异距之分)(有等距和异距之分)(有等距和异距之分)(有等距和异距之分)1.1.适合于连续变量适合于连续变量2.2.适合

21、于变量值较多的离散变量适合于变量值较多的离散变量 第31页,此课件共62页哦组距分组组距分组(几个概念几个概念)1.1.下限下限下限下限(low limit)low limit):一个组的最小值一个组的最小值2.2.上限上限上限上限(upper limit)upper limit):一个组的最大值一个组的最大值3.3.组距组距组距组距(class width)class width):上限与下限之差上限与下限之差4.4.组中值组中值组中值组中值(class midpoint)class midpoint):下限与上限之间的中点值,它下限与上限之间的中点值,它代表该组变量值的一般水平,它的前提条

22、件是:组内单位代表该组变量值的一般水平,它的前提条件是:组内单位的分布是均匀的的分布是均匀的下限值+上限值2组中值=第32页,此课件共62页哦等距变量数列的编制等距变量数列的编制(步骤步骤)1.1.确确确确定定定定组组组组数数数数:组组组组数数数数的的的的确确确确定定定定应应应应以以以以能能能能够够够够显显显显示示示示数数数数据据据据的的的的分分分分布布布布特特特特征征征征和和和和规规规规律律律律为为为为目目目目的的的的。在在在在实实实实际际际际分分分分组组组组时时时时,可可可可以以以以按按按按 Sturges Sturges 提提提提出出出出的的的的经经经经验验验验公公公公式式式式来确定组数

23、来确定组数来确定组数来确定组数K K2.确定组距:组距(Class Width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即 组距组距d(最大值最大值-最小值最小值)组数组数 此办法适合等距分组,若遇变量值较分散的情况,不可用此方法。组距宜取整数,且是5或10的倍数较好第33页,此课件共62页哦等距变量数列的编制等距变量数列的编制(步骤步骤)3.3.确定各组组限确定各组组限确定各组组限确定各组组限第一组的的下限应小于或等于最小变量值;第一组的的下限应小于或等于最小变量值;第一组的的下限应小于或等于最小变量值;第一组的的下限应小于或等于最小变量值;最后一组的上限

24、应大于最大变量值;最后一组的上限应大于最大变量值;最后一组的上限应大于最大变量值;最后一组的上限应大于最大变量值;各组组限要取整数;各组组限要取整数;各组组限要取整数;各组组限要取整数;第一组和最后组可取开口组;第一组和最后组可取开口组;第一组和最后组可取开口组;第一组和最后组可取开口组;4.4.统计各组的频数并整理成频数分布表统计各组的频数并整理成频数分布表统计各组的频数并整理成频数分布表统计各组的频数并整理成频数分布表 统计各组频数总原则:不重不漏统计各组频数总原则:不重不漏统计各组频数总原则:不重不漏统计各组频数总原则:不重不漏对于重叠设置的组限频数统计遵循:对于重叠设置的组限频数统计遵

25、循:对于重叠设置的组限频数统计遵循:对于重叠设置的组限频数统计遵循:上组限不在内原则上组限不在内原则上组限不在内原则上组限不在内原则第34页,此课件共62页哦频数分布表的编制频数分布表的编制(例题分析例题分析)【例】某某某某 生生生生产产产产 车车车车 间间间间 50505050名名名名工工工工 人人人人 日日日日 加加加加 工工工工零零零零件件件件数数数数(单单单单位位位位:个个个个)。试试试试对对对对数数数数据据据据进进进进行分组。行分组。行分组。行分组。第35页,此课件共62页哦频数分布表的编制频数分布表的编制(步骤步骤)1.确确定定组组数数:根根据据 Sturges 提提出出的的经经验

26、验公公式式得得组组数数K为为:2.确定各组的组距:组距组距组距组距(139-107)74.6 53.用用Excel制作频数分布表制作频数分布表 第36页,此课件共62页哦等距分组表等距分组表(上下组限重叠上下组限重叠)第37页,此课件共62页哦相对频数分布和百分数频数分布相对频数分布和百分数频数分布 按成按成绩绩分分组组(分)(分)频频数(人)数(人)相相对对数数频频数数百分数百分数频频数数 60以下以下 3 0.075 7.560707080 6150.1500.37515.037.5 8090 12 0.300 30.0 90以上以上 4 0.100 10.0合合计计 40 1.000 1

27、00.0第38页,此课件共62页哦二、定量数据的图形表示二、定量数据的图形表示n n直方图n折线图第39页,此课件共62页哦直方图直方图(histogram)1.1.用矩形的宽度和高度来表示频数分布的图形,实际上是用矩形的面面积积来表示各组的频数分布2.2.在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图3.3.直方图下的总面积等于1第40页,此课件共62页哦直方图的绘制直方图的绘制直方图下的面积之和等于1某生产车间某生产车间某生产车间某生产车间50505050名工人日加工零件频数分布直方图名工人日加工零件频数分布直方图名工人日加工零件频数分布直

28、方图名工人日加工零件频数分布直方图 我我一一眼眼就就看看出出来来了了,加加工工零零件件在在120120125125之之间间的的人人数数最最多多!第41页,此课件共62页哦直方图与条形图的区别直方图与条形图的区别1.1.条条形形图图是是用用条条形形的的长长度度(横横置置时时)表表示示各各类类别别频频数数的的多多少,其宽度少,其宽度(表示类别表示类别)则是固定的则是固定的2.2.直直方方图图是是用用面面积积表表示示各各组组频频数数的的多多少少,矩矩形形的的高高度度表表示示每每一一组组的的频频数数或或百百分分比比,宽宽度度则则表表示示各各组组的的组组距距,其高度与宽度均有意义其高度与宽度均有意义3.

29、3.直直方方图图的的各各矩矩形形通通常常是是连连续续排排列列,条条形形图图则则是是分分开开排列排列4.4.条条形形图图主主要要用用于于展展示示分分类类数数据据,直直方方图图则则主主要要用用于于展示数值型数据展示数值型数据第42页,此课件共62页哦折线图折线图 1.1.折线图(折线图(折线图(折线图(line chartline chart)也称频数多边形图。)也称频数多边形图。)也称频数多边形图。)也称频数多边形图。2.2.在直方图的基础上,把直方图中各矩形顶部的中点(即组在直方图的基础上,把直方图中各矩形顶部的中点(即组在直方图的基础上,把直方图中各矩形顶部的中点(即组在直方图的基础上,把直

30、方图中各矩形顶部的中点(即组中值)用直线连接起来,再把原来的直方图抹掉就是折线中值)用直线连接起来,再把原来的直方图抹掉就是折线中值)用直线连接起来,再把原来的直方图抹掉就是折线中值)用直线连接起来,再把原来的直方图抹掉就是折线图。图。图。图。3.3.需要注意,折线图的两个终点要与横轴相交,具体的做法是将第一需要注意,折线图的两个终点要与横轴相交,具体的做法是将第一需要注意,折线图的两个终点要与横轴相交,具体的做法是将第一需要注意,折线图的两个终点要与横轴相交,具体的做法是将第一个矩形的顶部中点通过竖边中点(即该组频数或频率一半的位置)个矩形的顶部中点通过竖边中点(即该组频数或频率一半的位置)

31、个矩形的顶部中点通过竖边中点(即该组频数或频率一半的位置)个矩形的顶部中点通过竖边中点(即该组频数或频率一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴。这连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴。这连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴。这连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴。这样才会使折线图下所围成的面积与直方图的面积相等,从而使二者样才会使折线图下所围成的面积与直方图的面积相等,从而使二者样才会使折线图下所围成的面积与直方图的面积相等,从而使二者样才会使折线图下所围成的面积与直方图的面积相等,从而使二者所表示的频数分布一致

32、。所表示的频数分布一致。所表示的频数分布一致。所表示的频数分布一致。第43页,此课件共62页哦折线图实例折线图实例第44页,此课件共62页哦第四节第四节 探索性数据分析:探索性数据分析:茎叶图和箱线图茎叶图和箱线图一、茎叶图一、茎叶图二、箱线图二、箱线图第45页,此课件共62页哦一、茎叶图(Stem-and-leaf plot)1.1.茎叶图,又称茎叶图,又称茎叶图,又称茎叶图,又称“枝叶图枝叶图枝叶图枝叶图”,由统计学家约翰托奇设计,由统计学家约翰托奇设计,由统计学家约翰托奇设计,由统计学家约翰托奇设计,它是一种同时排列定量数据顺序并提供分布形态的深它是一种同时排列定量数据顺序并提供分布形态

33、的深它是一种同时排列定量数据顺序并提供分布形态的深它是一种同时排列定量数据顺序并提供分布形态的深入信息的探索性数据分析技术入信息的探索性数据分析技术入信息的探索性数据分析技术入信息的探索性数据分析技术 2.2.茎叶图由两部分组成:茎(茎叶图由两部分组成:茎(茎叶图由两部分组成:茎(茎叶图由两部分组成:茎(stemstem)与叶()与叶()与叶()与叶(leafleaf)。)。)。)。n n茎:通常由每组数的高位数值形成,按组竖立茎:通常由每组数的高位数值形成,按组竖立在左边;在左边;n n叶:通常由每组数的低位数值形成,按组横排叶:通常由每组数的低位数值形成,按组横排在在“茎茎”的右边。的右边

34、。第46页,此课件共62页哦茎叶图制作例例2.11 某班级40名同学统计学课程考试成绩的数据来说明绘制茎叶图的基本思路。40名同学统计学课程考试成绩原始数据如下:68 89 88 84 86 87 75 73 72 6875 82 99 58 81 54 79 76 95 7671 60 91 65 76 72 76 85 89 9264 57 83 81 78 77 72 61 70 87第47页,此课件共62页哦茎叶图制作(1)1.1.首先,我们将每个数据的十位数(数字变化不大)首先,我们将每个数据的十位数(数字变化不大)首先,我们将每个数据的十位数(数字变化不大)首先,我们将每个数据的十

35、位数(数字变化不大)作为主干(茎),列在一条竖线的左边,在这条竖作为主干(茎),列在一条竖线的左边,在这条竖作为主干(茎),列在一条竖线的左边,在这条竖作为主干(茎),列在一条竖线的左边,在这条竖线的右边记录每个数据的最后一个数字(本例中就线的右边记录每个数据的最后一个数字(本例中就线的右边记录每个数据的最后一个数字(本例中就线的右边记录每个数据的最后一个数字(本例中就是每个数据的个位数)作为叶。是每个数据的个位数)作为叶。是每个数据的个位数)作为叶。是每个数据的个位数)作为叶。2.2.将所有数据分别列示在竖线两侧,得到下面图形:将所有数据分别列示在竖线两侧,得到下面图形:将所有数据分别列示在

36、竖线两侧,得到下面图形:将所有数据分别列示在竖线两侧,得到下面图形:第48页,此课件共62页哦茎叶图制作(2)3.对竖线右侧每一行数据进行大小排序,我们就可以对竖线右侧每一行数据进行大小排序,我们就可以对竖线右侧每一行数据进行大小排序,我们就可以对竖线右侧每一行数据进行大小排序,我们就可以得到如下的茎叶图:得到如下的茎叶图:得到如下的茎叶图:得到如下的茎叶图:4.为更清楚地显示数据的分布状况,我们将每根茎右 侧的叶子用矩形框住,的如下图形:第49页,此课件共62页哦茎叶图制作(3)通过这幅茎叶图,你看到了什么?第50页,此课件共62页哦茎叶图的特点茎叶图的特点1.1.用茎叶图显示数据有如下优势

37、:一是茎叶图比较容易手用茎叶图显示数据有如下优势:一是茎叶图比较容易手用茎叶图显示数据有如下优势:一是茎叶图比较容易手用茎叶图显示数据有如下优势:一是茎叶图比较容易手工绘制;二是茎叶图上没有原始数据信息的损失,所有工绘制;二是茎叶图上没有原始数据信息的损失,所有工绘制;二是茎叶图上没有原始数据信息的损失,所有工绘制;二是茎叶图上没有原始数据信息的损失,所有数据信息都可以从图中得到;三是茎叶图中的数据可以数据信息都可以从图中得到;三是茎叶图中的数据可以数据信息都可以从图中得到;三是茎叶图中的数据可以数据信息都可以从图中得到;三是茎叶图中的数据可以随时记录,随时添加,方便记录与表示。随时记录,随时

38、添加,方便记录与表示。随时记录,随时添加,方便记录与表示。随时记录,随时添加,方便记录与表示。2.2.茎叶图只便于表示两位有效数字的数据,而且茎叶图只方茎叶图只便于表示两位有效数字的数据,而且茎叶图只方茎叶图只便于表示两位有效数字的数据,而且茎叶图只方茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两组以上的数据虽然能够记录,但是便记录两组的数据,两组以上的数据虽然能够记录,但是便记录两组的数据,两组以上的数据虽然能够记录,但是便记录两组的数据,两组以上的数据虽然能够记录,但是没有表示两个记录那么直观、清晰。当样本数据较多时,没有表示两个记录那么直观、清晰。当样本数据较多时

39、,没有表示两个记录那么直观、清晰。当样本数据较多时,没有表示两个记录那么直观、清晰。当样本数据较多时,因为每一个数据都要在图中占据一个空间,用茎叶图很不因为每一个数据都要在图中占据一个空间,用茎叶图很不因为每一个数据都要在图中占据一个空间,用茎叶图很不因为每一个数据都要在图中占据一个空间,用茎叶图很不方便方便方便方便第51页,此课件共62页哦二、箱线图二、箱线图(box plot)1.1.箱线图是由一组数据的最大值(箱线图是由一组数据的最大值(maximummaximum)、最小)、最小值(值(minimumminimum)、中位数()、中位数(medianmedian)、两个四分位数)、两个

40、四分位数(quartilesquartiles)这)这5 5个值绘制而成的统计图形个值绘制而成的统计图形2.2.是从未分组数据来显示并分析数据的分布特征的是从未分组数据来显示并分析数据的分布特征的第52页,此课件共62页哦箱线图箱线图3.通过箱线图的形状可以看出数据分布的特征通过箱线图的形状可以看出数据分布的特征通过箱线图的形状可以看出数据分布的特征通过箱线图的形状可以看出数据分布的特征 (a)对称分布 (b)右偏分布 (c)左偏分布 第53页,此课件共62页哦箱线图实例箱线图实例 5门课程考试成绩的箱线图 第54页,此课件共62页哦第五节第五节 两个变量间关系两个变量间关系 的图形显示:散点

41、图的图形显示:散点图第55页,此课件共62页哦散点图(散点图(scatter diagram)1.1.是用二维坐标描述两个数值型变量之间关系的一是用二维坐标描述两个数值型变量之间关系的一是用二维坐标描述两个数值型变量之间关系的一是用二维坐标描述两个数值型变量之间关系的一种图形。种图形。种图形。种图形。2.2.它用坐标横轴代表变量它用坐标横轴代表变量它用坐标横轴代表变量它用坐标横轴代表变量x x,纵轴代表变量,纵轴代表变量,纵轴代表变量,纵轴代表变量y y,每对数,每对数,每对数,每对数据(据(据(据(x x,y y)在坐标系中用一个点(数据点)表示,)在坐标系中用一个点(数据点)表示,)在坐标

42、系中用一个点(数据点)表示,)在坐标系中用一个点(数据点)表示,n n对数据点在坐标系中形成的图就称为散点图。对数据点在坐标系中形成的图就称为散点图。对数据点在坐标系中形成的图就称为散点图。对数据点在坐标系中形成的图就称为散点图。第56页,此课件共62页哦两变量散点图两变量散点图从图中我们可以看出,农村居民家庭人均纯收入与农村居民家庭平均每人消费支从图中我们可以看出,农村居民家庭人均纯收入与农村居民家庭平均每人消费支出之间有着较为明显的线性关系,随着农村居民家庭人均纯收入的增加,农村居出之间有着较为明显的线性关系,随着农村居民家庭人均纯收入的增加,农村居民家庭平均每人消费支出也随之增加民家庭平均每人消费支出也随之增加 第57页,此课件共62页哦添加趋势线的散点图添加趋势线的散点图第58页,此课件共62页哦重叠散点图重叠散点图(overlay scatter)第59页,此课件共62页哦矩阵散点图矩阵散点图(matrix scatter)同同时时显显示示比比较较多多个个变变量量两两两两之之间间的的关关系系 第60页,此课件共62页哦第61页,此课件共62页哦谢谢大家谢谢大家第62页,此课件共62页哦

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com