《统计学》完整袁卫-贾俊平.ppt

上传人:豆**** 文档编号:66112577 上传时间:2022-12-14 格式:PPT 页数:228 大小:5.11MB
返回 下载 相关 举报
《统计学》完整袁卫-贾俊平.ppt_第1页
第1页 / 共228页
《统计学》完整袁卫-贾俊平.ppt_第2页
第2页 / 共228页
点击查看更多>>
资源描述

《《统计学》完整袁卫-贾俊平.ppt》由会员分享,可在线阅读,更多相关《《统计学》完整袁卫-贾俊平.ppt(228页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、统统计计学学第一章第一章统计和统计数据的收集统计和统计数据的收集第二章第二章统计数据的整理和展示统计数据的整理和展示第三章第三章数据的描述性分析数据的描述性分析第四章第四章概率基础概率基础第五章第五章区间估计和假设检验区间估计和假设检验第六章第六章相关与回归分析相关与回归分析第七章第七章非参数统计非参数统计第八章第八章时间数列分析时间数列分析第九章第九章指数指数一、一、什么是统计什么是统计?(一)统计包含(一)统计包含三种涵义,两重关系三种涵义,两重关系1.统计工作:统计工作:对统计数据进行搜集、整理和分析的过对统计数据进行搜集、整理和分析的过程程。2.统计数据:统计工作所产生的成果,用以描述

2、我们所统计数据:统计工作所产生的成果,用以描述我们所研究现象的属性和特征研究现象的属性和特征。如统计图表,统计分析报告如统计图表,统计分析报告等。等。3.统计学:一门研究总体数量特征的方法论科学。统计学:一门研究总体数量特征的方法论科学。统计工作统计工作统计资料统计资料统统计计学学工作与工作成果关系工作与工作成果关系实践与理实践与理论关系论关系(二)(二)四个重要的术语四个重要的术语所所研研究究的的具具有有某某些些相相同同性性质质的的全全部部单单位位或或事件的整体。事件的整体。总体总体无限总体:含无限多个单位。无限总体:含无限多个单位。无限总体:含无限多个单位。无限总体:含无限多个单位。范围范

3、围范围范围 有限总体:含有限个单位。有限总体:含有限个单位。有限总体:含有限个单位。有限总体:含有限个单位。样样本本:亦亦可可称称为为抽抽样样总总体体,是是从从总总体体中中抽抽取取部部分分单单位所组成的整体,用以分析总体。位所组成的整体,用以分析总体。参参数数:亦亦可可称称为为总总体体指指标标,是是综综合合测测量量的的整整个个总总体体的某个数量特征。的某个数量特征。统统计计量量:亦亦可可称称为为样样本本指指标标,是是根根据据样样本本数数据据计计算算的的综综合合测测量量值值,可可用用以以反反映映或或估估计计、推推断断总总体体的的某某个数量特征。个数量特征。(三)统计学的内容(三)统计学的内容1.

4、描述统计描述统计关于搜集、展示一批数据,并反映这关于搜集、展示一批数据,并反映这批数据特征的各种方法,其目的是为批数据特征的各种方法,其目的是为了正确地反映总体的数量特点。了正确地反映总体的数量特点。2.推断统计推断统计根据样本统计量估计和推断总体参根据样本统计量估计和推断总体参数的技术和方法。数的技术和方法。描述统计是推断统计的前提,描述统计是推断统计的前提,推断统计是描述统计的发展。推断统计是描述统计的发展。二、数据二、数据(一)(一)为何需要数据为何需要数据?统计学要研究各种随机变量,通过对这些随机变量的统计学要研究各种随机变量,通过对这些随机变量的观察所获取的数据包含了我们所需的信息,

5、这些信息观察所获取的数据包含了我们所需的信息,这些信息能有助于我们在许多场合中做出更为正确的决策。能有助于我们在许多场合中做出更为正确的决策。例如:例如:市场研究者需要对产品的特性进行评估,以区分不市场研究者需要对产品的特性进行评估,以区分不同的产品。同的产品。药品制造厂商需要判别一种新药是否比现在正使用药品制造厂商需要判别一种新药是否比现在正使用着的药更有效。着的药更有效。审计审计人人员员想通想通过查过查看某家公司的看某家公司的财务报财务报表,以确表,以确认认这这家公司是否是依据了通行的会家公司是否是依据了通行的会计计准准则则做做报报表。表。财务财务金融分析人金融分析人员员想判断在未来的五年

6、中,哪些行想判断在未来的五年中,哪些行业业中的哪些公司最具有成中的哪些公司最具有成长长性。性。经济经济学家想估学家想估计计我国国内生我国国内生产总值产总值今年的增今年的增长长速度。速度。生产部门的经理按惯例要检查生产过程,以检验其生产部门的经理按惯例要检查生产过程,以检验其生产的产品质量是否符合公司的标准。生产的产品质量是否符合公司的标准。(二)(二)数据数据分类的原则分类的原则互斥原则:互斥原则:每一个数据只能划归到某一类型中,而每一个数据只能划归到某一类型中,而不能既是这一类,又是那一类不能既是这一类,又是那一类。穷穷尽尽原原则则:所所有有被被观观察察的的数数据据都都可可被被归归属属到到适

7、适当当的的类型中,没有一个类型中,没有一个数据数据无从归属。无从归属。(三)(三)数据数据的类型的类型1.定性数据和定量数据定性数据和定量数据定性数据:定性数据:用文字描述的用文字描述的 。如如在在本本章章的的“统统计计引引例例”中中消消费费者者对对永永美美所所提提供供服服务务的的总总体体评评价等都属于文字描述的定性数据价等都属于文字描述的定性数据。定量数据:定量数据:用数字描述的用数字描述的。如如企企业业的的净资产额净资产额、净净利利润额润额等等。2.离散型数据和连续型数据离散型数据和连续型数据变量变量若我们所研究现象的属性和特征的具体表现在若我们所研究现象的属性和特征的具体表现在不同时间、

8、不同空间或不同单位之间可取不同不同时间、不同空间或不同单位之间可取不同的数值,则可称这种数据为变量。的数值,则可称这种数据为变量。类型类型离散型变量:数据离散型变量:数据只能取整数只能取整数。如一家公司的如一家公司的职职工人数工人数。连续连续型型变变量的数据量的数据可以取介于两个可以取介于两个数数值值之之间间的任意的任意数数值值。如如销销售售额额、经济经济增增长长率等。率等。3.数据的数据的四个等级四个等级 定类数据定类数据例如,对人口按性别划分为男性和女性例如,对人口按性别划分为男性和女性两类两类。也称定名数据,这种数据只对事物的某也称定名数据,这种数据只对事物的某 种属性和类别进行具体的定

9、性描述。种属性和类别进行具体的定性描述。能能够够进进行行的的唯唯一一运运算算是是计计数数,即即计计算算每每一一个类型的频数或频率(即比重)。个类型的频数或频率(即比重)。定类数据定类数据例如,对企业按经营管理的水平和取得例如,对企业按经营管理的水平和取得的效益划分为一级企业、二级企业等。的效益划分为一级企业、二级企业等。定序定序数据,数据,也称序列也称序列数据,是数据,是对对事物所具事物所具有的属性顺序进行描述。有的属性顺序进行描述。定距定距数据数据如如1010、2020等。它不仅有明确的高低等。它不仅有明确的高低之分,而且可以计算差距,如之分,而且可以计算差距,如2020比比1010高高10

10、10,比,比55高高1515等。等。也称间距也称间距数据数据,是比定序,是比定序数据的描述功能数据的描述功能更好更好一些的定量一些的定量数据数据。定定距距测测定定的的量量可可以以进进行行加加或或减减的的运运算算,但但却不能进行乘或除的运算。却不能进行乘或除的运算。定比定比数据数据如如产产量量、产产值值、固固定定资资产产投投资资额额、居居民民货币收入和支出、银行存款余额等。货币收入和支出、银行存款余额等。也称比率也称比率数据数据,是比定距,是比定距数据数据更高一级的更高一级的定量定量数据数据。它不仅可以进行加减运算,而。它不仅可以进行加减运算,而且还可以作乘除运算。且还可以作乘除运算。测定层次测

11、定层次特征特征运算功能运算功能举例举例1.定类测定定类测定2.定序测定定序测定3.定距测定定距测定4.定比测定定比测定分类分类分类;排序分类;排序分类;排序;分类;排序;有基本测量单位有基本测量单位分类;排序;分类;排序;有基本测量单位;有基本测量单位;有绝对零点有绝对零点计数计数计数;排序计数;排序计数;排序;计数;排序;加减加减计数;排序;计数;排序;加减加减乘除乘除产业分类产业分类企业等级企业等级温度温度商品销售商品销售额额统计数据四个层次的概括统计数据四个层次的概括4.截面数据和时间序列数据截面数据和时间序列数据 截截面面数数据据:所所搜搜集集的的不不同同单单位位在在同同一一时时间间的

12、的数数据据。例例如,所有上市公司公布的如,所有上市公司公布的20042004年年度的净利润。年年度的净利润。时时间间序序列列数数据据:所所搜搜集集的的同同一一总总体体或或单单位位在在不不同同时时间间的数据。的数据。某某公公司司公公布布的的19931993年年到到20042004年年的的年年度度净净利利润润就就是是时时间间序列数据。序列数据。5.原始数据原始数据和和次次级级数据数据 原原始始数数据据:指指直直接接从从各各个个调调查查单单位位搜搜集集的的、尚尚未未经经过过整理的整理的统计统计数据数据资资料,也称一手数据。料,也称一手数据。次次级级数数据据:指指那那些些已已经经加加工工整整理理过过的

13、的,往往往往是是公公开开发发表表的数据的数据,也称二手数据。也称二手数据。如从如从报报纸纸杂杂志、志、统计统计年年鉴鉴、会、会计报计报表上取得的数据表上取得的数据 。(四)(四)数据数据的来源的来源1.1.从政府机构、各种行业组织、公司和企业所公布的从政府机构、各种行业组织、公司和企业所公布的数据中获取。数据中获取。就是把政府机构、各种就是把政府机构、各种组织组织和公司所公布的数据作和公司所公布的数据作为为来源,来源,这这种数据往往是种数据往往是次次级级数据数据。2.2.设计一次试验以获取必要的数据。设计一次试验以获取必要的数据。例如,在检验洗衣机洗净程度的研究中,研究人员通例如,在检验洗衣机

14、洗净程度的研究中,研究人员通过实际洗涤脏衣服,来研究哪种牌子的洗衣机效果最过实际洗涤脏衣服,来研究哪种牌子的洗衣机效果最佳。佳。3 3.从从观观察研究中察研究中获获取。研究人取。研究人员员通常是在自然状通常是在自然状态态下下,进进行直接的行直接的观观察。察。例例如如,观观察察路路口口的的交交通通流流量量、观观察察顾顾客客在在商商场场的的购购买买行为和观察流水线上的产品质量等。行为和观察流水线上的产品质量等。4.4.进行一次调查。进行一次调查。它对所调查人们的行为不进行任它对所调查人们的行为不进行任何控制,仅提出诸如出生年月、爱好、消费习惯、对何控制,仅提出诸如出生年月、爱好、消费习惯、对某一事

15、件的看法和其他特征方面的问题,然后对他们某一事件的看法和其他特征方面的问题,然后对他们回答的结果进行整理、编码、列表和分析。回答的结果进行整理、编码、列表和分析。调查方调查方案的主案的主要内容要内容确定调查确定调查目的目的确定调查确定调查对象对象和和调查单位调查单位拟订调查拟订调查提纲提纲确定调查确定调查时间时间编制调查的编制调查的组织计划组织计划三、数据搜集的组织方式三、数据搜集的组织方式(一)普查、抽样、(一)普查、抽样、统计报表制度统计报表制度和和重点调查重点调查1.普查普查特点:特点:工作量大工作量大,时间性强时间性强,需要大量人力和财力。,需要大量人力和财力。任务:任务:搜集重要的搜

16、集重要的国情国力和资源状况国情国力和资源状况的全面资的全面资料,为政府制定规划、方针政策提供依据。料,为政府制定规划、方针政策提供依据。方式:方式:建立专门机构,配备专门人员调查。建立专门机构,配备专门人员调查。利用基层单位原始记录和核算资料进行调查。利用基层单位原始记录和核算资料进行调查。原则:原则:规定统一的标准时点。规定统一的标准时点。规定统一的普查期限。规定统一的普查期限。规定统一的调查的项目和指标。规定统一的调查的项目和指标。2.抽样调查抽样调查特点:特点:1.按按随机原则随机原则从总体中抽取样本;从总体中抽取样本;2.以样本指标(统计量)为依据以样本指标(统计量)为依据推断总体参数

17、推断总体参数或或检验总体的某种假设检验总体的某种假设;3.抽样误差抽样误差可以事先可以事先计算计算并加以并加以控制控制。3.3.统计报表制度统计报表制度是按一定的表式和要求,是按一定的表式和要求,自上而下自上而下统一布置,统一布置,自下而自下而上上提供统计资料的一种统计调查方法。提供统计资料的一种统计调查方法。这种搜集这种搜集统计统计数据方法是伴随着计划经济而产生的,数据方法是伴随着计划经济而产生的,并曾在我国占主导地位。现在,在社会主义市场经济并曾在我国占主导地位。现在,在社会主义市场经济条件下,仍是我国搜集条件下,仍是我国搜集统计统计数据的组织方式之一。数据的组织方式之一。4.重点调查重点

18、调查特点:特点:在总体中选择在总体中选择个别或部分个别或部分重点单位重点单位进行调查进行调查。任务:任务:及时了解总体基本情况,为主管部门指导工及时了解总体基本情况,为主管部门指导工作服务。作服务。方式:方式:重点单位重点单位指在总体中有举足轻重地位的单位,指在总体中有举足轻重地位的单位,其标志值在总体标志总量中占有绝大比重。其标志值在总体标志总量中占有绝大比重。经常性调查;同报表制度结合,用统计报表经常性调查;同报表制度结合,用统计报表调查。调查。例如,要了解全国钢铁生产的基本情况,只要调例如,要了解全国钢铁生产的基本情况,只要调查鞍钢、宝钢、首钢、武钢、包钢等十几家特大查鞍钢、宝钢、首钢、

19、武钢、包钢等十几家特大型的钢铁企业就可以掌握全国钢铁企业生产的基型的钢铁企业就可以掌握全国钢铁企业生产的基本情况本情况。(二)抽样的优点(二)抽样的优点 1.适用的范围广。适用的范围广。对对于于有有限限总总体体,从从理理论论上上讲讲,既既可可以以进进行行普普查查也也可可以以进行抽样;进行抽样;对对于于无无限限总总体体,就就只只能能进进行行抽抽样样。若若理理论论上上可可以以而而实实际上很难采用全面普查的情况,也只能采用抽样。际上很难采用全面普查的情况,也只能采用抽样。如产品质量的破坏性检验、居民住户调查等。如产品质量的破坏性检验、居民住户调查等。2.2.与全面普查相比,抽样与全面普查相比,抽样最

20、大的优点是节省人、财、物最大的优点是节省人、财、物力和时间力和时间。3.3.随机随机抽样可以比普查更为精确。抽样可以比普查更为精确。(三)抽样的类型(三)抽样的类型 非非随机随机抽样抽样 随机随机抽样抽样 判断抽样判断抽样定额定额抽样抽样 方便抽样方便抽样 简单随机抽样简单随机抽样 抽样类型抽样类型系统抽样系统抽样 分层抽样分层抽样 整群抽样整群抽样 非非随机随机抽样抽样又称为非概率抽样又称为非概率抽样,是是不按照不按照随机原随机原则则来抽取样本中的单位或个体。来抽取样本中的单位或个体。特点特点具有方便、快速和低成本具有方便、快速和低成本精确性差,结论缺乏普遍性精确性差,结论缺乏普遍性判断抽样

21、判断抽样又称为又称为典型调查典型调查,是从事有关工作的专家按照一定的,是从事有关工作的专家按照一定的标准标准有意识地有意识地在总体中选择若干有代表性的单位组成在总体中选择若干有代表性的单位组成样本进行调查,代表单位的选取标准应根据统计研究样本进行调查,代表单位的选取标准应根据统计研究的目的而定。的目的而定。定额抽样定额抽样 是根据已定的单位数抽取样本,是根据已定的单位数抽取样本,往往是对总体了解甚少往往是对总体了解甚少的时采用。的时采用。如想获取某地区化妆品的销售情况,对该地区的如想获取某地区化妆品的销售情况,对该地区的5 5家商家商厦进行调查厦进行调查。方便抽样方便抽样 是为了取样方便,随意

22、地抽取样本单位。是为了取样方便,随意地抽取样本单位。街头偶遇式调查就是一种最为常见的方便抽样街头偶遇式调查就是一种最为常见的方便抽样。随机随机抽样抽样 是根据是根据随机原则随机原则来来抽取样本单位抽取样本单位.简单随机抽样简单随机抽样 方法:方法:在抽样框中的每个单位都具有相同的被抽中的机在抽样框中的每个单位都具有相同的被抽中的机会会,每个容量相同的样本被抽中的机会也是相同的。每个容量相同的样本被抽中的机会也是相同的。亦称为纯随机抽样亦称为纯随机抽样抽取样本的方法:抽取样本的方法:有放回抽样和无放回抽样。有放回抽样和无放回抽样。适合:适合:总体内部差异不是很大,规模也不大的情况总体内部差异不是

23、很大,规模也不大的情况。系统抽样系统抽样方法:方法:抽样框中的抽样框中的N N个单位被分成个单位被分成k k个系统,个系统,k k等于抽样等于抽样框的容量框的容量N N除以所需的样本容量除以所需的样本容量n n,在抽样框中前面的在抽样框中前面的k k个个体或单位中随机抽出第一个样本单位,然后,可在个个体或单位中随机抽出第一个样本单位,然后,可在其后的每隔其后的每隔k k个单位抽取样本中其余的部分。个单位抽取样本中其余的部分。亦可称为等距抽样亦可称为等距抽样 编号有两编号有两种方法:种方法:一种是利用原有的顺序或编号一种是利用原有的顺序或编号。如学生的注册名单,或者是从生产流水线上如学生的注册名

24、单,或者是从生产流水线上下来的、有编号的产品等。下来的、有编号的产品等。对所研究的总体已有所了解,则可用已知对所研究的总体已有所了解,则可用已知的相关变量对抽样框中的单位进行编号。的相关变量对抽样框中的单位进行编号。分层抽样分层抽样 亦可称为类型抽样亦可称为类型抽样 方法方法:将总体全部单位分类,形成若干个类型组,后:将总体全部单位分类,形成若干个类型组,后从各类型中分别抽取样本单位,合成样本。从各类型中分别抽取样本单位,合成样本。总体总体N样本样本n等额等额等比例等比例最优最优整群抽样整群抽样 方法方法:首先把总体中的首先把总体中的N个单位划分成为若干个群,个单位划分成为若干个群,并要求每个

25、群对整个总体都具有代表性,然后对群进并要求每个群对整个总体都具有代表性,然后对群进行简单随机抽样,并对抽中群内的所有单位进行调查行简单随机抽样,并对抽中群内的所有单位进行调查研究。研究。总体群数总体群数R=16样本群数样本群数r=4样本容量样本容量ABCDEFGHIJKLMNOPLHPD适合:适合:比简单随机抽样的方法能节约更多的成本,特别比简单随机抽样的方法能节约更多的成本,特别当总体的分布地域非常辽阔当总体的分布地域非常辽阔时。时。四、四、有关数据调查的几个问题有关数据调查的几个问题调查的目的调查的目的判断调查误差的大小判断调查误差的大小调调调调查查查查误误误误 差差差差登记性误差:登记性

26、误差:代表性误差代表性误差系统性的代表性误差系统性的代表性误差登记登记、汇总汇总、过录时过录时产生的产生的误差误差,以及无回答以及无回答误误差和测量误差等差和测量误差等偶然性的代表性误差偶然性的代表性误差即即为抽样为抽样误差误差调查中的道调查中的道德性德性问题问题 1.1.调查者别有用意地、有意识地选择导向性的问题,调查者别有用意地、有意识地选择导向性的问题,使回答者出现有倾向性的回答。使回答者出现有倾向性的回答。2.2.询问询问者有意者有意识识地通地通过语过语气、气、语调语调引引导导被被询问询问者出者出现现有有倾倾向性的回答。向性的回答。3.3.回答者不重回答者不重视视或不愿意回答或不愿意回

27、答调查调查的内容,就很可的内容,就很可能提供能提供错误错误的信息。的信息。第二章第二章统计数据的整理和展示统计数据的整理和展示统计数据统计数据的整理的整理统计数据统计数据的展示的展示排序排序统计分组统计分组频数分布编制频数分布编制统计表统计表统计图统计图一、一、统计数据的整理统计数据的整理排序排序统计搜集到的大量资料是分散的,不系统的,只能说统计搜集到的大量资料是分散的,不系统的,只能说明各个单位的特征和属性,必须按照科学的原则加以明各个单位的特征和属性,必须按照科学的原则加以整理整理,使之条,使之条理化和系统化,理化和系统化,成为便于储存和传递的、成为便于储存和传递的、反映总体特征的数据。反

28、映总体特征的数据。就是把定量数据按从大到小或从小到大的顺序排列,就是把定量数据按从大到小或从小到大的顺序排列,把定性数据按习惯的文字顺序排列,便于我们研究其把定性数据按习惯的文字顺序排列,便于我们研究其条理。条理。统计分组统计分组对于定性数据就是依据属性的不同将数据划分成若干对于定性数据就是依据属性的不同将数据划分成若干组,对于定量数据就是依据属性数值的不同将数据划组,对于定量数据就是依据属性数值的不同将数据划分成若干组。分成若干组。组内同质性,组间差异性。组内同质性,组间差异性。频数分布编制频数分布编制分组的关键分组的关键变量的选择,选择与变量的选择,选择与研究的问题有关研究的问题有关的的

29、变量变量 。组限的确定。应遵循组限的确定。应遵循穷尽穷尽和和互斥互斥原则原则。定性数列定性数列编制:编制:组限的确定一般比较简单组限的确定一般比较简单。如人口按性别分组、企业按所有制分组等如人口按性别分组、企业按所有制分组等定量定量变变量量编制:编制:分为分为单项数列和组距数列两种形式。单项数列和组距数列两种形式。单项数列:单项数列:即变量的一个取值为一组,适用于即变量的一个取值为一组,适用于离散离散型变量型变量,并,并且变量的且变量的取值较少。取值较少。组距数列:组距数列:即每一组有一个上限值和一个下限值所即每一组有一个上限值和一个下限值所形成的区间,适用于形成的区间,适用于连续性变量,或离

30、散型变量且连续性变量,或离散型变量且变量的变量的取值较多的情况。取值较多的情况。注意以下三个方面的问题注意以下三个方面的问题1.确定组数确定组数2.确定组距:确定组距:组距为上限与下限之差。组距为上限与下限之差。等距数列数据分布均匀。等距数列数据分布均匀。异距数列数据分布不均匀。异距数列数据分布不均匀。3.确定确定组组限限 应能把现象的不同类型划分出来应能把现象的不同类型划分出来。要考虑到数据是要考虑到数据是连续性变量连续性变量还是还是离散型离散型变量。变量。无法确定无法确定实际实际数据的取值范围,或者数数据的取值范围,或者数据中存在极端数值,可采用开口据中存在极端数值,可采用开口组组的的形形

31、式式。4.确定确定组中值组中值 :(上限下限)上限下限)2 2 ,开口组,开口组 二、统计数据的展示二、统计数据的展示当统计数据比较多时,就应该制作表格或者图形进行来当统计数据比较多时,就应该制作表格或者图形进行来展示,使数据的重要特性能从表格或者图形中展示,使数据的重要特性能从表格或者图形中直观地直观地反反映出来,这样可提高分析数据和解释数据的映出来,这样可提高分析数据和解释数据的效率效率。统计表统计表是把统计数据用表格的形式展示出来。是把统计数据用表格的形式展示出来。类型:类型:按作用分按作用分调查调查表表按数据按数据所属所属的的时间时间分分截面数据表截面数据表时间序列表时间序列表汇总汇总

32、整理表整理表计计算分析表算分析表 按按分分组变组变量量的多少的多少分分单变量分组表单变量分组表多变量分组表多变量分组表有平行形式有平行形式交叉形式交叉形式统计图统计图统计图形通常可比统计表格更生动地描述数据。统计图形通常可比统计表格更生动地描述数据。类型:类型:饼图饼图是以整个圆的是以整个圆的360360度代表全部数据的总和,度代表全部数据的总和,按照各类组所占的百分比(频率),把一个按照各类组所占的百分比(频率),把一个“饼饼”切割为各个扇形。切割为各个扇形。适用于定性数据适用于定性数据。50家门店家门店按区域分按区域分组的饼图组的饼图条形条形图图中,每一分中,每一分类组类组表示成一个条,条

33、的表示成一个条,条的长长度代度代表了表了这这个个组组中所含数据的中所含数据的频频数或数或频频率。适用于定性率。适用于定性数据数据。50家家门门店店数数按按区区域分组的条形图域分组的条形图家家门门店店按按区区域域并并按按人人数分组的分段比例条形图数分组的分段比例条形图直方直方图图与条形与条形图图相似,是在每个分相似,是在每个分组组区区间间上上绘绘制一个制一个长长条形而条形而产产生的生的图图形,它可以用来描述已表示成形,它可以用来描述已表示成频频数数或或频频率的数据。适用于定率的数据。适用于定量量数据数据。根据表根据表2-5的等距数列的等距数列对于异距数列,以组对于异距数列,以组距为宽距为宽,以频

34、数密度以频数密度为高来为高来绘绘制制直方图。直方图。折线图折线图可以在直方图基础上,将每个长方形的顶端中可以在直方图基础上,将每个长方形的顶端中点用折线连接而成,或用组中值与频数(或频率)求点用折线连接而成,或用组中值与频数(或频率)求坐标点连接而成坐标点连接而成 。根据图根据图2-6的直方图绘制的折线图的直方图绘制的折线图曲线图曲线图当变量的取值非常多,变量数列的组数无限增当变量的取值非常多,变量数列的组数无限增多时,折线便趋于一条平滑的曲线,这是一种概括描多时,折线便趋于一条平滑的曲线,这是一种概括描述变量数列分布特征的理论曲线。述变量数列分布特征的理论曲线。枝叶图枝叶图是探索性数据分析中

35、的一种方法,也是是探索性数据分析中的一种方法,也是对对一批一批数据数据进进行行组织组织整理的很有价整理的很有价值值的一个工具,可用以了的一个工具,可用以了解一批数据中由所有解一批数据中由所有观测值观测值构成的数据的取构成的数据的取值值范范围围是是如何分布的。如何分布的。第三章第三章数据的描述性分析数据的描述性分析本章将本章将讨论讨论的是数据的的是数据的总量总量和和相对关系相对关系的的测测度,数据度,数据的集中的集中趋势趋势、离散、离散趋势趋势及其形及其形态态的的测测度。度。一一、绝对数和相对数、绝对数和相对数二、集中趋势的测定二、集中趋势的测定三、离散趋势的测定三、离散趋势的测定四、数据的形态

36、测定四、数据的形态测定主主要要内内容容一、绝对数和相对数一、绝对数和相对数(一)绝对数(一)绝对数绝对数(亦称总量指标)是统计资料经过汇总整理绝对数(亦称总量指标)是统计资料经过汇总整理后得到的反映总体后得到的反映总体规模规模和和水平水平的总和指标。的总和指标。(3)是计算相对指标和平均指标的基础。)是计算相对指标和平均指标的基础。作用作用概念概念例如,企业的销售收入、一个地区或国家的社会总例如,企业的销售收入、一个地区或国家的社会总产值、国内生产总值等。产值、国内生产总值等。(1 1)反映一个国家的国情和国力,一个地区或一)反映一个国家的国情和国力,一个地区或一个企业的人力、物力、财力个企业

37、的人力、物力、财力(2 2)是进行经济核算和经济活动分析的基础)是进行经济核算和经济活动分析的基础分类分类按反映总体的内容分按反映总体的内容分按反映的时间状态分按反映的时间状态分按计量单位分按计量单位分变量总值变量总值单位总数单位总数时期数时期数时点数时点数实物量实物量价值量价值量相相对对数数是是用用两两个个有有联联系系的的指指标标进进行行对对比比的的比比值值,可可以以反反映映现现象象的的数数量量特特征征和和数数量量关关系系,并并可可将将现现象象的的绝绝对对差差异异抽抽象象化化,使使原原来来不不能能直直接接相相比比的的绝绝对对数数可可以进行比较。以进行比较。种类种类计划完成相对数计划完成相对数

38、结构相对数结构相对数比较相对数比较相对数强度相对数强度相对数动态相对数动态相对数(二)相对数(二)相对数概念概念不同时期不同时期比比较较动动态态相对数相对数注:注:又称发又称发展速度展速度强强度度相对数相对数注:注:复名数复名数有正逆有正逆指标指标不同现象不同现象比较比较不同总体不同总体比较比较比比较较相对数相对数同一总体中同一总体中部分与总体部分与总体比比较较实际与计划实际与计划比比较较结结构构相对数相对数计划完成计划完成相对数相对数注:注:有正逆指标有正逆指标同一时期比较同一时期比较同类现象比较同类现象比较(1)正确选择对比的基数;)正确选择对比的基数;(2)必须注意统计的可比性;)必须注

39、意统计的可比性;(3)相对指标要与总量指标相结合。)相对指标要与总量指标相结合。应用原则应用原则二、集中趋势的测定二、集中趋势的测定平均数平均数概念概念表表明明同同类类现现象象在在一一定定时时间间、地地点点、条条件件下下所所达达到到的的一一般般水水平平,是是总总体体内内某某个个变变量量大大小小各各异异的的观观察察值值的的代代表表性性数值。也是对变量分布数值。也是对变量分布集中趋势集中趋势的测定。的测定。数据集中区数据集中区变量变量x常用的几种平均数常用的几种平均数概概念念 计算计算公公式式 特特点点优点:优点:容易理,容易理,便于计算便于计算灵敏度高灵敏度高稳定性好稳定性好和和缺点:缺点:易受

40、极值易受极值影响影响在偏斜分布和在偏斜分布和U形分布中,形分布中,不具有代表性不具有代表性1.算术平均数算术平均数()一个变量一个变量的所有观的所有观察值相加,察值相加,再除以观再除以观察值的个察值的个数数简单:简单:加权:加权:权数权数解释解释权权数数(Weighted),是是分分布布数数列列中中的的频频数数或或频频率率。对对求求平平均均数数具具有有权权衡衡轻轻重重的的作作用用,是是影影响响平平均均数数变变动动的的两个因素之一(另一因素是变量值)。两个因素之一(另一因素是变量值)。(1)(2)(3)X456合计合计频数频数 频率频率(%)10201025.050.025.040100.0X4

41、56合计合计频数频数 频率频率(%)20402025.050.025.080100.0X456合计合计频数频数 频率频率(%)20101050.025.025.080100.0=5=5=4.75频率分布变了,均值也变。因此,严格地说,频率分布变了,均值也变。因此,严格地说,权数应指权数应指频率频率。算术平均数的变形算术平均数的变形数数学学上上称称其其为为调调和和平平均均数数,只只是是用用这这种种形形式式时时,变变量量的取值不能为的取值不能为0。求某种商品三种零售价格的平均价格求某种商品三种零售价格的平均价格调和平均调和平均价格(元)价格(元)3.32.52.0合计合计销售额(元)销售额(元)1

42、0101030常用的几种平均数常用的几种平均数概概念念 计算计算公公式式 特特点点优点:灵敏度高优点:灵敏度高受受极极值值影影响响小小于于和和适适宜宜于于各各比比率率之之积积为为总总比比率率的的变变量求平均量求平均缺点缺点:有有“0”或或负值时不能计算负值时不能计算偶偶数数项项数数列列只只能用正根能用正根2.几何平均数几何平均数()几个变量几个变量值连乘积值连乘积的的n次根次根简单:简单:加权:加权:概概念念 计算计算公公式式特特点点3.中位数中位数(Me)是一种位是一种位置平均数置平均数,数据数据按按大小顺序大小顺序排列,处排列,处于数据序于数据序列中间位列中间位置的数值置的数值就是中位就是

43、中位数数上限公式:上限公式:下限公式:下限公式:优点:优点:容易容易理解,理解,不受极值影不受极值影响响适宜于开口适宜于开口组资料和些不组资料和些不能用数字测定能用数字测定的事物的事物缺点:缺点:灵敏灵敏度和计算功能度和计算功能差差间断数间断数Me常用的几种平均数常用的几种平均数常用的几种平均数常用的几种平均数概概念念 计算计算公公式式特特点点4.众数众数(Mo)是一种位是一种位置平均数,置平均数,是一批数是一批数据中出现据中出现次数最多次数最多的那个数的那个数值值.通常通常只用于定只用于定性数据或性数据或离散型的离散型的定量数据。定量数据。上限公式:上限公式:下限公式:下限公式:优优点点:容

44、容易易理解,理解,不受极值影不受极值影响响缺缺点点:灵灵敏敏度度和和计计算算功功能能差差稳定性差稳定性差具具有有不不唯唯一一性性25303540455051015f(人数)人数)月收入:元月收入:元36.11d1d255位置平均数与算术平均数的关系位置平均数与算术平均数的关系1.众数众数适用于所有的定性数据和定量数据适用于所有的定性数据和定量数据中位数中位数适用于定性数据中的定序数据和定量数据适用于定性数据中的定序数据和定量数据算术平均数算术平均数只适用于定量数据只适用于定量数据2.定量数据定量数据:若是若是钟形分布,钟形分布,三种集中趋势指标一般三种集中趋势指标一般都可适用。而对都可适用。而

45、对J形分布,形分布,反反J形分布和形分布和U形分布,中位形分布,中位数和算术平均数没有任何意义。数和算术平均数没有任何意义。3.3.在确定集中趋势指标的过程中,算术平均数比中位在确定集中趋势指标的过程中,算术平均数比中位数和众数使用了更多的数据信息数和众数使用了更多的数据信息。4.对于钟形分布且数据量很大时,三种集中趋势指标有对于钟形分布且数据量很大时,三种集中趋势指标有如下三种数量关系:如下三种数量关系:XfXfXf(对称分布对称分布)正偏态分布(右)正偏态分布(右)负偏态分布负偏态分布(左)左)1212应用平均指标的原则应用平均指标的原则1必须是同质的量方可平均;必须是同质的量方可平均;2

46、总平均数与组平均数结合分析;总平均数与组平均数结合分析;3集中趋势与离散趋势结合分析集中趋势与离散趋势结合分析三、离散趋势的测定三、离散趋势的测定概念概念标标志志变变异异指指标标是是反反映映变变量量分分布布离离散散趋趋势势、与与平平均均指标指标相匹配相匹配的指标。的指标。(1)反映变量分布的离散趋势;)反映变量分布的离散趋势;(3)是对事物发展均衡性的量度。)是对事物发展均衡性的量度。(2)是对平均数的代表性程度的量度;)是对平均数的代表性程度的量度;作用作用四、数据的形态测定四、数据的形态测定偏度偏度:是测定数据分布的偏斜程度的指标是测定数据分布的偏斜程度的指标.。定义定义M=(X-A)k/

47、n为变量为变量X关于关于A的的k阶矩阶矩。当当A=0,即以原点为中心,上式称为即以原点为中心,上式称为“K阶原点矩阶原点矩”。K=1,2,3时,有:时,有:一阶原点矩一阶原点矩M1=(X-0)1/n=X/n二阶原点矩二阶原点矩M2=(X-0)2/n=X2/n三阶原点矩三阶原点矩M3=(X-0)3/n=X3/n当当A=,即以即以为中心,上式称为为中心,上式称为“K阶中心矩阶中心矩”。K=1,2,3时,有:时,有:一阶中心矩一阶中心矩一阶中心矩一阶中心矩二阶中心矩二阶中心矩二阶中心矩二阶中心矩三阶中心矩三阶中心矩三阶中心矩三阶中心矩所以,所以,m3可以测定偏度。为消除量纲,转变为系数,可以测定偏度

48、。为消除量纲,转变为系数,再除以再除以3。0正偏态正偏态峰度:是用来反映数据分布曲线顶端的尖峭或扁峰度:是用来反映数据分布曲线顶端的尖峭或扁平程度的指标。平程度的指标。3尖顶曲线尖顶曲线注:在注:在EXCL等软件中输出的峰度是在此基础上再等软件中输出的峰度是在此基础上再减减3。五数概括五数概括 :即最小即最小值值x xminmin 、最大最大值值x xmax max 、第一第一四分位数四分位数M M1 1、中位数中位数MeMe和第三四分位数和第三四分位数M M3 3 五个数之间的关系,确定数据分布形态的方法:五个数之间的关系,确定数据分布形态的方法:数据是完全对称数据是完全对称:数据是不数据是

49、不对对称称 :最小最小值值x xminmin到中位数的距离等于中位数到最大到中位数的距离等于中位数到最大值值x xmaxmax的距离的距离 。从从xmin到到M1的距离等于的距离等于M3到到xmax的距离。的距离。从从xmax到中位数的距离大于中位数到到中位数的距离大于中位数到xmin的距离。的距离。从从M M3 3到到xmax的距离大于从从的距离大于从从xmin到到M M1 1的距离。的距离。右右偏偏分分布布从从xmin到中位数的距离大于中位数到到中位数的距离大于中位数到xmax的距离。的距离。从从xmin到到M M1 1的距离大于的距离大于M M3 3到到xmax的距离。的距离。左左偏偏分

50、分布布箱箱线图线图:是基于五数概括的是基于五数概括的图图示方式,使得集中示方式,使得集中趋势趋势、离散离散趋势趋势和偏和偏态态更更为为直直观观。第五章第五章参数估计和假设检验参数估计和假设检验推断统计:推断统计:推断统计:推断统计:利用样本统计量对总体某些性质或数量利用样本统计量对总体某些性质或数量特征进行推断。特征进行推断。随机原则随机原则总体参数总体参数统计量统计量推断估计推断估计参数估计参数估计检验检验假设检验假设检验抽样分布抽样分布抽样分布抽样分布简单随机抽样和简单随机样本的性质简单随机抽样和简单随机样本的性质不放回不放回放放回回放回放回不放不放回回独独立立性性和和同同一一性性同一性同

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 高考资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com