统计学课程教材ppt(全).ppt-得力文库

资源描述

《统计学课程教材ppt(全).ppt》由会员分享，可在线阅读，更多相关《统计学课程教材ppt(全).ppt（388页珍藏版）》请在得力文库 - 分享文档赚钱的网站上搜索。

1、经济统计案例,经济统计无处不在：统计实例,举例1.我国每年都要编辑全国统计年鉴，包括很多方面的，经济发展和社会进步的各种指标，其中我们比较关心的有GDP、CPI、外贸进出口额、人均可支配收入等等。每年的2月底会公布前一年的国民经济和社会发展统计公报。,举例1.中华人民共和国2011年国民经济和社会发展统计公报,初步核算，全年国内生产总值471564亿元，比上年增长9.2%。其中，第一产业增加值47712亿元，增长4.5%；第二产业增加值220592亿元，增长10.6%；第三产业增加值203260亿元，增长8.9%。第一产业增加值占国内生产总值的比重为10.1%，第二产业增加值比重为46.8%

2、，第三产业增加值比重为43.1%。,举例1.中华人民共和国2011年国民经济和社会发展统计公报,全年居民消费价格比上年上涨5.4%，其中食品价格上涨11.8%。固定资产投资价格上涨6.6%。工业生产者出厂价格上涨6.0%。工业生产者购进价格上涨9.1%。农产品生产价格上涨16.5%。,举例1：中华人民共和国2011年国民经济和社会发展统计公报,年末全国就业人员76420万人，其中城镇就业人员35914万人。全年城镇新增就业1221万人。年末城镇登记失业率为4.1%，与上年末持平。全年农民工总量为25278万人，比上年增长4.4%。其中，外出农民工15863万人，增长3.4%；本地农民工9415

3、万人，增长5.9%。年末国家外汇储备31811亿美元，比上年末增加3338亿美元。年末人民币汇率为1美元兑6.3009元人民币，比上年末升值5.1%。,举例1：中华人民共和国2011年国民经济和社会发展统计公报,全年研究生教育招生56.0万人，在学研究生164.6万人，毕业生43.0万人。普通高等教育本专科招生681.5万人，在校生2308.5万人，毕业生608.2万人。各类中等职业教育招生808.9万人，在校生2196.6万人，毕业生662.7万人。全国普通高中招生850.8万人，在校生2454.8万人，毕业生787.7万人。全国初中招生1634.7万人，在校生5066.8万人，毕业生17

4、36.7万人。普通小学招生1736.8万人，在校生9926.4万人，毕业生1662.8万人。特殊教育招生6.4万人，在校生39.9万人，毕业生4.4万人。幼儿园在园幼儿3424.4万人。,举例2：人口普查，人口抽样调查,我国每10年进行一次人口普查，上次是2010年，在两次人口普查期间的中间进行1%的人口抽样调查。普查涉及内容比较广泛，如人口数、流动人口、城乡构成、性别构成、年龄构成、民族、受教育程度，收入、就业等等情况。我国以2010年11月1日零时为标准时点进行了第六次全国人口普查，结果显示，全国总人口为1370536875人。其中：普查登记的大陆31个省、自治区、直辖市和现役军人的

5、人口共1339724852人。,举例2：人口普查，人口抽样调查,大陆31个省、自治区、直辖市和现役军人的人口中，男性人口为686852572人，占51.27%；女性人口为652872280人，占48.73%。总人口性别比(以女性为100，男性对女性的比例)由2000年第五次全国人口普查的106.74下降为105.20。,举例2：人口普查，人口抽样调查,大陆31个省、自治区、直辖市和现役军人的人口中，0-14岁人口为222459737人，占16.60%；15-59岁人口为939616410人，占70.14%；60岁及以上人口为177648705人，占13.26%，其中65岁及以上人口为11883

6、1709人，占8.87%。大陆31个省、自治区、直辖市和现役军人的人口中，具有大学(指大专以上)文化程度的人口为119636790人；具有高中(含中专)文化程度的人口为187985979人；具有初中文化程度的人口为519656445人；具有小学文化程度的人口为358764003人,举例3：2011年武汉地区高校毕业生就业报告,去年，该市首次用“非失业率”描述大学生就业状况，涵盖“就业率+升学考研率+出国留学率”。据称，武汉地区2011届高校毕业生规模达到历史新高，为267703人，其中本科生114961人、专科生123781人、硕士生25661人、博士3300人，非失业率达89.61%。这支

7、武汉规模最大的高校毕业大军，近九成有“事”可做。,举例3：2011年武汉地区高校毕业生就业报告,根据昨日发布的就业报告，武汉地区2011届本科毕业生平均月收入2983元，专科毕业生2123元，硕士研究生3872元。相比2010届，前两项分别增加了56元、119元。业内人士认为，物价上涨是导致薪资升高的原因之一。武汉市毕办主任王星介绍，在全国15个副省级城市中，武汉高校毕业生薪资水平属中上等。,举例3：2011年武汉地区高校毕业生就业报告,本科各专业中，毕业半年后月收入最高的是经济学，月收入为3421元；其次是工学，月收入3353元；最低的是教育学，月收入仅2742元。行业间的贫富差距明显。金

8、融服务行业应届高校毕业生收入继续领跑，平均月收入3321元，紧随其后的是IT行业，平均月收入达3253元。而房地产行业由去年第3名跌落至第5名，月平均收入2837元。制造业收入维持在较低水平，月均2347元。,举例4.啤酒和尿布的故事,全球最大的零售商沃尔玛通过分析顾客购物的数据发现，很多周末购买尿布的顾客同时也购买啤酒。经过深入观察和研究发现，美国家庭买尿布的多是爸爸。年轻的父亲们下班后要到超市买尿布，同时“顺手牵羊”带走啤酒，好在周末看棒球赛的同时过把酒瘾。后来沃尔玛就把尿布和啤酒摆放得很近，从而双双促进了尿布和啤酒的销量。这个故事工人是数据挖掘data mining的经典范例。,举例5：

9、文学也与统计有关,据统计学家（复旦大学李贤平教授）对红楼梦各回的虚词（47个虚词：之，其，或，呀，吗，可，便，就）出现的频率进行统计分析（原因是由于个人写作特点和习惯的不同，所用的虚词是不会一样的），采用聚类分析，（物以聚类，人以群分）发现前80回和后40回明显不同，出自不同的人，进一步运用判别分析，发现前80回是曹雪芹所写，后40回不是高鹗一人所写，而是曹雪芹亲友将其草稿整理而成，宝黛故事为一人所写，贾府衰败情景为另一人所写等等，这个论证在红学界轰动很大。,统计资料表明大多数汽车事故出在中等速度的行驶中，极少的事故是出在大于150公里/小时的行驶速度上的。这是否就意味着高速行驶比较安全？,答

10、：绝不是这样。统计关系往往不能表明因果关系。由于多数人是以中等速度开车，所以多数事故是出在中等速度的行驶中。,问：统计数字还表明，在亚利桑那州死于肺结核的人比其他州的人多。这是否就意味着亚利桑那州的气候容易生肺病？,答：正好相反。亚利桑那的气候对害肺病的人有好处，所以肺病患者纷纷前来，自然这就使这个州死于肺结核的平均数升高了。,究竟什么是统计？,我们在生活和工作中会接触到大量的信息和数据。我们未来会成为经济管理人员或科研工作者，有些人将成为数据的生产者，但大部分人会成为数据的使用者。你必须有能力弄懂别人向你提供的大量数据的涵义。什么样的专门手段能使你高效率地使用数据？答案是“统计学”。,统计

11、是以数据为食物的动物,统计的本业是消化数据，并产生有营养的结果。,Data Statistics Information,经济学家、教育家、人口学家原北京大学校长马寅初,学者不能离开统计而研究政治家不能离开统计而施政企业家不能离开统计而执业,第一节统计与统计学,统计与统计学的含义统计数据的规律与统计方法,一、统计与统计学的含义,统计统计的历史统计学统计学在我国的发展情况,1.统计,统计作为一种社会实践活动已经有很悠久的历史。在外语中，“统计”一词与“国家”一词来源于同一词源，现在统计已经被赋予多种含义，包括：（1）统计工作（搜集）（2）统计数据（结果）（3）统计学（方法、技术

12、）,2.统计的历史,统计最早运用者之一是“政治算术学派”创造人威廉.配第和约翰.格朗特，首先在其著作中使用统计数字和图表等方法来分析研究社会、经济和人口现象。,3.统计学,统计学已经发展成为具有多个分支学科的大家族。统计学是收集、整理、分析统计数据的方法科学，其目的是探索数据的内在规律性，以达到对客观事物的科学认识。统计数据的收集：基础统计数据的整理：加工处理，使统计数据系统化、条理化统计数据的分析：核心内容，通过统计描述、统计推断探索数据内在规律性,4.统计学在我国的发展情况,统计学分两类人才培养模式：数理类（理学）、经济类（经济学）统计学的国家重点学科：人大、厦大、西财统计学的博

13、士点：人大、厦大、中南财经、西财、东财、上财等有影响力的统计学家：陈希孺（院士，统计学唯一的院士，2005年不幸去世，71岁）易丹辉、袁卫、庞皓、曾五一、邱东、钱伯海、颜日初（国民经济统计）、张尧庭、方开泰（多元统计分析）,4.统计学在我国的发展情况,统计期刊：统计研究、中国统计、统计与决策、数理统计与管理统计教材：黄良文：统计学，中国统计出版社2000。贾俊平等：统计学，人大出版社2004 魏建国：统计学，武汉理工出版社2006,二、统计数据的规律与统计方法,1.生育人口性别比：男孩：女孩=107：100 2.掷硬币1/2和掷色子1/6（买彩票、足彩、体彩等等） 3.统计调查：恩格尔

14、系数（食品支出占总支出的比例）、基尼系数（警戒线0.4）,二、统计数据的规律与统计方法,以上例子说明，通过多次观察或试验可以得到大量的统计数据，利用统计方法是可以探索其内在的数量规律性。因为客观事物本身是必然性与偶然性的对立统一，必然性反映了事物的本质特征，偶然性反映了事物表现形式的差异。（举例学生的平均分，标准差）,第二节统计学的分科,统计方法已经被应用到自然科学和社会科学的众多领域，统计学也发展成为若干分支学科组成的学科体系。从统计方法的构成：描述统计学、推断统计学从统计方法研究和应用角度来分：理论统计学、应用统计学,一、描述统计学和推断统计学,1.描述统计学（Descriptive

15、 Statistics）研究如何取得反映客观现象的数据，并通过图表形式，对所收集的数据进行加工处理和显示，进而通过综合、概括与分析得出反映客观现象的规律性数量特征。（数据的收集、加工处理、显示以及数据分布特征的概括与分析） 2.推断统计学（Inferential Statistics）研究如何根据样本数据去推断总体数量特征的方法，它是在对样本数据进行描述的基础上，对统计总体的未知数量特征作出以概率形式表述的推断。（举例说明，全校某次英语四级考试的通过率，通过抽样调查100人）（抽样估计、假设检验、回归分析）,一、描述统计学和推断统计学,描述统计和推断统计是统计方法的两个组成部分。描述统计是整个

16、统计的基础，推断统计是现代统计学的主要内容，已经成为统计学的核心内容。,二、理论统计学和应用统计学,1.理论统计学（Theoretical Statistics）指统计学的数学原理，它主要研究统计学的一般理论和统计方法的数学理论。它是统计方法的理论基础。 2.应用统计学（Applied Statistics）研究如何应用统计方法去解决实际问题。如：生物统计学、卫生统计学、人口统计学、农业统计学、管理统计学、社会统计学,第三节统计学与其他学科的关系,统计学与数学的关系统计学与计算机的关系统计学与其他相关学科的关系,一、统计学与数学的关系,二、统计学与计算机的关系,计算机软件的开发为统计的

17、计算带来了极大的方便，可以在很快的时间内处理相关的数据。常见的统计软件有：Excel、SPSS（Statistics Package for Social Sciences）、Eviews、SAS等等。,三、统计学与其他学科的关系,统计学可以帮助其他学科探索学科内在的数量规律性，但对于这种数量规律性的解释，只能由各学科的研究来完成。统计方法不是万能的，有时会造成一些错误或误会。定量分析与定性分析要相结合。要选择适当的统计工具。,第二章统计数据的描述,第二章主要内容,2.1数据的计量尺度 2.2统计数据的来源 2.3统计数据的整理 2.4分布集中趋势的测度 2.5分布离散程度的测度 2.

18、6分布偏态与峰度的测度 2.7统计表与统计图,2.1数据的计量尺度,一般情况，数据的计量尺度按由低到高、由粗略到精确可以分为四种：列名尺度顺序尺度间隔尺度比例尺度,一、列名尺度nominal scale,其特点是只能对事物进行平行的分类或分组，例如：人口按性别分为男、女，按教育程度分为高中及以下、大学、研究生，按户口分城市、农村等等。企业按经济性质分：国有、集体、私营、外企。为了便于统计处理，特别是为了便于计算机识别，可以对不同类别用数字或编码表示，如：“1”表示男性，“2”表示女性（但注意：这只是代码，不能区分大小或进行任何数学运算。）,二、顺序尺度ordinal scale,顺序

19、尺度是对事物之间等级差或顺序差别的一种测度，可以比较大小。不仅可以将事物分成不同的类别，而且还可以确定这些类别的优劣或顺序。例如：产品分为一等品、二等品、三等品，考试成绩分为优、良、中、及格、不及格，客户对某产品的满意程度分别很满意、比较满意、不太满意、很不满意等。顺序尺度比列名尺度精确，但它只是测度了类别之间的顺序，而未测量出类别之间的准确差值，顺序尺度的计量结果只能比较大小，不能进行加减乘除运算。,三、间隔尺度interval scale,不仅可以比较各事物的大小，而且可以计算差异的大小，即计算数量的间隔。例如：考试分数（百分制）、温度的计量。,四、比例尺度ratio scale,比例

20、尺度与间隔尺度的差别很小，区别主要在于，在间隔尺度中，“0”表示某一个数值，或者叫做0水平。而在比例尺度中，“0”表示“没有”或者“无”。例如：温度0表示0摄氏度，而长度0米则表示没有或不存在。大多数情况我们使用的是比例尺度。另外，间隔尺度只做加减运算，做乘除运算没有多大意义。而比例尺度可以做加减乘除运算且都有意义。,2.2 统计数据的来源,直接来源间接来源,一、间接来源,报纸、图书、杂志、统计年鉴、网络等渠道获得。或者从调查公司或数据库公司购买。如国泰安中国金融、经济信息数据库公司。期刊网、维普网。书上有很多,常用的统计数据来源,美国经济分析局http:/www.bea.doc.gov

21、美国人口普查局http:/www.census.gov 美国劳工统计局http:/stats.bls.gov 美联储经济数据库http:/www.stls.frb.org/fred 美国联邦统计http:/www.fedstats.gov 世界银行http:/www.worldbank.org 国际货币基金组织http:/www.imf.org OECD http:/www.oecd.org,二、直接来源,1.普查census：普查是为某一特定目的，专门组织的一次性全面调查。这是一种摸清国情、国力的重要调查方法。我国的人口普查、工业普查、经济普查（第二、三产业） 2.抽样调查：抽样调查是通过随

22、机样本对总体数量规律性进行推断的调查研究方法。虽然准确性没有普查高，但是节省人力、物力、财力。大多数调查公司都采取这种调查方式，如收视率调查、家庭收支情况调查、客户需求调查等等。,二、直接来源,3.重点调查和典型调查重点调查是从调查对象的全部单位中选择少数重点单位进行调查，其中重点单位是指在所要调查的数量特征上占有较大比重的单位。如了解全国钢铁企业，选择宝钢、鞍钢、首钢、武钢、包钢即可。典型调查是从调查对象的全部单位中选择一个或几个少数有代表性的单位进行全面深入的调查。如研究武汉市跨国公司的运营情况，选取可口可乐公司作个案分析。重点调查、典型调查具有主观性，其调查的单位不是随机抽取的，因

23、此，调查结果不能推论总体。,2.3 统计数据的整理,统计分组次数分配的图示与类型,一、统计分组,统计分组是统计整理的第一步，是根据统计研究的目的，将数据按照某种特征或标准分成不同的组别。分组时所依据的特征或标准成为统计分组标志：品质标志分组：按事物的性质和属性划分（列名尺度和顺序尺度的数据）数量标志分组：按事物的数量标准划分（间隔尺度和比例尺度的数据）,（一）品质标志分组,比较简单，如对某学校学生的性别进行调查，可将学生分为男生、女生两个组。再如对武汉市的学校进行分类，可以分为小学、中学、中专、大学四个组。,某高校学生性别分布表（品质数列）,分组次数频率,注意分组的完备性,（二）数

24、量标志分组,单变量值分组：把每一变量值作为一组，这种分组方式通常只适用于离散变量而且变量值较少的情况。组距分组：将全部变量值依次划分为若干个区间，并将这一区间的变量作为一组。,1.组距分组的步骤,（1）确定组距class width：一般以5或10的整数倍为组距（2）确定组数：组数=全距range/组距=（最大值-最小值）/组距（3）根据分组整理成频数分布表,2.组距分组应注意的问题,（1）每组的两个端点数值叫组限，其中每组的小值称为下限（low limit），较大值称为上限（upper limit）；连续型变量在分组时相邻组的上下限应该重合，“上限不在组内”的原则，如：115120，包

25、括115，但是不包括120；（2）在组距分组时，如果总体中有特小的变量值，就采用下开口组“某某以下” 在组距分组时，如果总体中有特大的变量值，就采用上开口组“某某以上” （3）组距分组：等距分组、不等距分组（如年龄06岁幼儿，717少儿，1835青年，3664中年，65以上老年）,2.组距分组应注意的问题,（4）组中值：class midpoint可以反映各组数据的一般水平，作为该组数据的一个代表值。组中值：（下限+上限）/2 对于上开口组：本组下限+邻组组距/2 对于下开口组：本组上限-邻组组距/2,2.组距分组应注意的问题,（5）向上累积：将各组次数和频数由变量值小的组向变量值大的组逐

26、组累积，它表明该组上限以下的单位数是多少，占总体比重是多少向下累积：将各组次数和频数由变量值大的组向变量值小的组逐组累积，它表明该组下限以上的单位数是多少，占总体比重是多少,举例,二、次数分布的图示与类型,直方图与折线图几种常见的次数曲线洛伦茨曲线与基尼系数,1.直方图histogram和折线图（频数多边形）frequency polygon（多边形）,直方图是用矩形的宽度和高度来表示频数分布的图形，横轴表示数据分组，纵轴表示频数或者频率。折线图则是在直方图基础上，把直方图顶部的中点（即组中值）用直线连接起来。,2.几种常见的次数曲线,当所观察的次数越多，组距越小，而且组数越多时，所给出

27、的折线图就会越光滑，逐渐形成一条光滑的曲线，这种曲线即次数分布曲线，反映了数据或统计量的分布规律。,（三）、次数分布的主要类型1、钟型分布(1)对称的钟型分布,日产量(件),(2)左偏分布,日产量(件),(3)右偏分布,日产量(件),2、型分布,3、J型分布(1),价格,型分布（）,价格,3.洛伦茨曲线与基尼系数,洛伦茨曲线是20世纪初美国经济学家、统计学家洛伦茨根据意大利经济学家帕累托（福利经济学的代表人，提出了帕累托最优）提出收入分配公式绘制成的描述收入和财富分配性质的曲线。横轴是累积的人口百分比，纵轴是累积的收入或财富百分比。,3.洛伦茨曲线与基尼系数,基尼系数=A/(A+B)，如果A

28、=0,则基尼系数=0，表示收入绝对平均。如果B=0，则基尼系数=1，表示收入绝对不平均。基尼系数在0.20.4是比较适当的，0.4是收入分配不平均的警戒线。,2.4分布集中趋势的测度,统计数据经过排序和分组整理后，对数据分布的类型、特点有了一个大致的了解，但是这种了解知识表面上的，还缺少代表性的数量特征值。对于统计数据分布的特征，可以从两个方面进行描述：数据分布的集中趋势（central tendency）（众数、中位数、分位数、均值、几何平均数）数据分布的离散程度（dispersion）（极差、内距、方差、标准差、离散系数）,2.4分布集中趋势的测度,众数中位数均值几何平均数众

29、数、中位数、均值的比较,一、众数mode,众数是一组数据中出现次数最多的变量值。从分布看，众数是具有明显集中趋势点的数值。一组数据分布的最高峰点所对应的数值即是众数。例如：鞋的码号（女士37，男士41号）当然会后极大值如姚明50号的鞋子。再比如衣服的尺寸等等。计算方法：1.根据未分组数据或者单变量值分组数据计算众数 2.对于组距分组求众数,1.根据未分组数据或者单变量值分组数据计算众数,只需找出出现次数最多的变量值即为众数。例如：有一组数据如下：2，3，3，5，5，5，6，7，8 ，10，这其众数为5。,2.对于组距分组求众数,其中，L表示众数所在组的下限表示众数组次数与下一组（前一组

30、）次数之差表示众数组次数与上一组（后一组）次数之差 i表示众数组的组距,举例：某车间50名职工日产量分组资料如下：,举例,众数组为60-70，L=60，i=10， 1=21-8=13，2=21-9=12，则,二、中位数median,中位数是数据排序后（从大到小或者从小到大），位置在最中间的数值。计算：1.未分组数据 2.分组数据计算中位数,1.未分组数据计算中位数,设有一组数据为X1、X2、Xn，按从小到大排序后为X(1)、X(2)、X(n)，则（当n为奇数）（当n为偶数）例如：有6位工人日生产产品件数排序：27，29，30，31，31，32 则Me=（30+31）/2=30.5

31、,2.分组数据计算中位数,先根据N/2确定中位数的位置，确定中位数所在的组，采用以下近似公式计算： L表示中位数所在组的下限 Sm-1表示中位数所在组以下各组的累积次数（以前各组的累积次数） fm表示中位数所在组的次数 i表示中位数所在组的组距,举例,前例中：中位数所在组50/2=25,在60-70组内，L=60，i=10，fm=21,Sm-1=13, 则中位数为：,三、均值mean（算术平均数arithmetric mean),简单算术平均数加权算术平均数,1.简单算术平均数,如小明期中考试，语文得了100分，数学得了90分，则其平均成绩为（100+90）/2=95分,2.加权算术平均数,

32、xi:次数分配中各组的组中值 fi:各组的次数或者权数 k：分组的组数,加权算术平均数举例,3.算术平均数应注意的问题,（1）（2）（3）,四、几何平均数geometric mean,几何平均数是n个变量值乘积的n次方根。举例：生产某种产品需要连续经过4道工序，根据经验，各道工序的合格率分别为98%、95%、92%、90%，求该产品4道工序的平均合格率。,五、众数、中位数、均值的比较,三者的关系三者的特点及应用场合,1.三者的关系,2.三者的特点及应用场合,对称分布或接近对称分布，选择均值较好。若偏态分布，选择众数或中位数较好。均值易受数据极端值的影响，对于偏态分布的数值，均值的代表

33、性较差。众数、中位数不易受极端值的影响。事实上，在实际的应用当中，均值的使用率最高。,2.5分布离散程度的测度,极差方差标准差离散系数,一、极差range,极差又叫全距，是数据最大值减去最小值，极差R=max-min,二、方差variance和标准差standard deviation,未分组数据分组数据,1.未分组数据计算方差和标准差,方差标准差,2.分组数据计算方差和标准差,方差标准差,2.分组数据计算方差和标准差：举例,2.分组数据计算方差和标准差：举例,均值方差标准差s=262.85,四、离散系数coefficient of variance,上面介绍的离散程度的测

34、度值为绝对值，其大小取决于原变量值本身水平高低，变量值越大，测度值越大；另外，采用不同计量单位计量的变量值，其离散程度的测度值也不同。而离散系数则可以消除变量值水平高低、计量单位不同对离散程度测度值的影响。离散系数是标准差与均值之比：,四、离散系数举例,为比较两个不同城市居民家庭收入的差异程度，现从甲市随机抽取100户，得到其平均收入为42000元，年收入的标准差是38060元，从乙市随机抽取100户，得到其平均收入是62000元，年收入的标准差是50980元，试比较这两个城市家庭年收入的差异程度。由此，乙市的家庭收入差异程度低于甲市。（不能用标准差比较，否则得出错误的结论）,2.6分布

35、偏态与峰度的测度,偏态及其测度峰度及其测度,一、偏态及其测度,偏态是对分布偏斜方向及程度的测度。偏态系数（skewness）来进行测度。偏态系数的计算方法很多，这里介绍常用的一种，即：离差三次方的平均数再除以标准差的三次方。,一、偏态及其测度,SK=0,对称分布 SK0,正偏或者右偏 SK0,负偏或者左偏,二、峰度及其测度,峰度Kurtosis：数据分布平峰或者尖峰程度的测度。峰度通常是与标准正态分布相比较而言。峰度系数是用离差四次方的平均数再除以标准差的四次方。 K=0,正态分布 K0，尖峰 K0，平峰,2.7统计表与统计图,统计表统计图,一、统计表,统计表的构成设计和使用统计

36、表应注意的问题,某地区100个百货商店月销售额与流通费用情况,1.统计表的构成,统计表主要由四部分构成，即表头、行标题、列标题和数字资料。必要时可以在统计表的下方加上表外附加。其中：表外附加包括：资料来源和注释。如：50页表2.20,2.设计和使用统计表应注意的问题,（1）合理安排统计表的结构（行标题、列标题）（2）表头一般包括表号、总标题和表中数据的单位等内容。总标题应满足3W（when,where,what）（3）表中的上下两条横线一般用粗线，中间的其他线要用细线。统计表的左右两边不封口，列标题之间一般用竖线分开，而行标题之间通常不必用横线隔开。表中数据一般右对齐，有小数点时，应以

37、小数点对齐，而且小数点的位数应统一。对于没有数据或数据不详的表格单元，一般用“”表示。（4）使用统计表时，必要时可在表的下方加上注释，特别要注意注明资料来源，以对他人的劳动成果的尊重，备读者查阅使用。,3.统计图,茎叶图 stem-and-leaf display（ 45页表2.16 ）箱线图box plot（了解）（47页图2.12）统计图的误用（教材52页例2.6、2.7、2.8、2.9）充分利用统计图（教材54页例2.10、2.11 ）,某商店某日销售的饮料情况,柱状图,（用于显示离散型变量的次数分布）,饼图,折线图,第三章时间序列分析,武汉工业学院王新华,本章主要内容及

38、重难点,主要内容：时间序列的对比分析、时间序列及其构成要素、时间序列趋势变动分析、季节变动分析重点：时间序列的速度分析指标（发展速度、增长速度、平均发展速度、平均增长速度）、时间序列的构成要素、移动平均法、最小二乘趋势法难点：最小二乘趋势法、季节变动分析,3.1时间序列的对比分析,时间序列的含义时间序列的速度分析平均发展速度和平均增长速度,一、时间序列的含义,定义时间序列的构成时间序列分析的目的时间序列的种类编制时间序列的基本原则,1.时间序列的含义,时间序列（time series）是指客观现象常常随着时间变化而变化，并表现出一定的动态规律性。将反映某一现象数量变化的同类指标

39、，按时间的先后顺序排列，由此形成的数据数列称为时间序列,2.时间序列的构成,被研究现象所属的时间ti 不同时间上的统计数据xi i=0,1,2,n（各时间的发展水平）举例：300页表9.1 在对各时间的发展水平进行比较时，把作为比较基础的那个时期称为基期，相对应的发展水平称为基期水平；把所研究考察的那个时期称为报告期，相对应的发展水平称为报告期水平。,要素一：动态t,要素二：指标数值a,3.时间序列分析的目的,描述事物在过去的状态揭示事物发展变化的规律性预测事物在未来时间的数量,4.时间序列的种类,绝对数时间序列（如GDP、进出口额、存款余额）相对数时间序列（如恩格尔系数、资产利润率、

40、人口出生率）平均数时间序列（如平均工资、平均分）,我国1996-2002年国民经济主要指标,5.编制时间序列的基本原则,（1）各指标数值所属时间可比（2）各指标数值总体范围可比（全国31省市，还是部分省市，或者是否包括港澳台）（3）各指标数值的经济内容（如：我国的经济统计中，生产总量最早用国民收入，后改用GDP与GNP）、计算口径（重庆与四川）、计算方法可比（如GDP有三种算法：生产法、收入法、支出法）（价格指数有CPI,PPI,RPI）,二、时间序列的速度分析,发展速度增长速度,1.发展速度,举例教材301页例9.2,1998-2002我国水泥产量速度指标计算表,1.发展速度,各环比

41、发展速度的连乘积等于相应时期的定基发展速度。相邻的两个定基发展速度之商，等于相应时期的环比发展速度，即：,2.增长速度,环比增长速度=环比发展速度-1 定基增长速度=定基发展速度-1 举例301页例9.2,三、平均发展速度和平均增长速度,平均发展速度平均增长速度,1.平均发展速度,（几何平均数）各期环比发展速度的序时平均数，通常采用几何平均法。,2.平均增长速度,平均增长速度=平均发展速度-1 例题：一家投资公司某笔投资的年利率是按复利计算的，10年的年利率分配如下：第1年至第2年为5%，第3年至第5年为8%，第6年至第8年为10%，第9年至第10年为12%，求平均年利率。（收益率）,2.

42、平均增长速度,平均年利率=平均本利率-1 = =8.77% 思考题：教材327页第3题，要求计算平均增长速度。,3.2时间序列及其构成因素,时间序列的构成因素时间序列构成因素的组合模型,一、时间序列的构成因素,长期趋势(Trend,T) 季节变动(Seasonal fluctuation,S) 循环变动(Cyclical variation,C) 不规则变动(Irregular variation,I),1.长期趋势trend（T）,长期趋势是指现象在一段相当长的时间内所表现的沿着某一方向的持续发展变化。长期趋势可能是不断增长或不断下降或保持不变的态势。例如：我国的GDP近20年来呈现出逐年

43、增长的态势。长期趋势一般是受某种长期的起根本性作用的因素影响的结果。如305页图9.3。,2.季节变动seasonal fluctuation(S),季节变动本意上指受自然因素的影响，在一年中随季节的更替而发生的有规律的变动。现在对季节变动的概念有了扩展，对一年内由于社会、政治、经济、自然因素的影响，形成的以一定时期为周期的有规律的重复变动，都可以称为季节变动。比如：“销售淡季”、“销售旺季”（啤酒、衣服）/旅游旺季、旅游淡季（如305页图9.4）还比如：一天中七天规律性的变化，周五通常是人际交往的高峰期，周六、周日则是娱乐、购物的黄金时间。一日中午和傍晚下班时分，是副食和蔬菜的销售黄金时

44、间。,3.循环变动cyclical variation(C),循环变动是指以若干年（季、月）为一定周期的有一定规律性的周期波动。循环变动和长期趋势不一样，循环变动不是单一方向的持续变动，而是有涨有落的交替波动。循环变动和季节变动也不同，循环变动的周期长短很不一致，不像季节变动那样有很明显的按月或者按季的固定周期规律。如图206页图9.5。,4.不规则变动irregular variation(I),不规则变动是时间序列分离了长期趋势、季节变动、循环变动以后的波动。不规则变动一般受众多偶然因素的影响。（随机变动）,二、时间序列构成因素的组合模型,1.乘法模型Y=T.S.C.T 2.加法模型Y=

45、T+S+C+I,3.3时间序列趋势变动分析,时间序列的长期趋势是就一个较长的时期而言的。长期趋势的测定和分析的目的主要有三个：一是为了认识现象随时间发展变化的趋势和规律性；二是对现象未来的发展趋势做出预测；三是从时间序列中剔除长期趋势成分，以便于分解出其他类型的影响因素。时间序列趋势的测定方法主要有：移动平均法、趋势模型法,一、移动平均法,扩大原时间序列的时间间隔，选定一定的时距项数N，采用逐次递移的方式，对原序列递移的N项计算一系列的序时平均数。举例：307页的例9.4中的表9.3（奇数项移动平均）和表9.4（偶数项移动平均）,移动平均法,奇数项移动平均:,原数列,移动平均,新数列,移

46、动平均,移动平均,新数列,原数列,移动平均法,偶数项移动平均:,【例】返回,原数列,三项移动平均,五项移动平均,一、移动平均法（特点）,1.对原序列有修匀或平滑的作用。N越大，对序列的修匀作用越强。 2.移动平均次数：当时距项数N为奇数时，只需一次移动平均，其移动平均值作为移动平均项数的中间一期的趋势代表值；当N为偶数时，第一次移动平均后，需再进行一次移正平均（相邻两项平均值），这样才可以对正某一时期。,一、移动平均法（特点）,3.当序列包括季节变动时，移动平均时距项数N应与季节变动长度一致（如4个季度或12个月），才能消除其季节变动；若序列中包含周期变动，平均时距项数N应和周期长度基本一致

47、，才能较好地消除周期波动。 4.移动平均以后，其序列的项数较原序列减少。当N为奇数，首尾各减少（N-1）/2项；当N为偶数，首尾各减少N/2项。 5.此方法适用于分析时间序列的长期趋势，但一般不适合对现象未来的发展趋势进行预测。,二、线性趋势模型法,时间序列的长期趋势可分为：线性趋势（直线）、非线性趋势（曲线）线性趋势模型法，是利用以时间t为解释变量的线性回归的方法对原时间序列拟合线性方程。是时间序列Y的趋势值，t是时间序列的标号,线性趋势模型法的原理：普通最小二乘法（OLS）,残差平方和最小，即最小由极值的必要条件有：,线性趋势模型法的原理：普通最小二乘法（OLS）,整理得: 解

48、得：,二、线性趋势模型法,由于时间t的编号具有一定的灵活性，适当的时间编号可以使，这样上式就可以简化成：如何编号使得，如果n为奇数，则编成-3，-2，-1，0，1，2，3。如果n为偶数，则编成-5，-3，-1，1，3，5。,举例,举例,2007年时，t=6，则春运客流量为,三、非线性趋势模型法,抛物线型指数曲线型修正指数曲线 Gompertz曲线 Logistic曲线,3.4季节变动分析,季节变动分析及其测定的目的季节变动分析的原理与方法,一、季节变动及其测定目的,季节变动是指客观现象因受自然因素或社会因素影响，而形成的有规律的周期性变动。如：销售淡季、销售旺季，旅游淡季、旅游旺季

49、。（不少商品的生产、销售与库存受季节因素的影响较大。）季节变动分析的意义：认识规律、预测未来、消除季节因素以更好地分析其他因素。,二、季节变动分析的原理与方法,原始资料平均法趋势-循环剔除法,1.原始资料平均法,（1）计算各年同期（月或者季）的平均数，（i=1,212或者i=1,2,3,4）其目的是消除各年同一季节数据上的不规则变动；（2）计算全部数据的总平均数，找出整个序列的水平趋势；（3）计算季节比率（季节指数）,1.原始资料平均法（举例）,2.趋势-循环剔除法,当序列包含明显的上升（或下降）趋势或循环变动时，为了更准确地计算季节指数，就应当首先设法从序列中消除趋势和循环因素，然后再用平均的方法消除不规则变动，从而较准确地分解出季节变动成分。其步骤为：（假定Y=T.S.C.I）,2.趋势-循环剔除法,（1）对原序列计算移动平均数（移动平均项数等于季节周期L4或者12），可以消除季节变动和不规则变动，所得平均的结果用M表示，则M只包含了趋势变动T和循环变动C,即

展开阅读全文