《时间序列分析-第二章-时间序列的预处理.doc》由会员分享,可在线阅读,更多相关《时间序列分析-第二章-时间序列的预处理.doc(48页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、Four short words sum up what has lifted most successful individuals above the crowd: a little bit more.-author-date时间序列分析-第二章-时间序列的预处理佛山科学技术学院应 用 时 间 序 列 分 析 实 验 报 告实验名称 第二章 时间序列的预处理 一、上机练习2.4.1绘制时序图 data example2_1; input price1 price2; time=intnx(month,01jul2004d,_n_-1); format time date.; cards;1
2、2.85 15.2113.29 14.2312.41 14.6915.21 13.2714.23 16.7513.56 15.33 ; proc gplot data=example2_1; plot price1*time=1 price2*time=2/overlay; symbol1 c=black v=star i=join; symbol2 c=red v=circle i=spline; run;语句说明:(1) “proc gplot data=example2_1;”是告诉系统,下面准备对临时数据集example2_1中的数据绘图。(2) “plot price1*time=1
3、 price2*time=2/overlay;”是要求系统要绘制两条时序曲线。(3) “symbol1 c=black v=star i=join;”,symbol语句是专门指令绘制的格式。输出的时序图见下图:两时间序列重叠显示时序图2.4.2 平稳性与纯随机性检验1、平稳性检验为了判断序列是否平稳,除了需要考虑时序图的性质,还需要对自相关图进行检验。SAS系统ARIMA过程中的IDENTIFY语句可以提供非常醒目的自相关图。data example2_2;input freq;year=intnx (year,1jan1970d,_n_-1);format year year4.;cards
4、;97 154 137.7 149 164 157 188 204 179 210 202 218 209204 211 206 214 217 210 217 219 211 233 316 221 239215 228 219 239 224 234 227 298 332 245 357 301 389;proc arima data=example2_2;identify var=freq;run;语句说明:(1) “proc arima data=example2_2;”是告诉系统,下面要对临时数据集example2_2中的数据进行ARIMA程序分析。(2) “identify va
5、r=freq;”是对指令变量freq的某些重要性质进行识别。执行本例程序,IDENTIFY语句输出的描述性信息如下:这部分给出了分析变量的名称、序列均值、标准差和观察值个数。IDENTIFY语句输出结果的第二部分分为自相关图,本例获得的样本自相关见下图。序列FREQ样本自相关图 其中: Lag延迟阶数。 Covariance延迟阶数给定后的自协方差函数。 Correlation自相关系数的标准差。 “.”2倍标准差范围。 2、纯随机性检验为了判断序列是否有分析价值,我们必须对序列进行纯随机性检验,即白噪声检验。在IDENTIFY输出结果的最后一部分信息就是白噪声检验结果。本例中白噪声检验输出结
6、果如下: 其中:To Lag延迟阶数。检验结果显示,在6阶延迟下LB检验统计量的P值非常小(99.999%)断定该序列属于非白噪声序列。二、 课后习题2.1975-1980年夏威夷岛莫那罗亚火山(Mauna loa)每月释放的数据如下(单位:ppm),见表2-7.330.45330.97331.64332.87333.61333.55331.9330.05328.58328.31329.41330.63331.63332.46333.36334.45334.82334.32333.05330.87329.24328.87330.18331.5332.81333.23334.55335.8233
7、6.44335.99334.65332.41331.32330.73332.05333.53334.66335.07336.33337.39337.65337.57336.25334.39332.44332.25333.59334.76335.89336.44337.63338.54339.06338.95337.41335.71333.68333.69335.05336.53337.81338.16339.88340.57341.19340.87339.25337.19335.49336.63337.74338.36(1)绘制序列时序图,并判断该系列是否平稳。实验程序:data exampl
8、e2_1;input ppm;time=intnx(month,01jan1975d,_n_-1);format time date.;cards;330.45330.97331.64332.87333.61333.55331.90330.05328.58328.31329.41330.63331.63332.46333.36334.45334.82334.32333.05330.87329.24328.87330.18331.50332.81333.23334.55335.82336.44335.99334.65332.41331.32330.73332.05333.53334.66335.
9、07336.33337.39337.65337.57336.25334.39332.44332.25333.59334.76335.89336.44337.63338.54339.06338.95337.41335.71333.68333.69335.05336.53337.81338.16339.88340.57341.19340.87339.25337.19335.49336.63337.74338.36;proc gplot data=example2_1;plot ppm*time=1;symbol1 c=black v=star i=join;run;实验结果: 实验分析体会:时序图
10、给我们的提供的信息非常明确,夏威夷岛莫那罗亚火山(Mauna loa)每月释放的时间序列图有明显的递增趋势,所以它不是平稳序列。(2) 计算该序列的样本自相关系数。 实验程序:data example2_1;input ppm;time=intnx(month,01jan1975d,_n_-1);format time date.;cards;330.45330.97331.64332.87333.61333.55331.90330.05328.58328.31329.41330.63331.63332.46333.36334.45334.82334.32333.05330.87329.243
11、28.87330.18331.50332.81333.23334.55335.82336.44335.99334.65332.41331.32330.73332.05333.53334.66335.07336.33337.39337.65337.57336.25334.39332.44332.25333.59334.76335.89336.44337.63338.54339.06338.95337.41335.71333.68333.69335.05336.53337.81338.16339.88340.57341.19340.87339.25337.19335.49336.63337.743
12、38.36;proc arima data=example2_1;identify var=ppm;run;实验结果:Correlation 0.907510.721710.512520.349820.24690.203090.210210.264290.364330.484720.584560.601980.518410.368560.206710.081380.00135-0.03248(3) 绘制该样本自相关图,并解释该图形。 自相关图显示序列子相关系数长期位于零轴的一边,这是具有单调趋势序列的典型特征,同时自相关图呈现出明显的正弦波动规律,这是具有周期变化规律的非平稳序列的典型特征。自
13、相关图显示出来的这两个性质和该序列时序图显示的带长期递增趋势的周期性质是非常吻合的。3.1945-1950年费城月度降雨量数据如下(单位:mm)实验程序:data example2_3;input freq;time=intnx (month,1jan1945d,_n_-1);format time date.;cards;69.3 80.0 40.9 74.9 84.6 101.1 225.0 95.3 100.6 48.3 144.5 128.338.4 52.3 68.6 37.1 148.6 218.7 131.6 112.8 81.8 31.0 47.5 70.196.8 61.5
14、55.6 171.7 220.5 119.4 63.2 181.6 73.9 64.8 166.9 48.0137.7 80.5 105.2 89.9 174.8 124.0 86.4 136.9 31.5 35.3 112.3 143.0160.8 97.0 80.5 62.5 158.2 7.6 165.9 106.7 92.2 63.2 26.2 77.0 52.3105.4 114.3 49.5 116.1 54.1 148.6 159.3 85.3 67.3 112.8 59.4;proc arima data=example2_3;identify var=freq;run;自相关
15、图:(1) 计算该序列的样本自相关系数。从上面的自相关图可以看出样本的自相关系数为Correlation 0.06005-0.04326-0.09752-0.21647-0.13151-0.057300.03337-0.09036-0.002320.025200.169910.02973-.16785-.15233-.183190.08096 (2)判断该序列的平稳性。 如下图是该序列的时序图:根据序列图可以知道,图上可以看出该序列在一个常值附近上下波动,且不具有周期性,判断该序列为平稳序列。(3) 判断该序列的纯随机性。 本序列的检验结果如下: 由于P值显著大于显著性水平0.05,所以该序列
16、不能拒绝纯随机的原假设。因而可以认为费城月度降雨量的变动属于纯随机波动。5. 表2-9数据是某公司在2000-2003年期间每月的销售量。(1) 绘制该序列时序图及样本自相关图。实验程序:data example2_3;input number;time=intnx(month,1jan2000d,_n_-1);format time yymmdd10.;cards;1531872342123002212011751231048578134175243227298256237165124106877414520318921429522023117411985677511717814917824
17、8202162135120969063;proc gplot data=example2_3;plot number*time=1;symbol1 c=black v=star i=join;proc arima data=example2_3;identify var=number;run;时序图自相关图:(2)判断该序列的平稳性 答: 从(1)的时序图可以看出,该序列在一个常值附近上下波动,但据周期性,因此判定该序列为不平稳序列。(3) 判断该序列的纯随机性。 本例检验输出结果如下: 检验结果显示,在各阶延迟下LB检验统计量的P值非常小(99.999%)断定该序列属于非白噪声序列。因而认为该公司在2000-2003年期间每月的销售量的变动不属于随机波动。-