第九章 ARIMA模型
已知1867-1938年英国(英格兰及威尔士)绵羊的数量如表1所示,运用时间序列模型预测未来三年英国的绵羊数量。
表1 1867-1938年英国绵羊数量
(一) 序列的平稳性检验 (1)时序图
在workfile的工作区,双击“X”,打开“Series:X”窗口,选择View/Graph,type下选择Basic graph和Line & Symbol,点确定,得到图1。
图1
从图1可以看出,绵羊数量的序列X具有向下的趋势,不平稳。
(2)对序列进行一阶差分,去除趋势。在命令行输入命令:genr DX=d(X),回车,得到X差分后的序列DX。画DX的时序图,见图2:
图2
从图2可以看出,差分后的序列已经没有趋势,可以初步判断是平稳的。 (3)序列DX平稳的单位根检验
在Series:DX窗口,选择View/Unit Root Test,弹出如下窗口(见图3)。
图3
选择Test type为Augmented Dickey-Fuller,Test for unit root in 选择Level,Include in test equation处依此选择Trend and intercept、intercept、None,Lag length处按默认的选项,由Schwarz Info Criterion自动选择最佳滞后长度。
在选择Trend and intercept后,输出了表2. 表2
根据表2的结果,ADF统计量=-6.403584,相应的P值为0.0000,小于?=0.05,因此拒绝原假设(原假设为序列DX有一个单位根,也即序列DX非平稳),DX是平稳的。在表2中给出了单位根检验的辅助回归结果,其中C和@trend(1867)均不显著(相应的t统计量的p值分别为0.4014,0.4606),因此检验模型中不应包括趋势和截距项。在模型选择处(Include in test equation)重新选择None,得到下表(表3):
表
3
ADF统计量=-6.430649,相应的P值为0.0000,小于?=0.05,因此拒绝原假设,即DX是平稳的。
(4)DX的白噪声检验
在Series:DX窗口,选择View/Correlogram,在Correlogram Specification下选择Level,点“OK”确定,得到图5。
图4
图 5
从图5 的最后一列,Q统计量的伴随概率P均小于?=0.05,因此应拒绝原假设(原假设为:序列为白噪声),即DX是非白噪声的。
(二)模型的识别
根据图5,可知DX序列的自相关系数4阶截尾,偏相关系数3阶截尾,因此可选择MA(4)、AR(3)、ARMA(3,4)模型拟合。相应地,X序列可选择ARIMA(0,1,4)、ARIMA(3,1,0)和ARIMA(3,1,4)。
(三)模型的估计及检验 1、拟合ARIMA(0,1,4)模型
命令: LS D(X) C MA(1) MA(2) MA(3) MA(4) 表
4
写出拟合的方程:
(1?B)Xt??7.1019?(1?0.3715B?0.2149B2?0.4565B3?0.5967B4)?t
s.e.=67.79307,AIC=11.33862,SC=11.49796 模型的显著性检验:
(在Equation窗口,选择View/residual tests/ Correlogram-Q-Statictic:
图6

根据图6,残差序列的Q统计量的p值均大于?=0.05,因此不拒绝原假设(原假设为:序列为白噪声),即残差序列是白噪声,拟合模型显著有效。 模型参数的显著性检验: 表5
2、拟合ARIMA(3,1,0)模型
命令: LS D(X) C AR(1) AR(2) AR(3) 在剔除不显著的C后得到估计结果(表6) 表6
写出拟合的方程:
(1?B)Xt?
?t
(1?.4952B?0.2393B2?0.2555B3)
s.e.=67.85262,AIC=11.31567,SC=11.41359 模型的显著性检验:
图 7
根据图7,残差序列的Q统计量的p值均大于?=0.05,因此不拒绝原假设(原假设为:
序列为白噪声),即残差序列是白噪声,拟合模型显著有效。 模型参数的显著性检验:
3、拟合ARIMA(3,1,4)模型
命令: LS D(X) C AR(1) AR(2) AR(3) MA(1) MA(2) MA(3) MA(4) 在剔除不显著的项后得到估计结果(表8) 表 8
写出拟合的方程:
(1?0.5428B?0.4655B2?0.9965B2?0.3419B4)?t
(1?B)Xt?23
(1?0.2289B?0.6839B)
s.e.=65.21546,AIC=11.27737,SC=11.47321
模型的显著性检验:
图 8
根据图8,残差序列滞后7阶的Q统计量的p值为0.035,小于?=0.05,因此拒绝原假设(原假设为:序列为白噪声),即残差序列是非白噪声的,拟合模型不显著。
(四)模型的优化
根据AIC和SC准则,模型ARIMA(3,1,0)优于模型ARIMA(0,1,4),我们选择ARIMA(3,1,0)最为预测模型。
(五)预测
首先扩大样本范围,在命令行输入:expand 1867 1941,然后估计模型ARIMA(3,1,0),在Equation窗口,选择forecast菜单:
图 9 在Forecast sample 里输入要预测的时间,在S.E.(optional)处输入“se”,以便保存预测值的标准误差,点“OK”确定。计算95%的预测区间如下:
其中预测值来自workfile里的xf序列,标准误差来自se序列, 95%的置信下界=预测值xf-1.96*标准误差se; 95%的置信下界=预测值xf+1.96*标准误差se;
1.96为?=0.05时,标准正态分布N(0,1)的临界值。
百度搜索“爱华网”,专业资料,生活学习,尽在爱华网
爱华网



