最近在学习ARIMA模型,在这里记录一下自己的学习笔记,以便后续复习巩固。
在t期的值,受其前p期历史值的影响。例如,在销售预测中,2022年业绩,可能会受到2021年和2020年业绩的影响。也就是给定2021年和2020年业绩,就可以预测2022年业绩,此时p=2。
3.1.1 平稳序列的性质
序列的均值(平均值)为一个固定的常数 μ
序列滞后 l 阶的协方差为 ,该协方差只与滞后阶数 l 有关,而与t无关。换而言之,不同滞后阶数有不同的协方差;
序列的方差为一个固定的常数
3.1.2 平稳序列的判断方法
画出时间序列的折线图,如果折线图围绕某一个水平直线上下波动,既没有上升的趋势也没有下降的趋势,那么就可以判断该序列为弱平稳的时间序列(如下图);
(2)ADF单位根检验法
运用python进行ADF检验,当P值小于0.01或0.05时,就可以认为序列是弱平稳的。
3.2.1 白噪声序列的特点
在任何两个时点的随机变量都不相关,序列中没有任何可以利用的动态规律,因此不能用历史数据对未来进行预测和推断。
3.2.2 白噪声序列的判断方法
采用LB统计量的方法进行白噪声检验,当P值小于0.01或0.05时,既可认为序列是非白噪音序列。
通过软件画出数据的偏自相关图表,如偏自相关出现p阶截尾,则可以判断AR模型的滞后阶数为p。
如下图,左边为自相关图表,右边为偏自相关图表。从右边的图表来看,在4阶之后,下降幅度较大,初步判断p值为4。
先对数据进行1阶回归,再进行2阶回归,最后进行p阶回归,每回归一次便会产生一个AIC值,选取AIC值最小的那个模型。
直接使用Python中的ARMA模型库,进行模型拟合。需要观察每一个滞后阶数的统计量的P值是否通过。如下图的拟合结果,滞后5阶和6阶,在0.05的水平下,都是不通过的,因此模型的最优滞后阶数为4阶。
统计检验的P值越小,说明参数估计越可靠,一般小于0.01或0.05就认为是可靠估计。
残差就是真实值减去模型拟合值。如果模型拟合较好,那残差就会是一个白噪音序列,即所有的可预测的因素都已在模型中体现。
残差检验的方法和3.2.2 白噪声序列的判断方法是相同的。
残差的平方和:表示的是不能用模型解释的波动;
样本的平方和:表示的是样本的总体波动;
除去模型未解释的部分,那剩下的就是模型可以解释的部分,即
文章转载自宏蜘蛛,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。