时间序列分析模型——ARIMA模型

2024-05-04 06:01

1. 时间序列分析模型——ARIMA模型

姓名:车文扬 学号:16020199006 
    
 【嵌牛导读】:什么是 ARIMA模型 
  
 【嵌牛鼻子】: ARIMA 
  
 【嵌牛提问】: ARIMA模型可以具体应用到什么地方? 
  
 【嵌牛正文】:
  
  一、研究目的 
  
 传统的经济计量方法是以经济理论为基础来描述变量关系的模型。但经济理论通常不足以对变量之间的动态联系提供一个严密的说明,而且内生变量既可以出现在方程的左端又可以出现在方程的右端使得估计和推断变得更加复杂。为了解决这些问题而出现了一种用非结构方法来建立各个变量之间关系的模型,如向量自回归模型(vector autoregression,VAR)和向量误差修正模型(vector error correction model,VEC)。
  
 在经典的回归模型中,主要是 通过回归分析来建立不同变量之间的函数关系(因果关系),以考察事物之间的联系 。本案例要讨论如何 利用时间序列  数据本身建立模型,以研究事物发展自身的规律 ,并据此对事物未来的发展做出预测。研究时间序列数据的意义:在现实中,往往需要研究某个事物其随时间发展变化的规律。这就需要通过研究该事物过去发展的历史记录,以得到其自身发展的规律。在现实中很多问题,如利率波动、收益率变化、反映股市行情的各种指数等通常都可以表达为时间序列数据,通过研究这些数据,发现这些经济变量的变化规律(对于某些变量来说,影响其发展变化的因素太多,或者是主要影响变量的数据难以收集,以至于难以建立回归模型来发现其变化发展规律,此时,时间序列分析模型就显现其优势——因为这类模型不需要建立因果关系模型,仅需要其变量本身的数据就可以建模),这样的一种建模方式就属于时间序列分析的研究范畴。而时间序列分析中,ARIMA模型是最典型最常用的一种模型。
  
 
  
  
  二、ARIMA模型的原理 
  
  1、ARIMA的含义。 ARIMA包含3个部分,即AR、I、MA。AR——表示auto  regression,即自回归模型;I——表示integration,即单整阶数,时间序列模型必须是平稳性序列才能建立计量模型,ARIMA模型作为时间序列模型也不例外,因此首先要对时间序列进行单位根检验,如果是非平稳序列,就要通过差分来转化为平稳序列,经过几次差分转化为平稳序列,就称为几阶单整;MA——表示moving average,即移动平均模型。可见,ARIMA模型实际上是AR模型和MA模型的组合。
  
 ARIMA模型与ARMA模型的区别:ARMA模型是针对平稳时间序列建立的模型。ARIMA模型是针对非平稳时间序列建模。换句话说,非平稳时间序列要建立ARMA模型,首先需要经过差分转化为平稳时间序列,然后建立ARMA模型。
  
  2、ARIMA模型的原理。 正如前面介绍,ARIMA模型实际上是AR模型和MA模型的组合。
  
  AR模型的形式如下: 
  
 
  
  
 其中:参数为常数,是阶自回归模型的系数;为自回归模型滞后阶数;是均值为0,方差为的白噪声序列。模型记做——表示阶自回归模型。
  
  MA模型的形式如下: 
  
 
  
  
 其中:参数为常数;参数是阶移动平均模型的系数;为移动平均模型滞后阶数;是均值为0,方差为的白噪声序列。模型记做——表示阶移动平均模型。
  
  ARIMA模型的形式如下: 
  
 
  
  
 模型记做。为自回归模型滞后阶数,为时间序列单整阶数,为阶移动平均模型滞后阶数。当时,,此时ARIMA模型退化为MA模型;当时,,ARIMA模型退化为AR模型。
  
  3、建立ARIMA模型需要解决的3个问题。 由以上分析可知,建立一个ARIMA模型需要解决以下3个问题:
  
 (1)将非平稳序列转化为平稳序列。
  
 (2)确定模型的形式。即模型属于AR、MA、ARMA中的哪一种。这主要是通过 模型识别 来解决的。
  
 (3)确定变量的滞后阶数。即和的数字。这也是通过 模型识别 完成的。
  
  4、ARIMA模型的识别 
  
 ARIMA模型识别的工具为自相关系数(AC)和偏自相关系数(PAC)。
  
  自相关系数: 时间序列滞后k阶的自相关系数由下式估计:
  
 
  
  
 其中是序列的样本均值,这是相距k期值的相关系数。称为时间序列的自相关系数,自相关系数可以部分的刻画一个随机过程的形式。它表明序列的邻近数据之间存在多大程度的相关性。
  
  偏自相关系数: 偏自相关系数是在给定的条件下,之间的条件相关性。其相关程度用偏自相关系数度量。在k阶滞后下估计偏自相关系数的计算公式为:
  
 
  
  
 其中是在k阶滞后时的自相关系数估计值。称为偏相关是因为它度量了k期间距的相关而不考虑k-1期的相关。如果这种自相关的形式可由滞后小于k阶的自相关表示,那么偏相关在k期滞后下的值趋于0。
  
  识别: 
  
  AR(p)  模型 的自相关系数是随着k的增加而呈现指数衰减或者震荡式的衰减,具体的衰减形式取决于AR(p)模型滞后项的系数;AR(p)模型的偏自相关系数是p阶截尾的。因此可以通过识别AR(p)模型的偏自相关系数的个数来确定AR(p)模型的阶数p。
  
  MA(q)  模型 的自相关系数在q步以后是截尾的。MA(q)模型的偏自相关系数一定呈现出拖尾的衰减形式。
  
  ARMA(p,q)  模型 是AR(p)模型和MA(q)模型的组合模型,因此ARMA(p,q)的自相关系数是AR(p)自相关系数和MA(q)的自相关系数的混合物。当p=0时,它具有截尾性质;当q=0时,它具有拖尾性质;当p,q都不为0,它具有拖尾性质。
  
 通常,ARMA(p,q)过程的偏自相关系数可能在p阶滞后前有几项明显的 尖柱 ,但从p阶滞后项开始逐渐趋于0;而它的自相关系数则是在q阶滞后前有几项明显的 尖柱 ,从q阶滞后项开始逐渐趋于0。
  
  三、数据和变量的选择 
  
 本案例选取我国实际GDP的时间序列建立ARIMA模型,样本区间为1978—2001。数据来源于国家统计局网站上各年的统计年鉴,GDP数据均通过GDP指数换算为以1978年价格计算的值。见表1:
  
 表1:我国1978—2003年GDP(单位:亿元)
  
 年度GDP年度GDP年度GDP
  
 19783605.6198610132.8199446690.7
  
 19794074198711784.7199558510.5
  
 19804551.3198814704199668330.4
  
 19814901.4198916466199774894.2
  
 19825489.2199018319.5199879003.3
  
 19836076.3199121280.4199982673.1
  
 19847164.4199225863.7200089340.9
  
 19858792.1199334500.7200198592.9
  
 
  
  
  四、ARIMA模型的建立步骤 
  
  1、单位根检验,确定单整阶数。 
  
 由单位根检验的案例分析可知,GDP时间序列为2阶单整的。即d=2。通过2次差分,将GDP序列转化为平稳序列 。利用序列来建立ARMA模型。
  
  2、模型识别 
  
 确定模型形式和滞后阶数,通过自相关系数(AC)和偏自相关系数(PAC)来完成识别。
  
 首先将GDP数据输入Eviews软件,查看其二阶差分的AC和PAC。打开GDP序列窗口,点击View按钮,出现下来菜单,选择Correlogram(相关图),如图:
                                          
 打开相关图对话框,选择二阶差分(2nd difference),点击OK,得到序列的AC和PAC。(也可以将GDP序列先进行二阶差分,然后在相关图中选择水平(Level))
  
 
  
                                                                                  
 从图中可以看出,序列的自相关系数(AC)在1阶截尾,偏自相关系数(PAC)在2阶截尾。因此判断模型为ARMA模型,且,。即:
  
 
  
  
  3、建模 
  
 由以上分析可知,建立模型。首先将GDP序列进行二次差分,得到序列。然后在Workfile工作文件簿中新建一个方程对话框,采用 列表法 的方法对方程进行定义。自回归滞后项用ar表示,移动平均项用ma表示。本例中自回归项有两项,因此用ar(1)、ar(2)表示,移动平均项有一项,用ma(1)表示,如图:
                                          
 
  
  
 
  
  
 点击确定,得到模型估计结果:
                                          
 
  
  
 
  
  
 从拟合优度看,,模型拟合效果较好,DW统计量为2.43,各变量t统计量也通过显著性检验,模型较为理想。对残差进行检验,也是平稳的,因此判断模型建立正确。

时间序列分析模型——ARIMA模型

2. 数据分析技术:时间序列分析的AR/MA/ARMA/ARIMA模型体系

前面草堂君已经按照时间序列分析的教学顺序推送了以下文章,大家可以直接点击下方文章名称阅读回顾:
  
 在以上这些文章中,介绍了什么是时间序列以及时间序列分析的作用、时间序列的描述、时间序列的变动成分组成、如何用指数平滑模型分析带有长期趋势和季节变动两种变动成分的时间序列。可惜的是,事实总比想象来得复杂,很多时间序列的变动成分组成并不能直接通过时间序列图看出来,这个时候,通过时间序列分解的方法分析时间序列就不太合适了,而且准确性也会大打折扣。
  
 因为传统时间序列分析技术(时间序列分解法)的缺陷,所以统计学家开发出更为通用的时间序列分析方法,其中AR/MA/ARMA/ARIMA在这个发展过程中扮演了非常重要的角色,直到现在,它们都在实际工作生活中发挥重要作用。这四种分析方法的共同特点都是跳出变动成分的分析角度,从时间序列本身出发,力求得出前期数据与后期数据的量化关系,从而建立前期数据为自变量,后期数据为因变量的模型,达到预测的目的。来个通俗的比喻,大前天的你、前天的你、昨天的你造就了今天的你。
  
 虽然AR/MA/ARMA/ARIMA是四种可以独立使用的分析方法,但是它们其实是互补的关系,适用于包含不同变动成分的时间序列。由于这四种分析方法涉及的原理解释起来需要大量篇幅,所以草堂君在这里做通俗介绍。
  
   
  
 通俗介绍四种时间序列分析法之前,需要先回顾前面介绍的一个知识点,平稳时间序列和非平稳时间序列,AR/MA/ARMA用于分析平稳时间序列,ARIMA通过差分可以用于处理非平稳时间序列。平稳时间序列和非平稳时间序列如下面两幅图所示:
                                          
 一般具有长期趋势的时间序列都是非平稳时间序列。根据趋势的不同,可以使用差分将具有长期趋势的时间序列转换成平稳时间序列。例如,线性增长的长期趋势,可以通过一阶差分形成新的平稳的(消除长期趋势)时间序列:
                                          
 例如,时间序列的数值为线性增长的(1,2,3,4,5,6,7,8),经过一阶差分以后,新的时间序列的数值为(1,1,1,1,1,1,1),就成为稳定的时间序列了。
  
 根据长期趋势的发展趋势不同,可以进行差分的次数和方法也不相同,一般的规律如下:
  
   
  
 这四种模型的名称都是它们英文全称的缩写。AR模型称为自回归模型(Auto Regressive model);MA模型称为移动平均模型(Moving Average model);ARMA称为自回归移动平均模型(Auto Regressive and Moving Average model);ARIMA模型称为差分自回归移动平均模型。
  
   
  
 如果某个时间序列的任意数值可以表示成下面的回归方程,那么该时间序列服从p阶的自回归过程,可以表示为AR(p):
                                          
 可以发现,AR模型利用前期数值与后期数值的相关关系(自相关),建立包含前期数值和后期数值的回归方程,达到预测的目的,因此成为自回归过程。这里需要解释白噪声,大家可以将白噪声理解成时间序列数值的随机波动,这些随机波动的总和会等于0,例如前面统计基础文章中介绍的,某条饼干的自动化生产线,要求每包饼干为500克,但是生产出来的饼干产品由于随机因素的影响,不可能精确的等于500克,而是会在500克上下波动,这些波动的总和将会等于互相抵消等于0。
  
   
  
 如果某个时间序列的任意数值可以表示成下面的回归方程,那么该时间序列服从q阶的移动平均过程,可以表示为MA(q):
                                          
 可以发现,某个时间点的指标数值等于白噪声序列的加权和,如果回归方程中,白噪声只有两项,那么该移动平均过程为2阶移动平均过程MA(2)。比较自回归过程和移动平均过程可知,移动平均过程其实可以作为自回归过程的补充,解决自回归方差中白噪声的求解问题,两者的组合就成为自回归移动平均过程,称为ARMA模型。
  
   
  
 自回归移动平均模型由两部分组成:自回归部分和移动平均部分,因此包含两个阶数,可以表示为ARMA(p,q),p是自回归阶数,q为移动平均阶数,回归方程表示为:
                                          
 从回归方程可知,自回归移动平均模型综合了AR和MA两个模型的优势,在ARMA模型中,自回归过程负责量化当前数据与前期数据之间的关系,移动平均过程负责解决随机变动项的求解问题,因此,该模型更为有效和常用。
  
   
  
 介绍时间序列平稳性时提到过,AR/MA/ARMA模型适用于平稳时间序列的分析,当时间序列存在上升或下降趋势时,这些模型的分析效果就大打折扣了,这时差分自回归移动平均模型也就应运而生。ARIMA模型能够用于齐次非平稳时间序列的分析,这里的齐次指的是原本不平稳的时间序列经过d次差分后成为平稳时间序列。
  
 在现实生活中,存在很多非平稳的时间序列,它们的均值和方差是随着时间的变化而变化的,幸运的是,统计学家们发现,很多时间序列本身虽然不平稳,但是经过差分(相邻时间点的指标数值相减)之后,形成的新时间序列就变成平稳时间序列了。因此,差分自回归移动平均模型写成ARIMA(p,d,q)。p代表自回归阶数;d代表差分次数;q代表移动平均阶数。在spss软件中,有时输出的ARIMA模型包括6个参数:ARIMA(p,d,q)(P,D,Q),这是因为如果时间序列中包含季节变动成分的话,需要首先将季节变动分解出来,然后再分别分析移除季节变动后的时间序列和季节变动本身。这里小写的p,d,q描述的是移除季节变动成分后的时间序列;大写的P,D,Q描述的是季节变动成分。两个部分是相乘的关系。因此,ARIMA(p,d,q)(P,D,Q)也被称为复合季节模型。
  
   
  
 时间序列分析的文章更新到这里,总共介绍了两个时间序列分析的体系:时间序列分解模型体系和AR/MA/ARMA/ARIMA模型体系。两者的分析原理是不同的,时间序列分解是力求将时间序列分解成不同的变动成分,分析每种变动成分的规律,然后在综合各种成分的规律用于预测;AR/MA/ARMA/ARIMA模型体系是从时间序列数值本身的相关关系出发,将移动平均技术、相关分析技术和平稳技术(差分)等纳入模型,力求建立时间序列数值之间的回归方程,从而达到预测的目的。
  
 下篇推送将重点介绍ARIMA模型的分析原理:包括如何确定p,d,q参数;如何判断模型的拟合效果;如何利用SPSS做时间序列的ARIMA模型分析。

3. ARIMA模型做时间序列分析怎么判断序列图是否具有季节性?

输入代码自动判断:
View\Residual
Test\Correlogram-Q-statistics
输出et与et-1,et-2…et-p(p是事先指定的滞后期长度)的相关系数和偏相关系数。
异方差的检验:最简单的检验方法是White检验。



扩展资料:
ARIMA模型做时间序列类型:
长期趋势(T)。即时间序列在一个长时期内受基本因素的影响而增大或减小的趋势。
周期波动(C),也叫循环变动。即时间序列受经济等原因影响呈现出的波浪形和震荡式发展。
季节变动(S)。即时间序列在一年内某个时期重复出现的波动。
不规则变动(I)。即时间序列由于突发或偶然事件引起的变动。

ARIMA模型做时间序列分析怎么判断序列图是否具有季节性?

4. 求教时间序列AR模型做预测 MATLAB

如何用MATLAB对时间序列AR模型做预测?
第一步,使用load命令加载数据
第二步,使用ar函数,确定时间序列AR模型
第三步,确定预测时间范围指定为K个样本。K=100。
第四步,使用forecast函数,绘制给定时间范围内的预测系统响应。
实现代码,(供参考)
clc
%Forecast Response of Time Series Model
%时间序列模型的预测响应
load iddata9 z9
past_data = z9.OutputData(1:50);
model = ar(z9,4);
K = 100;
forecast(model,'r--',past_data,K);
运行结果


5. ARIMA模型做时间序列分析怎么判断序列图是否具有季节性?

输入代码自动判断:
View\Residual
Test\Correlogram-Q-statistics
输出et与et-1,et-2…et-p(p是事先指定的滞后期长度)的相关系数和偏相关系数。
异方差的检验:最简单的检验方法是White检验。



扩展资料:
ARIMA模型做时间序列类型:
长期趋势(T)。即时间序列在一个长时期内受基本因素的影响而增大或减小的趋势。
周期波动(C),也叫循环变动。即时间序列受经济等原因影响呈现出的波浪形和震荡式发展。
季节变动(S)。即时间序列在一年内某个时期重复出现的波动。
不规则变动(I)。即时间序列由于突发或偶然事件引起的变动。

ARIMA模型做时间序列分析怎么判断序列图是否具有季节性?

6. 主成分回归模型可以预测与时间序列的ARIMA预测模型也是用来预测的,他们有什么区别么??

主成份分析是为了提前众多指标中有典型代表性的几个主要成分,其中主成分的一种计算得分方法是用回归方法

ARIMA模型的基本思想是:将预测对象随时间推移而形成的数据序列视为一个随机序列,用一定的数学模型来近似描述这个序列。这个模型一旦被识别后就可以从时间序列的过去值及现在值来预测未来值。现代统计方法、计量经济模型在某种程度上已经能够帮助企业对未来进行预测。

ARIMA模型建立在历史数据的基础上,故搜集的历史数据越多,模型越准确。

每月储蓄数据.可以看作是随着时间的推移而形成的一个随机时间序列,通过对该时间序列上储蓄值的随机性、平稳性以及季节性等因素的分析,将这些单月储蓄值之间所具有的相关性或依存关系用数学模型描述出来,从而达到利用过去及现在的储蓄值信息来预测未来储蓄情况的目的。

7. 时间序列模型参数估计可用什么估计

时间序列分析(Time series analysis)是一种动态数据处理的统计方法。该方法基于随机过程理论和数理统计学方法,研究随机数据序列所遵从的统计规律,以用于解决实际问题。

时间序列是按时间顺序的一组数字序列。时间序列分析就是利用这组数列,应用数理统计方法加以处理,以预测未来事物的发展。时间序列分析是定量预测方法之一,它的基本原理:一是承认事物发展的延续性。应用过去数据,就能推测事物的发展趋势。二是考虑到事物发展的随机性。任何事物发展都可能受偶然因素影响,为此要利用统计分析中加权平均法对历史数据进行处理。该方法简单易行,便于掌握,但准确性差,一般只适用于短期预测。时间序列预测一般反映三种实际变化规律:趋势变化、周期性变化、随机性变化。
时间序列分析是根据系统观测得到的时间序列数据,通过曲线拟合和参数估计来建立数学模型的理论和方法。它一般采用曲线拟合和参数估计方法(如非线性最小二乘法)进行。时间序列分析常用在国民经济宏观控制、区域综合发展规划、企业经营管理、市场潜量预测、气象预报、水文预报、地震前兆预报、农作物病虫灾害预报、环境污染控制、生态平衡、天文学和海洋学等方面。

一个时间序列通常由4种要素组成:趋势、季节变动、循环波动和不规则波动。
趋势:是时间序列在长时期内呈现出来的持续向上或持续向下的变动。
季节变动:是时间序列在一年内重复出现的周期性波动。它是诸如气候条件、生产条件、节假日或人们的风俗习惯等各种因素影响的结果。
循环波动:是时间序列呈现出得非固定长度的周期性变动。循环波动的周期可能会持续一段时间,但与趋势不同,它不是朝着单一方向的持续变动,而是涨落相同的交替波动。
不规则波动:是时间序列中除去趋势、季节变动和周期波动之后的随机波动。不规则波动通常总是夹杂在时间序列中,致使时间序列产生一种波浪形或震荡式的变动。只含有随机波动的序列也称为平稳序列。

时间序列建模基本步骤是:
①用观测、调查、统计、抽样等方法取得被观测系统时间序列动态数据。
②根据动态数据作相关图,进行相关分析,求自相关函数。相关图能显示出变化的趋势和周期,并能发现跳点和拐点。跳点是指与其他数据不一致的观测值。如果跳点是正确的观测值,在建模时应考虑进去,如果是反常现象,则应把跳点调整到期望值。拐点则是指时间序列从上升趋势突然变为下降趋势的点。如果存在拐点,则在建模时必须用不同的模型去分段拟合该时间序列,例如采用门限回归模型。
③辨识合适的随机模型,进行曲线拟合,即用通用随机模型去拟合时间序列的观测数据。对于短的或简单的时间序列,可用趋势模型和季节模型加上误差来进行拟合。对于平稳时间序列,可用通用ARMA模型(自回归滑动平均模型)及其特殊情况的自回归模型、滑动平均模型或组合-ARMA模型等来进行拟合。当观测值多于50个时一般都采用ARMA模型。对于非平稳时间序列则要先将观测到的时间序列进行差分运算,化为平稳时间序列,再用适当模型去拟合这个差分序列。

用随机过程理论和数理统计学方法,研究随机数据序列所遵从的统计规律,以用于解决实际问题。由于在多数问题中,随机数据是依时间先后排成序列的,故称为时间序列。它包括一般统计分析(如自相关分析、谱分析等),统计模型的建立与推断,以及关于随机序列的最优预测、控制和滤波等内容。经典的统计分析都假定数据序列具有独立性,而时间序列分析则着重研究数据序列的相互依赖关系。后者实际上是对离散指标的随机过程的统计分析,所以又可看作是随机过程统计的一个组成部分。例如,用x(t)表示某地区第t个月的降雨量,{x(t),t=1,2,…}是一时间序列。对t=1,2,…,T,记录到逐月的降雨量数据x(1),x(2),…,x(T),称为长度为T的样本序列。依此即可使用时间序列分析方法,对未来各月的雨量x(T+l)(l=1,2,…)进行预报。时间序列分析在第二次世界大战前就已应用于经济预测。二次大战中和战后,在军事科学、空间科学和工业自动化等部门的应用更加广泛。
就数学方法而言,平稳随机序列(见平稳过程)的统计分析,在理论上的发展比较成熟,从而构成时间序列分析的基础。

时间序列模型参数估计可用什么估计

8. ARIMA模型的预测程序

ARIMA模型预测的基本程序(一)根据时间序列的散点图、自相关函数和偏自相关函数图以ADF单位根检验其方差、趋势及其季节性变化规律,对序列的平稳性进行识别。一般来讲,经济运行的时间序列都不是平稳序列。(二)对非平稳序列进行平稳化处理。如果数据序列是非平稳的,并存在一定的增长或下降趋势,则需要对数据进行差分处理,如果数据存在异方差,则需对数据进行技术处理,直到处理后的数据的自相关函数值和偏相关函数值无显著地异于零。(三)根据时间序列模型的识别规则,建立相应的模型。若平稳序列的偏相关函数是截尾的,而自相关函数是拖尾的,可断定序列适合AR模型;若平稳序列的偏相关函数是拖尾的,而自相关函数是截尾的,则可断定序列适合MA模型;若平稳序列的偏相关函数和自相关函数均是拖尾的,则序列适合ARMA模型。(四)进行参数估计,检验是否具有统计意义。(五)进行假设检验,诊断残差序列是否为白噪声。(六)利用已通过检验的模型进行预测分析。

最新文章
热门文章
推荐阅读