时间序列的平稳性

2024-05-10 17:46

1. 时间序列的平稳性

 并不是所有的时间序列都是可预测的,想象一下,假如一个时间序列的变化特性是不稳定的,那么它每个时期的波动对于之后一个时期的变化的影响都是无法预测的,因为它随时可能变脸。而当一个时间序列的变化特征维持稳定,数据的历史分布和未来分布就会趋于一致,这时我们就可以根据历史数据对未来作出预测。用来刻画数据变化特征稳定的量就是时间序列的平稳性。
                                           
   
                                           如果图像没有明显的趋势,围绕着一个水平线稳定波动,序列传播没有明显的疏密变化,则可以判定为稳定序列。当然这种方法过于主观,还是需要更为严密的统计学检验。
   观察图像的方式很直观,但也很主观,不适用于机器自动判断序列的稳定性。因此我们需要一个更有说服力、更加客观的统计方法来帮助我们检验时间序列的平稳性,这种方法,就是单位根检验。
   当一个时间序列的滞后算子多项式方程 存在单位根时 ,我们认为该时间序列是 非平稳 的;反之,当该方程 不存在单位根 时,我们认为该时间序列是 平稳 的。其原理比较复杂,想要理解它需要较好的数学基础,这里我们只关注在Python中如何使用。
   常见的单位根检验方法有 DF检验 、 ADF检验 和 PP检验 ,这里演示如何使用最常用的ADF检验。   (1)Python中的statsmodels库提供ADF检验函数,使用时需要引入    from statsmodels.tsa.stattools import adfuller as ADF 
   (2)具体函数如下:    statsmodels.tsa.stattools.adfuller(x, maxlag=None, regression='c', autolag='AIC', store=False, regresults=False) 
   (3)返回值解析:   (-5.2350403606036302, 7.4536580061930903e-06, 0, 60, {'1%': -3.5443688564814813, '5%': -2.9110731481481484, '10%': -2.5931902777777776}, 1935.4779504450603)

时间序列的平稳性

2. 时间序列的平稳性检验的目的是什么?

一阶差分平稳说明可以用一阶差分序列进行分析,采用ARMA模型。
为了确定没有随机趋势或确定趋势,否则将会产生“伪回归”问题。伪回归是说,有时数据的高度相关仅仅是因为二者同时随时间有向上或向下的变动趋势,并没有真正联系。这样数据中的趋势项,季节项等无法消除,从而在残差分析中无法准确进行分析。

时间序列
时间序列(或称动态数列)是指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列。时间序列分析的主要目的是根据已有的历史数据对未来进行预测。
构成要素:长期趋势,季节变动,循环变动,不规则变动。
长期趋势(T)现象在较长时期内受某种根本性因素作用而形成的总的变动趋势。
季节变动(S)现象在一年内随着季节的变化而发生的有规律的周期性变动。

3. 什么是平稳的时间序列

问题一:如何深入理解时间序列分析中的平稳性  声明:本文中所有引用部分,如非特别说明,皆引自Time Series Analysis with Applications in R. 
  接触时间序列分析才半年,尽力回答。如果回答有误,欢迎指出。 
  对第一个问题,我们把它拆分成以下两个问题: 
  Why stationary?(为何要平稳?) 
  Why weak stationary?(为何弱平稳?) 
  Why stationary?(为何要平稳?) 
  每一个统计学问题,我们都需要对其先做一些基本假设。如在一元线性回归中(),我们要假设:①不相关且非随机(是固定值或当做已知)②独立同分布服从正态分布(均值为0,方差恒定)。 
  在时间序列分析中,我们考虑了很多合理且可以简化问题的假设。而其中最重要的假设就是平稳。 
  The basic idea of stationarity is that the probability laws that govern the behavior of the process do not change over time. 
  平稳的基本思想是:时间序列的行为并不随时间改变。 
  正因此,我们定义了两种平稳: 
  Strict stationarity: A time series {} is said to be strictly stationary if the joint distribution of ,, ・ ・ ・, is the same as that of,, ・ ・ ・ ,for all choices of natural number n, all choices of time points ,, ・ ・ ・ , and all choices of time lag k. 
  强平稳过程:对于所有可能的n,所有可能的,, ・ ・ ・ , 和所有可能的k,当,, ・ ・ ・,的联合分布与,, ・ ・ ・ ,相同时,我们称其强平稳。 
  Weak stationarity: A time series {} is said to be weakly (second-order, or co-variance) stationary if: 
  ① the mean function is constant over time, and 
  ② γ(t, t ? k) = γ(0, k) for all times t and lags k. 
  弱平稳过程:当①均值函数是常数函数且②协方差函数仅与时间差相关,我们才称其为弱平稳。 
  此时我们转到第二个问题:Why weak stationary?(为何弱平稳?) 
  我们先来说说两种平稳的差别: 
  两种平稳过程并没有包含关系,即弱平稳不一定是强平稳,强平稳也不一定是弱平稳。 
  一方面,虽然看上去强平稳的要求好像比弱平稳强,但强平稳并不一定是弱平稳,因为其矩不一定存在。 
  例子:{}独立服从柯西分布。{}是强平稳,但由于柯西分布期望与方差不存在,所以不是弱平稳。(之所以不存在是因为其并非绝对可积。) 
  另一方面,弱平稳也不一定是强平稳,因为二阶矩性质并不能确定分布的性质。 
  例子:,,互相独立。这是弱平稳却不是强平稳。 
  知道了这些造成差别的根本原因后,我们也可以写出两者的一些联系: 
  一阶矩和二阶矩存在时,强平稳过程是弱平稳过程。(条件可简化为二阶矩存在,因为) 
  当联合分布服从多元正态分布时,两平稳过程等价。(多元正态分布的二阶矩可确定分布性质) 
  而为什么用弱平稳而非强平稳,主要原因是:强平稳条件太强......>> 
  
   问题二:什么是平稳时间序列,能举个生活中的平稳时间序列的例  “平稳时间序列”是天文学专有名词。来自 中国天文学名词审定委员会审定发布的天 文学专有名词中文译名,词条译名和中英 文解释数据版权由天文学名词委所有。 
  中文译名平稳时间序列 
  英文原名/注释stationarytime series :小波消噪与时间序列分析方 法在预测领域中应用十分广泛,但是在降 雨量的预测中应用不多。在基于小波消 噪的基础上应用时间序列中平稳时间学 列方法对降雨量进行预测,结果显示,应用 该方法有效地提高了降雨量的预测精 度。用丹东地区1971-2006年的降雨量作 为历史数据,建立降雨量预测模型,结果表 明新模型算法简单、精度较高,比传统的 拓扑预测模型效果更好,为降雨量预测提 供了一种行之有效的方法 
  
   问题三:平稳时间序列和非平稳时间序列的区别  要对非平稳时间序列 进行平稳化处理 有利于资源的合理利用 
  
   问题四:检验时间序列平稳性的方法有哪两种  1、 时间序列 取自某一个随机过程,如果此随机过程的随机特征不随时间变化,则我们称过程是平稳的;假如该随机过程的随机特征随时间变化,则称过程是非平稳的。 2、 宽平稳时间序列的定义:设时间序列 ,对于任意的 , 和 ,满足: 则称 宽平稳。 3、Box-Jenkins方法是一种理论较为完善的统计预测方法。他们的工作为实际工作者提供了对时间序列进行分析、预测,以及对ARMA模型识别、估计和诊断的系统方法。使ARMA模型的建立有了一套完整、正规、结构化的建模方法,并且具有统计上的完善性和牢固的理论基础。 4、ARMA模型三种基本形式:自回归模型(AR:Auto-regressive),移动平均模型(MA:Moving-Average)和混合模型(ARMA:Auto-regressive Moving-Average)。 (1) 自回归模型AR(p):如果时间序列 满足 其中 是独立同分布的随机变量序列,且满足: , 则称时间序列 服从p阶自回归模型。或者记为 。 平稳条件:滞后算子多项式 的根均在单位圆外,即 的根大于1。 (2) 移动平均模型MA(q):如果时间序列 满足 则称时间序列 服从q阶移动平均模型。或者记为 。 平稳条件:任何条件下都平稳。 (3) ARMA(p,q)模型:如果时间序列 满足 则称时间序列 服从(p,q)阶自回归移动平均模型。或者记为 。 特殊情况:q=0,模型即为AR(p),p=0, 模型即为MA(q)。 二、时间序列的自相关分析 1、自相关分析法是进行时间序列分析的有效方法,它简单易行、较为直观,根据绘制的自相关分析图和偏自相关分析图,我们可以初步地识别平稳序列的模型类型和模型阶数。利用自相关分析法可以测定时间序列的随机性和平稳性,以及时间序列的季节性。 2、自相关函数的定义:滞后期为k的自协方差函数为: ,则 的自相关函数为: ,其中 。当序列平稳时,自相关函数可写为: 。 3、 样本自相关函数为: ,其中 ,它可以说明不同时期的数据之间的相关程度,其取值范围在-1到1之间,值越接近于1,说明时间序列的自相关程度越高。 4、 样本的偏自相关函数: 其中, 。 5、 时间序列的随机性,是指时间序列各项之间没有相关关系的特征。使用自相关分析图判断时间序列的随机性,一般给出如下准则: ①若时间序列的自相关函数基本上都落入置信区间,则该时间序列具有随机性; ②若较多自相关函数落在置信区间之外,则认为该时间序列不具有随机性。 6、 判断时间序列是否平稳,是一项很重要的工作。运用自相关分析图判定时间序列平稳性的准则是:①若时间序列的自相关函数 在k>3时都落入置信区间,且逐渐趋于零,则该时间序列具有平稳性;②若时间序列的自相关函数更多地落在置信区间外面,则该时间序列就不具有平稳性。 7、 ARMA模型的自相关分析 AR(p)模型的偏自相关函数 是以p步截尾的,自相关函数拖尾。MA(q)模型的自相关函数具有q步截尾性,偏自相关函数拖尾。这两个性质可以分别用来识别自回归模型和移动平均模型的阶数。ARMA(p,q)模型的自相关函数和偏相关函数都是拖尾的。 三、单位根检验和协整检验 1、单位根检验 ①利用迪基―福勒检验( Dickey-Fuller Test)和菲利普斯―佩荣检验(Philips-Perron Test),我们也可以测定时间序列的随机性,这是在计量经济学中非常重要的两种单位根检验方法,与前者不同的事,后一个检验方法主要应用于一阶自回归模......>> 
  
   问题五:如果时间序列平稳,那该做什么检验  我们计算自相关系数,如果有18组数据,则有17个自相关系数的数据,如果时间序列是平稳的,那么服从一个正态分布。所以我们根据每一个自相关系数的值,对应置位区间即可。 
  也可检验对所有k>0,自相关系数都为0的联合假设,这可通过如下QLB统计量进行 
  该统计量近似地服从自由度为m的c2分布(m为滞后长度)。因此:如果计算的Q值大于显著性水平为a的临界值,则有1-a的把握拒绝所有rk(k>0)同时为0的假设。 
  注意利用QLB统计量,原假设是平稳的,根据最大的滞后项来判断即可。

什么是平稳的时间序列

4. 时间序列-平稳性

 1、平稳性:   1)平稳性就是要求经由样本时间序列所得到的拟合曲线在未来的一段时间内仍能顺着现有的形态“惯性”地延续下去。   2)平稳性要求序列的 均值和方差 不发生 明显 变化。   2、严平稳与弱平稳:   1)严平稳:严平稳表示的分布不随时间的改变而改变。如:白噪声(正态),无论怎么取都是期望为0,方差为1.   2)弱平稳:期望与相关系数(依赖性)不变   未来某时刻的t值Xt就要依赖于它的过去信息,所以需要依赖性。   2、差分法   1)时间序列在t与t-1时刻的差值   
                                           

5. 如果时间序列平稳,那该做什么检验

我们计算自相关系数,如果有18组数据,则有17个自相关系数的数据,如果时间序列是平稳的,那么服从一个正态分布。所以我们根据每一个自相关系数的值,对应置位区间即可。
也可检验对所有k>0,自相关系数都为0的联合假设,这可通过如下QLB统计量进行
该统计量近似地服从自由度为m的c2分布(m为滞后长度)。因此:如果计算的Q值大于显著性水平为a的临界值,则有1-a的把握拒绝所有rk(k>0)同时为0的假设。
注意利用QLB统计量,原假设是平稳的,根据最大的滞后项来判断即可。

如果时间序列平稳,那该做什么检验

6. 如何深入理解时间序列分析中的平稳性

声明:本文中所有引用部分,如非特别说明,皆引自Time Series Analysis with Applications in R.

接触时间序列分析才半年,尽力回答。如果回答有误,欢迎指出。

对第一个问题,我们把它拆分成以下两个问题:

Why stationary?(为何要平稳?)
Why weak stationary?(为何弱平稳?)

Why stationary?(为何要平稳?)
每一个统计学问题,我们都需要对其先做一些基本假设。如在一元线性回归中(),我们要假设:①不相关且非随机(是固定值或当做已知)②独立同分布服从正态分布(均值为0,方差恒定)。

在时间序列分析中,我们考虑了很多合理且可以简化问题的假设。而其中最重要的假设就是平稳。
The basic idea of stationarity is that the probability laws that govern the behavior of the process do not change over time.
平稳的基本思想是:时间序列的行为并不随时间改变。
正因此,我们定义了两种平稳:
Strict stationarity: A time series {} is said to be strictly stationary if the joint distribution of ,, · · ·, is the same as that of,, · · · ,for all choices of natural number n, all choices of time points ,, · · · ,  and all choices of time lag k.
强平稳过程:对于所有可能的n,所有可能的,, · · · , 和所有可能的k,当,, · · ·,的联合分布与,, · · · ,相同时,我们称其强平稳。
Weak stationarity: A time series {} is said to be weakly (second-order, or co-variance) stationary if:
① the mean function  is constant over time, and
② γ(t, t − k) = γ(0, k) for all times t and lags k.
弱平稳过程:当①均值函数是常数函数且②协方差函数仅与时间差相关,我们才称其为弱平稳。
此时我们转到第二个问题:Why weak stationary?(为何弱平稳?)
我们先来说说两种平稳的差别:

两种平稳过程并没有包含关系,即弱平稳不一定是强平稳,强平稳也不一定是弱平稳。
一方面,虽然看上去强平稳的要求好像比弱平稳强,但强平稳并不一定是弱平稳,因为其矩不一定存在。
例子:{}独立服从柯西分布。{}是强平稳,但由于柯西分布期望与方差不存在,所以不是弱平稳。(之所以不存在是因为其并非绝对可积。)
另一方面,弱平稳也不一定是强平稳,因为二阶矩性质并不能确定分布的性质。
例子:,,互相独立。这是弱平稳却不是强平稳。

知道了这些造成差别的根本原因后,我们也可以写出两者的一些联系:

一阶矩和二阶矩存在时,强平稳过程是弱平稳过程。(条件可简化为二阶矩存在,因为)
当联合分布服从多元正态分布时,两平稳过程等价。(多元正态分布的二阶矩可确定分布性质)

而为什么用弱平稳而非强平稳,主要原因是:强平稳条件太强,无论是从理论上还是实际上。
理论上,证明一个时间序列是强平稳的一般很难。正如定义所说,我们要比较,对于所有可能的n,所有可能的,, · · · , 和所有可能的k,当,, · · ·,的联合分布与,, · · · ,相同。当分布很复杂的时候,不仅很难比较所有可能性,也可能很难写出其联合分布函数。
实际上,对于数据,我们也只能估算出它们均值和二阶矩,我们没法知道它们的分布。所以我们在以后的模型构建和预测上都是在用ACF,这些性质都和弱项和性质有关。而且,教我时间序列教授说过:"General linear process(weak stationarity, linearity, causality) covers about 10% of the real data." ,如果考虑的是强平稳,我觉得可能连5%都没有了。

对第二个问题:
教授有天在审本科毕业论文,看到一个写金融的,用平稳时间序列去估计股票走势(真不知这老兄怎么想的)。当时教授就说:“金融领域很多东西之所以难以估计,就是因为其经常突变,根本就不是平稳的。”
果不其然,论文最后实践阶段,对于股票选择的正确率在40%。连期望50%都不到(任意一点以后要么涨要么跌)。

暑假里自己用了一些时间序列的方法企图开发程序性交易程序。
刚开始收益率还好,越往后就越...后面直接亏损了...(软件是金字塔,第二列是利润率)

亏损的图当时没截,现在也没法补了,程序都删了。
所以应该和平稳没关系吧,毕竟我的做法也没假设是平稳的。如果平稳我就不会之后不盈利了。
(吐槽)自己果然不适合做股票、期货什么的...太高端理解不能...

以上

7. 如何深入理解时间序列分析中的平稳性

平稳不只是对很多实际过程的「简化」,还是我们的「追求」,是一条时间序列里面长期稳定不变的某些规律,是基本模型。

当面对不平稳的过程的时候,我们首先会想着去把这样的过程变换成平稳的,找出里面相对更不随时间变化的、更「平稳」的那些东西来,更平稳的序列有更低的 Order of integration 。当然,找出这些不变的(或者相对更平稳的)东西来之后,并不代表就一定可以获得真正意义上的预测能力。

举两个例子:

股票绝对价格的涨跌显然不能满足正态分布,Bachelier (1900) 当时就犯了这样的错误。当序列被 Osborne 处理过之后:,开始关注相对变化,这个序列才变得更「平稳」了。

反复做差分变换 ,直到时间序列变得「平稳」为止,做的差分变换的次数即为 Order of integration 。一条时间序列整体随时间变化的趋势消除,因而可以关注一些在整体变化之外的那些涨落,序列也因此变得相对更「平稳」。关于差分变换直至「平稳」的一个好例子就是「抑制了房价」「抑制了房价的增长」「抑制了房价增长的势头」「抑制了房价过快增长的势头」——经过多次差分变换,直到最终「抑制……增长」,得到了一条平稳的时间序列。

关于强平稳和弱平稳的差别:

强平稳是事实上的平稳(同分布);

弱平稳是统计量在观测意义上的平稳(均值、方差)。


第二个问题,均衡跟稳定没有关系。

国家规定了某个商品的价格,这情况完全不均衡,但是巨稳定。
一般均衡达到稳定,跟时间序列的稳定性还是两码事,例如矩可能不存在;又例如我选择的时间序列的时间间隔尺度远小于市场发生响应达到稳定的均衡的时间尺度,得到的序列还是可能是不稳定的。

如何深入理解时间序列分析中的平稳性

8. 如何深入理解时间序列分析中的平稳性

通过对时间序列分析的整体感觉整体关照,自然可以做出这样的理论表述。
从时间序列分析自身的内涵可以这样认为,时间序列分析具有平稳性。
时间序列分析的一种平稳随机序列作为其基础,由此可以认为平稳性是时间序列分析重要特点。
从时间序列分析的原理承认事物发展的延续性同时考虑事物发展的随机性,是在两者之间取得平衡以实现其平稳性。
最新文章
热门文章
推荐阅读