时序分析

2024-05-18 01:34

1. 时序分析

我们用机器学习模型通过对历史数据来学习拟合,从而来对未来进行预测。这次分享我们主要以传统
  
 主要从这三个方面来展开对时序分析
  
 时序分析是一个比较有特点研究领域,这个领域始于对金融业,例如股市趋势预测、投资风险评估。后来有渗透到其他领域,对未来市场预测、动态定价、用电量预测以及在生物医药也有其一席之地。
  
   
  
 数学定义一般都是比较简短、严谨和抽象的语言来描述一个概念。按时间序列排序的一组随机数变量.
     
   表示一个随机事件的时间序列,简记为  
  
 在时序预测中,每一个数据也就是我们看到的数值其实都是一个随机变量的观察值,随机变量服从一定分布。其实我们看到值也可以称为观察值其实是时间随机序列的一个实现,或者叫做实例,所有我们看到历史数据就是随机时间序列一组样本。
  
 其实我们通过分析来把握这个随机时序的性质
  
 因为我们知道每一个点都是服从整体分布。只要我们通过数据得到这些随机时序的性质,也就是掌握随机变量的模样。其实就是一个数理统计过程,也有点类似机器学习中生成模型。
  
 其实上面就简述了时间序列任务总体方案
  
 有了整体方案,我们一步一步按照这些步骤去去做,然后把需要填填上就完成时序预测。
  
 上面内容一看任务的关键步骤就是时间序列分析,那么什么是时间序列分析呢?一句话时间序列分析就是对时间序列进行统计分析。
  
 那么具体分析方法有那些呢?主要有两种,分别是描述性时序分析和统计时序分析。
                                          
 时间序列分析理论中有两种平稳性定义
  
 所谓严就是说严平稳的所有统计性质都不随时间的变化而变化。这是严平稳性质也是严平稳的定义.
   以后我们对于一些概念都可以尝试用数学语言描述一下,
     
  
 也称协方差平稳(covariance stationary)、二阶平稳(second-order stationary)或宽平稳(wide-sense stationary),弱平稳时间序列的一阶矩和二阶矩不随时间的变化而变化。
  
 判断时间序列的平稳性有助随后选择模型,那么的平稳性是时间序列一个重要性质,可以用来给时间序列进行分类。
  
 我们会谈谈严平稳和弱平稳之间的关系,满足严平稳的序列具有弱平稳性,但是严平稳并不能全部涵盖弱平稳。为什么说严平稳并不能全部涵盖弱平稳?这是因为柯西分布是严平稳时间序列,但是不存在二阶矩或一阶矩,所以柯西分布就是不满足弱平稳的严平稳。
  
 当时间序列为正态分布序列,则由二阶矩描述了正态分布的所有统计性质,此时弱平稳的正态序列也是严平稳。
  
 因为在实际中多数时间序列都是弱平稳,所以今天我们也要重点谈谈弱平稳。
  
 如果时间序列  的二阶矩有限
     
   我们看随着时间变化,时间序列的均值是一个常数。
     
   方差同均值一样也是常数,方差是二阶矩
     
   协方差也是二阶矩,不同时刻的点是否有规律性,因为弱平稳的协方差或者准确地说自协方差是一个时间间隔的函数。当时间间隔协方差是相当的,当间隔不相同的时候对应协方差就不相同,当 s 变化     就会变化
  
 其实我们就是在找  和  之间的关系,这里用    s 表示不同的时间间隔,例如  
  
 那么也就是说弱平稳时间序列的自协方差只与时滞 s 有关,与时间的起始位置 t 无关。
  
 自协方差  简记为仅与时滞s 相关的一元函数形式   当   时,   就等同于方差
     
   平稳时间序列的自相关系数也可以简记为与时滞 s 相关的一元函数形式  
     
  
   
  
 如果一个模型生成时间序列是平稳的,那么就说明该模型是平稳,否则就是非平稳的
  
 这里有一段话大家可以理解一下,AR、MA和ARMA模型都是常用的平稳序列的拟合模型,但并非所有的AR、MA和ARMA模型都是平稳的。
  
 好我们回到线性差分方程,我们重点说一下差分方程两种表达方式,其中我们先说一下什么是滞后算子。
   假设已知时间序列   和    有如下关系
     
   其实就是我们不用  来表示  是的y 而表达成为   就是我们在程序中看到 lag 也有用 B 表示的,以此类推
     
   所以用滞后算子表达出多项式
     
  
   
  
 典型的 p 阶线性差分方程为
     
                                          
 今天我们主要说时间序列的一些推导公式,之前看些资料,其中关于时间序列中常用AR模型、MA模型背后推导说的比较深,不易于理解。最近看了一些资料,适当地总结一些。
  
 时间序列虽然简单、但是要是想真正弄懂也需要花费一些功夫,将序列分解为一下形式。
     
  
 这通过加法模型将这些项来表示时间序列,其中趋势项和季节项我们是可以通过模型来拟合,因为他们都是有规律可循的,需要我们能够通过模型学出来
  
   
   GPD 就是一个趋势模型,而且是随着时间而不断成指数增长。
  
 超市的人流,具有周期性,每周的人流在周末人流要相对于周一到周五人要多一些。每天人流下午要相对于上午人流要多一些。
  
   
   那么也就是说明我们对    ,我们之前讨论过时间序列是一个随机过程,也就是   的联合分布,通常我们研究一个联合分布是一个比较复制的问题。
   这是我们在统计模型时候,最早的NPL 分析用到链式法则来表示联合概率一种
     
   学习过概都知道条件概率,时序每一个时刻随机变量都是和他之前的随机时间点的概率是相关。这就是联合概率,要计算这个联合概率是需要相当大的计算量。
  
   
  
   
   当 a 小于 1 说明模型是稳定,反之说明模型是不稳定,为什么会有这样结论。我们可以结合小球的落地原理来项这个问题。
   其实我们非齐次项差分方程
     
   下面是差分方程通解
     
     
   其中 B 也即是滞后算子L,这里用 B 来表示,这里还是再演示一下吧
     
     
   接下来计算特征解,提取左边  
     
     
  
   
     
   可以表示无限变量只和形式,这个大家应该不会陌生,而且   类似  ,所以替换替换等比数列之和。
     
  
   
  
   
  
 重点相关性研究  和  可以用  计算出来。AR序列相关性是随着负指数衰减,MA(q) 模型是有限相关性,
      有限时间序列相关  
  
 根据均方差最小原则,来进行预测
     
   也就是我们讨论的AR模型,那么AR模型就可以用于时间序列分析
     
  
    这样时间序列步长间隔相同间分布是一致,这样时间序列才是平稳的时间序列。线性filter
  
   
   这是研究时间序列另一种模型,通过频域来研究时间序列

时序分析

2. 时序的评析

《时序》的“时”是时代,“序”是顺序。“时序”即时代发展。本篇就从历代文学创作的发展变化情况,来探讨文学与社会现实的密切关系。全篇分五部分:一、讲先秦时期的文学情况。二、讲两汉时期的文学情况。三、讲建安、正始文学情况。四、讲晋代文学情况。五、讲南朝宋、齐文学情况。本篇是一篇文学简史或文学简史论,集中讨论了各代文学的发展变化和原因。刘勰提出“十代九变”,可以看出他是用发展的观点来看待文学的;更重要的是在探讨各代文学发展变化的原因时提出了精到的见解。首先,他认为文学创作和社会现实之间有复杂的关系,作出了“文变染乎世情,兴废系乎时序”的科学论断。其次,从各代文学的继承发展中看到了文学一经产生,即有其相对的独立性,文学自身发展规律对于文学的发展具有重要的影响。选自《刘勰·文心雕龙·时序》