机器学习中的时间序列是什么?


顾名思义,时间序列是指包含特定时间段或时间戳的数据。它包含特定时间段内的观察结果。此类数据告诉我们变量如何根据各种因素随时间变化。时间序列分析和预测可用于预测未来某个时间点的数据。

单变量时间序列包含在一段时间内在特定时间点相对于单个变量取的值。多变量时间序列包含在相同周期性时间点相对于多个变量取的值。

时间序列包含以下四个组成部分:

水平

它指的是数据值围绕其变化的平均值。

趋势

顾名思义,它描述了数据集中的数据点相对于时间的特定模式(增加、减少、中性等)。

季节性

它描述了时间序列数据的重复性质/循环行为。

噪声

观察结果中由于外部因素隐含添加的不需要的数值。

有很多关于时间序列的方法可以用来捕获上述组件。让我们简要了解其中的一些:

  • 当提供给定变量前一时间段的实际值时,可以使用简单的估计技术来预测给定变量的值。这本身并没有真正使用,而更像是使用复杂技术时的参考点。

  • 自回归是一种预测未来时间段值的技巧。它使用历史数据,即前一时间段的数据。数据可能更适合模型,但自回归没有提供对“季节性”组件的解释。

  • ARIMA 代表“自回归积分移动平均”。它尝试将数据点的值预测为历史/先前数据点的线性函数。这样,前一时间段存在的误差就会被纳入预测数据中。在现实生活中,数据可能不是平稳的,因此开发了季节性 ARIMA 和分数 ARIMA。

  • 指数平滑是一种技术,其中变量被建模为数据集先前值的指数加权线性函数。这种类型的模型非常适合数据的趋势和季节性。

  • LSTM 指的是长短期记忆模型,这是一种循环神经网络,用于在存在长期依赖关系时处理时间序列模型。需要大量的训练数据来收集多变量时间序列数据集中的趋势。

更新于: 2021年1月18日

183 次查看

开启您的 职业生涯

通过完成课程获得认证

开始
广告