什么是时间序列数据库?
时间序列数据库包含一系列值或事件,这些值或事件通过重复评估时间来访问。这些值通常以相等的时间间隔(例如,每小时、每天、每周)计算。时间序列数据库在许多应用程序中很流行,例如股票市场分析、经济和销售预测、预算分析、公用事业研究、库存研究、产量预测、工作负载预测、过程和质量控制、自然现象观察(包括大气、温度、风和地震)、数值和工程实验以及医疗处理。
时间序列数据库也是一个序列数据库。序列数据库是任何包含有序事件序列的数据库,无论是否具有具体的时间方法。例如,网页遍历序列和客户购物交易序列是序列数据,但它们可能不是时间序列数据。
随着大量传感器、遥测设备和其他在线数据收集工具的日益部署,时间序列数据量正在快速增长,通常以每天(例如,股票交易)甚至每分钟(例如,来自 NASA 太空计划)千兆字节的顺序增长。
涉及变量 Y 的时间序列,例如表示股票市场中股票的每日收盘价,可以视为时间的函数 t,即 Y = F(t)。趋势分析包括以下四个主要要素或运动,用于特征时间序列数据 -
趋势或长期运动 - 这些表示时间序列图在较长时间间隔内移动的总体方向。此运动由趋势曲线或趋势线显示。例如,趋势曲线由虚线表示。确定趋势曲线或趋势线的典型方法包括加权移动平均法和最小二乘法,将在后面讨论。
周期性运动或周期性变化 - 这些指的是周期,即围绕趋势线或曲线的长期振荡,这些振荡可能是周期性的,也可能不是周期性的。也就是说,这些周期不一定在相等的时间间隔后遵循完全相同的模式。
季节性运动或季节性变化 - 这些是系统性的或与日历相关的。示例包括每年重复发生的事件,例如情人节前巧克力和鲜花的销量突然增加或圣诞节前百货商店商品的销量增加。由于天气温暖而导致夏季用水量增加是另一个例子。在这些示例中,季节性运动是时间序列在连续年份的对应月份中似乎遵循的相同或几乎相同的模式。
不规则或随机运动 - 这些描述了由于随机或偶然事件(例如劳资纠纷、洪水或公司内部宣布的人员变动)导致的时间序列的零星运动。