什么是趋势分析?
趋势分析定义了从时间序列中提取行为模型的技术,这些技术可能被噪声部分或完全隐藏。趋势分析方法通常用于检测疾病暴发以及疾病出现次数的意外增加或减少,监测疾病趋势,评估疾病控制方案和政策的有效性,以及评估医疗保健方案和政策的成功等。
可以使用各种技术来检测项目序列中的趋势。平滑是一种用于去除时间序列中非系统性行为的方法。平滑通常采取寻找属性值的移动平均值的形式,给定围绕特定时间点的时间窗口。
使用所有属性值的局部平均值代替在此点找到的特定值。通常使用中值而不是平均值,因为它对异常值不太敏感。平滑可以滤除噪声和异常值。它可以用来预测未来的值,因为生成的更容易拟合已知函数(线性、对数、指数等)。
检测时间序列数据中的季节性模式比较困难。一种方法是在均匀分布的间隔处查找属性之间的相关性。例如,可以在每第十二个值(在月度销售数据中)之间找到相关性。相关项目之间的时间差称为滞后。
可以生成自相关函数来确定不同滞后间隔处数据值之间的相关性。相关图以图形方式显示几个滞后值的自相关值。
协方差衡量两个变量如何一起变化。它可以用作确定两个时间序列或一个时间序列中季节性趋势之间关系的基础。自相关系数 rk衡量时间序列值之间特定距离(滞后 k)的相关性。
自相关已经使用了多种方法。正值表示两个变量一起增加,而负值表示一个变量增加而另一个变量减少。
接近零的值表示两个变量之间几乎没有相关性。计算相关性的一个典型公式是相关系数 r,有时也称为皮尔逊 r。
给定两个时间序列 X 和 Y,其均值分别为 X'和 Y',每个均有 n 个元素,则 r 的公式为
$$\mathrm{\frac{\sum(x_i-X')(y_i-Y')}{\sqrt{\sum(x_i-X)^2(y_i-Y')^2}}}$$
将其应用于在时间序列 X=(x1,x2,…xn) 上找到滞后 k 的相关系数 rk 是直接的。第一个时间序列是 X′=(x1,x2,…xn−k),而第二个时间序列是 X''=(xk+1,xk+1,…xn)。