时间序列 - 误差指标
量化模型的性能以便将其用作反馈和比较非常重要。在本教程中,我们使用了最流行的误差指标之一:均方根误差。还有其他各种可用的误差指标。本章简要讨论了它们。
均方误差
它是预测值和真实值之间差值的平方的平均值。Sklearn 提供了它作为一个函数。它与真实值和预测值的平方具有相同的单位,并且始终为正。
$$MSE = \frac{1}{n} \displaystyle\sum\limits_{t=1}^n \lgroup y'_{t}\:-y_{t}\rgroup^{2}$$
其中 $y'_{t}$ 是预测值,
$y_{t}$ 是实际值,并且
n 是测试集中值的总数。
从等式中可以清楚地看出,MSE 对较大的误差或异常值具有更大的惩罚作用。
均方根误差
它是均方误差的平方根。它也始终为正,并且在数据的范围内。
$$RMSE = \sqrt{\frac{1}{n} \displaystyle\sum\limits_{t=1}^n \lgroup y'_{t}-y_{t}\rgroup ^2}$$
其中,$y'_{t}$ 是预测值
$y_{t}$ 是实际值,并且
n 是测试集中值的总数。
它是一次方,因此与 MSE 相比更易于解释。RMSE 对较大的误差也具有更大的惩罚作用。我们在教程中使用了 RMSE 指标。
平均绝对误差
它是预测值和真实值之间绝对差值的平均值。它与预测值和真实值具有相同的单位,并且始终为正。
$$MAE = \frac{1}{n}\displaystyle\sum\limits_{t=1}^{t=n} | y'{t}-y_{t}\lvert$$
其中,$y'_{t}$ 是预测值,
$y_{t}$ 是实际值,并且
n 是测试集中值的总数。
平均百分比误差
它是预测值和真实值之间绝对差值的平均值的百分比,除以真实值。
$$MAPE = \frac{1}{n}\displaystyle\sum\limits_{t=1}^n\frac{y'_{t}-y_{t}}{y_{t}}*100\: \%$$
其中,$y'_{t}$ 是预测值,
$y_{t}$ 是实际值,n 是测试集中值的总数。
但是,使用此误差的缺点是正误差和负误差可以相互抵消。因此,使用平均绝对百分比误差。
平均绝对百分比误差
它是预测值和真实值之间绝对差值的平均值的百分比,除以真实值。
$$MAPE = \frac{1}{n}\displaystyle\sum\limits_{t=1}^n\frac{|y'_{t}-y_{t}\lvert}{y_{t}}*100\: \%$$
其中 $y'_{t}$ 是预测值
$y_{t}$ 是实际值,并且
n 是测试集中值的总数。