时间序列 - 误差指标



量化模型的性能以便将其用作反馈和比较非常重要。在本教程中,我们使用了最流行的误差指标之一:均方根误差。还有其他各种可用的误差指标。本章简要讨论了它们。

均方误差

它是预测值和真实值之间差值的平方的平均值。Sklearn 提供了它作为一个函数。它与真实值和预测值的平方具有相同的单位,并且始终为正。

$$MSE = \frac{1}{n} \displaystyle\sum\limits_{t=1}^n \lgroup y'_{t}\:-y_{t}\rgroup^{2}$$

其中 $y'_{t}$ 是预测值,

$y_{t}$ 是实际值,并且

n 是测试集中值的总数。

从等式中可以清楚地看出,MSE 对较大的误差或异常值具有更大的惩罚作用。

均方根误差

它是均方误差的平方根。它也始终为正,并且在数据的范围内。

$$RMSE = \sqrt{\frac{1}{n} \displaystyle\sum\limits_{t=1}^n \lgroup y'_{t}-y_{t}\rgroup ^2}$$

其中,$y'_{t}$ 是预测值

$y_{t}$ 是实际值,并且

n 是测试集中值的总数。

它是一次方,因此与 MSE 相比更易于解释。RMSE 对较大的误差也具有更大的惩罚作用。我们在教程中使用了 RMSE 指标。

平均绝对误差

它是预测值和真实值之间绝对差值的平均值。它与预测值和真实值具有相同的单位,并且始终为正。

$$MAE = \frac{1}{n}\displaystyle\sum\limits_{t=1}^{t=n} | y'{t}-y_{t}\lvert$$

其中,$y'_{t}$ 是预测值,

$y_{t}$ 是实际值,并且

n 是测试集中值的总数。

平均百分比误差

它是预测值和真实值之间绝对差值的平均值的百分比,除以真实值。

$$MAPE = \frac{1}{n}\displaystyle\sum\limits_{t=1}^n\frac{y'_{t}-y_{t}}{y_{t}}*100\: \%$$

其中,$y'_{t}$ 是预测值,

$y_{t}$ 是实际值,n 是测试集中值的总数。

但是,使用此误差的缺点是正误差和负误差可以相互抵消。因此,使用平均绝对百分比误差。

平均绝对百分比误差

它是预测值和真实值之间绝对差值的平均值的百分比,除以真实值。

$$MAPE = \frac{1}{n}\displaystyle\sum\limits_{t=1}^n\frac{|y'_{t}-y_{t}\lvert}{y_{t}}*100\: \%$$

其中 $y'_{t}$ 是预测值

$y_{t}$ 是实际值,并且

n 是测试集中值的总数。

广告