CatBoost - 模型评估指标

为了确保机器学习模型的性能满足不断增长的标准和要求，在创建模型时进行有效的评估是必要的。Yandex 的 CatBoost 是一个强大的梯度提升库，它为数据科学家和机器学习专业人员提供了一套评估模型有效性的指标。

CatBoost 以轻松、准确和有效地处理类别特征而闻名。由于其惊人的准确性，它在许多现实场景中的机器学习任务中备受青睐。

但模型的真正价值与其算法一样，也取决于其实际性能。在这种情况下，指标非常有用。CatBoost 提供的两个用于模型评估的核心函数是“evaluate()”和“eval_metric”。这些函数涵盖了广泛的功能。但 CatBoost 提供的不仅仅是这些。

CatBoost 指标

CatBoost 指标用于评估使用 CatBoost 机器学习技术创建的模型的性能。这些指标帮助我们了解模型预测的质量和准确性。以下是一些常见的 CatBoost 指标及其解释：

准确率是评估分类模型性能的常用参数。它评估模型对给定数据集的预测百分比的准确性。

对于二元分类，准确率如下：

Accuracy = {TP + TN}/{TP + TN + FP + FN}

其中：

多类别对数损失，也称为交叉熵损失或对数损失，是衡量分类模型在多类别场景中性能的常用指标。它计算真实类别标签与每个实例的预期类别概率之间的差异。

多类别对数损失的数学表示如下：

Multiclass Log Loss = - (1 / N) Σ_i=1^N Σ_j=1^M [ y_ij * log(p_ij) ]

其中：

二元对数损失是评估二元分类算法性能的常用数据。它也称为逻辑损失或交叉熵损失。它计算每个实例的预期概率与真实二元标签之间的差异。

二元对数损失的数学表示如下：

Binary Log Loss = - (1 / N) Σ_i=1^N [ y_i * log(p_i) + (1 - y_i) * log(1 - p_i) ]

其中：

接收者操作特征 (ROC) 曲线以图形方式显示二元分类模型在一定阈值范围内的有效性。它在不同的概率水平上绘制真阳性率 (TPR) 与假阳性率 (FPR)。

ROC 曲线下的面积，即 AUC-ROC，可以计算如下：

真阳性率 (TPR): 也称为灵敏度或召回率，计算公式为：

TPR = True Positives (TP) / [True Positives (TP) + False Negatives (FN)]

假阳性率 (FPR): 计算公式为：

FPR = False Positives (FP) / [False Positives (FP) + True Negatives (TN)]

F1 分数将召回率（灵敏度）和精确率（正预测值）组合成一个单一分数，这是二元分类问题中一个流行的指标，它在两者之间取得平衡。

F1 分数的数学表示如下：

F1 = F1 = 2.Precision.Recall / (Precision + Recall)

打印页面