十折交叉验证是测量特定数据集上学习方案错误率的标准方法;为了获得可靠的结果,需要进行 10 次十折交叉验证。有两种方法是留一法交叉验证和自举法。留一法交叉验证留一法交叉验证是公开的 n 折交叉验证,其中 n 是数据集中实例的数量。依次排除每个实例,并在所有剩余实例上训练学习方案。它通过在剩余实例上的正确性来计算——相应地,成功或失败为 1 或 0。对数据集的每个组进行 n 次判断的结果取平均值,... 阅读更多
k 近邻算法是一种分类方法,它不假设类成员 (Y) 与预测变量 X1、X2、…。Xn 之间关系的结构。这是一种非参数方法,因为它不包括对假定函数形式中的参数的估计,包括线性回归中假定的线性形式。此方法从数据集中数据预测变量值的相似性中提取数据。k 近邻方法中的概念是识别训练数据集中与需要分类的新数据相同的 k 条记录。它可以... 阅读更多