SVM 的特征是什么?


支持向量机(SVM)是一种分类方法,受到了广泛的关注。这种方法源于统计学习理论,并在许多实际应用中表现出了良好的经验结果,从手写数字识别到文本分类。

SVM 还可以处理高维数据,并避免维度灾难问题。这种方法的第二个要素是它使用训练实例的一个子集来定义决策边界,称为支持向量。

SVM 可以被训练为明确地查看线性可分数据中的这种类型的超平面。可以通过展示如何将 SVM 方法扩展到非线性可分数据来实现。数据集是线性可分的;即,它可以发现一个超平面,包括所有位于超平面一侧的正方形和所有位于另一侧的圆形。

线性模型的容量与其边际成反比。具有小边际的模型具有更大的容量,因为它们是动态的并且可以拟合一些训练集,这与具有大边际的模型不同。根据 SRM 原则,随着容量的增加,泛化误差界限可能会增加。因此,期望创建最大化其决策边界边际的线性分类器,以确保其最坏情况下的泛化误差减少。

线性 SVM 是一种分类器,它寻找具有最大边际的超平面,称为最大边际分类器。它可以学习 SVM 如何学习这样的边界,它可以从对线性分类器的决策边界和边际的一些初步分析开始。

SVM 有多种特征,如下所示:

SVM 学习问题可以被组织成一个凸优化问题,其中可以使用有效的算法来找到目标函数的全局最小值。存在不同的分类方法,包括基于规则的分类器和人工神经网络,它们采用基于贪婪的方法来搜索假设空间。这些方法导致仅找到局部最优解。

SVM 通过扩大决策边界的边际来实现容量控制。用户应提供几个参数,包括要使用的内核函数类型和用于提供每个松弛变量的成本函数 C。

SVM 可以通过为数据中显示的每个分类属性值学习虚拟变量来用于分类记录。例如,如果婚姻状况有三个值,例如单身、已婚、离婚,那么它可以为每个属性值学习一个二元变量。

更新于: 2022年2月11日

1K+ 浏览量

开启你的 职业生涯

通过完成课程获得认证

开始学习
广告