朴素贝叶斯分类器的特点是什么？

数据挖掘数据库数据结构

贝叶斯分类器是统计分类器。它可以预测类成员概率，例如给定样本应用于特定类的概率。当贝叶斯分类器可以拥有大型数据库时，它也显示出较高的效率和速度。

由于类已定义，因此系统必须推断出监督分类的规则，因此系统必须能够发现每个类的描述。这些描述必须定义训练集的预测属性，以便只有正实例必须满足描述，而不是负实例。如果规则的描述涵盖所有正例，并且没有覆盖类的任何负例，则称该规则是正确的。

它假设所有属性的贡献都是独立的，并且每个属性对分类问题都有同等贡献，这是一种称为朴素贝叶斯分类的简单分类方案。

朴素贝叶斯分类之所以称为朴素，是因为它假设类条件独立性。给定类上属性值的实现与多个属性的值无关。做出此假设是为了降低计算成本，因此被视为朴素。

存在多种算法可以根据给定的可观察变量的训练记录来理解网络拓扑。问题是离散优化。人类专业人员通常对影响分析领域中的直接条件依赖性有很好的把握，这有助于网络设计。专家应为在直接依赖性中执行的节点定义条件概率。

这些概率可用于评估其余概率值。如果网络拓扑已知且变量可观察，则训练网络很简单。它包括计算 CPT 条目，这与在评估朴素贝叶斯分类中包含的概率时完成的操作类似。

朴素贝叶斯分类器有各种特点，如下所示：

它们对孤立的噪声点具有鲁棒性，因为在从数据估计条件概率时，这些点会被平均掉。它还可以通过在模型构建和分类期间删除实例来管理缺失值。

它们对无关属性具有鲁棒性。如果 X_i 是一个不合适的属性，则 P (X_i|Y) 变得一致分布。X_i 的类条件概率对后验概率的完整计算没有影响。

相关属性会降低朴素贝叶斯分类器的性能，因为条件独立性假设不再适用于此类属性。例如，考虑以下概率：

P (A=0|Y=0) =0.4, P (A=1 | Y=0) =0.6,

P (A=0|Y = 1) = 0.6, P (A= 1 | Y =1) = 0.4,

其中 A 是一个二元属性，Y 是一个二元类变量。假设还有另一个二元属性 B，当 Y = 0 时与 A 完全相关，但当 Y = 1 时与 A 无关。为了完整起见，考虑 B 的类条件概率与 A 相同。

Ginni

更新于：2022 年 2 月 11 日

1K+ 次浏览

开启你的职业生涯

通过完成课程获得认证

广告

© . All rights reserved.