找到 413 篇文章,关于数据挖掘

什么是随机森林?

Ginni
更新于 2022年2月11日 13:08:44

183 次浏览

随机森林是一种集成方法,尤其适用于决策树分类器。它整合了多个决策树的预测结果,每个树都是基于一组独立的随机向量值创建的。与 AdaBoost 等自适应方法不同,随机向量是从一个常数概率分布中生成的,而 AdaBoost 中的概率分布是不同的,目标是难以分类的实例。Bagging 决策树是随机森林的一个特定案例,其中通过从初始训练集中随机选择 N 个样本(有放回)来将随机性引入模型构建过程中。Bagging ... 阅读更多

构建集成分类器的有哪些方法?

Ginni
更新于 2022年2月11日 13:07:01

472 次浏览

其概念是从初始数据中构建多个分类器,然后在描述未知示例时聚合它们的预测结果。集成分类器可以通过几种方法构建,如下所示:通过操作训练集 - 在这种方法中,通过根据某种采样分布对初始数据进行重新采样来生成多个训练集。采样分布决定了选择实例进行训练的可能性,并且它可以从一个试验变为另一个试验。使用特定的学习算法从每个训练集构建一个分类器。Bagging 和 boosting 是实例... 阅读更多

SVM 的特点是什么?

Ginni
更新于 2022年2月11日 13:05:23

1K+ 次浏览

支持向量机 (SVM) 是一种受到了相当多关注的分类方法。这种方法源于统计学习理论,并在许多实际应用中显示出良好的经验结果,从手写数字识别到文本分类。SVM 还可以处理高维数据,并避免维度灾难问题。这种方法的第二个要素是它使用训练实例的子集(称为支持向量)来定义决策边界。SVM 可以被训练成在线性可分数据中显式地查看这种类型的超平面。它可以通过展示 SVM 如何… 阅读更多

人工神经网络的特点是什么?

Ginni
更新于 2022年2月11日 13:00:02

1K+ 次浏览

人工神经网络是一个基于生物神经网络功能的系统。它是生物神经系统的模拟。人工神经网络的特点是结构多种多样,需要多种算法方法,但无论系统多么复杂,神经网络都很容易使用。这些网络位于主管工具箱中特定信号处理科学之间。该领域是高度交叉学科的,但这种技术将视野限制在工程视角上。输入/输出训练数据对于神经网络技术至关重要,因为它们发送必要的记录来“寻找”最佳… 阅读更多

人工神经网络的设计问题有哪些?

Ginni
更新于 2022年2月11日 12:25:48

3K+ 次浏览

人工神经网络是一个基于生物神经网络功能的系统。它是生物神经系统的模拟。人工神经网络的特点是结构多种多样,需要多种算法方法,但无论系统多么复杂,神经网络都很容易使用。这些网络位于主管工具箱中特定信号处理科学之间。该领域是高度交叉学科的,但这种方法将视野限制在工程视角上。在工程学中,神经网络作为模式分类器和非线性自适应滤波器发挥着两个基本功能。人工神经网络… 阅读更多

多层人工神经网络有哪些方法?

Ginni
更新于 2022年2月11日 12:23:06

335 次浏览

人工神经网络比感知器模型的机制更为复杂。多层人工神经网络中有多种方法,如下所示:网络可以在其输入层和输出层之间包含多个中间层。这些中间层称为隐藏层,安装在这些层中的节点称为隐藏节点。由此产生的体系结构称为多层神经网络。在前馈神经网络中,一层中的节点仅连接到下一层中的节点。感知器是单层前馈神经网络,因为它只有一个… 阅读更多

什么是多层人工神经网络?

Ginni
更新于 2022年2月11日 12:12:28

786 次浏览

人工神经网络是一个基于生物神经网络功能的系统。它是生物神经系统的模拟。人工神经网络的特点是结构多种多样,需要多种算法方法,但无论系统多么复杂,神经网络都很容易使用。这些网络位于主管工具箱中特定信号处理科学之间。该领域是高度交叉学科的,但这种技术将视野限制在工程视角上。在工程学中,神经网络作为模式分类器和非线性自适应滤波器发挥着两个基本功能。人工神经网络… 阅读更多

贝叶斯信念网络的特点是什么?

Ginni
更新于 2022年2月11日 12:10:56

675 次浏览

朴素贝叶斯分类器假设类条件独立性,即,给定元组的类标签,属性的值被认为是彼此条件独立的。这定义了评估。当假设成立时,朴素贝叶斯分类器与多个分类器相比是有效的。它可以表示联合条件概率分布。它们允许在变量子集之间表示类条件独立性。它们支持因果关系的图形结构,可以在其上实现学习。训练好的贝叶斯信念网络用于分类。贝叶斯信念网络也称为信念网络,… 阅读更多

朴素贝叶斯分类器的特点是什么?

Ginni
更新于 2022年2月11日 12:06:15

1K+ 次浏览

贝叶斯分类器是统计分类器。它可以预测类成员概率,例如给定样本应用于特定类的概率。当贝叶斯分类器可以拥有大型数据库时,它们也显示出很高的效率和速度。因为类是定义的,所以系统必须推断出控制分类的规则,因此系统必须能够发现每个类的描述。这些描述必须定义训练集的预测属性,以便只有正例必须满足该描述,而不是负例。如果规则的描述覆盖了… 阅读更多

最近邻分类器的特点是什么?

Ginni
更新于 2022年2月11日 12:03:43

2K+ 次浏览

最近邻规则通常能产生高性能,无需预先假设训练实例所来自的分配情况。它包含正负案例的训练集。新样本的定义是计算到最近训练案例的距离;该点的符号然后决定样本的分类。k-NN分类器通过采用k个最近的点并创建多数的符号来增强这一概念。通常选择k为小奇数以划分平局(通常为1、3或5)。较大的k值有助于减少……阅读更多

广告