找到 1861 篇文章 关于数据结构

什么是泛化示例?

Ginni
更新于 2022年2月10日 11:52:27

95 次浏览

泛化示例是实例区域的矩形范围,称为超矩形,因为它们是高维的。在定义新实例时,必须转换距离函数以能够计算到超矩形的距离。当正确定义新示例时,通过将其直接与相似类别的最近示例合并来将其泛化。最近的示例可以是单个实例或超矩形。在此方法中,会生成一个覆盖先前实例和新实例的新超矩形。超矩形扩展到包围新实例。最后,如果预测错误... 阅读更多

什么是径向基函数网络?

Ginni
更新于 2022年2月10日 11:50:08

7K+ 次浏览

径向基函数 (RBF) 网络是一种流行的前馈网络类型。它有两层,不包括输入层,并且与多层感知器在隐藏单元实现计算的方法上形成对比。每个隐藏单元都显着定义了输入空间中的特定点,以及它基于其点与实例之间的距离(这只是一个不同的点)给定实例的输出或激活。这两个点越近,激活越好。这是通过利用非线性变换函数将距离修改为相似性度量来实现的。钟形高斯... 阅读更多

数据挖掘中的估计方法有哪些?

Ginni
更新于 2022年2月15日 09:55:28

569 次浏览

十折交叉验证是测量特定数据集上学习方案错误率的标准方法;为了获得可靠的结果,需要进行 10 次十折交叉验证。有两种方法是留一法交叉验证和自举法。留一法交叉验证留一法交叉验证是公开的 n 折交叉验证,其中 n 是数据集中实例的数量。依次排除每个实例,并在所有剩余实例上训练学习方案。它通过在剩余实例上的正确性来计算——相应地,成功或失败为 1 或 0。对数据集的每个组进行 n 次判断的结果取平均值,... 阅读更多

如何构建决策树?

Ginni
更新于 2022年2月10日 11:44:19

2K+ 次浏览

决策树是一种类似流程图的树机制,其中每个内部节点表示对属性的测试,每个部门定义测试的结果,叶节点描述类或类分布。树中最大的节点是根节点。构建决策树的问题可以递归地定义。首先,选择一个要放置在根节点的属性,并为每个可能的值创建一个分支。这将示例集划分为子集,每个属性值一个。该过程可以对每个分支递归地重复,仅使用这些实例... 阅读更多

什么是基于实例的表示?

Ginni
更新于 2022年2月10日 11:35:00

881 次浏览

学习的最简单结构是简单的记忆或死记硬背。因为一组训练实例已被记住,所以遇到新实例时,会检查内存中与新实例最相似训练实例。唯一的问题是如何阐明相似。首先,这是描述从实例组中提取的“知识”的完全不同的方法 - 它存储实例本身,并通过将类未知的新实例与类已知的当前实例关联来工作。与其尝试制定规则,不如直接从实例本身工作。... 阅读更多

判别分析的性能如何?

Ginni
更新于 2022年2月10日 11:32:28

258 次浏览

判别分析方法依赖于两个主要假设来出现在分类分数上 - 首先,它认为某些类别的预测变量测量值来自多元正态分布。当此假设合理地组装时,判别分析是一种比其他分类方法(包括逻辑回归)更动态的工具。它表明,如果数据是多元正态的,则判别分析比逻辑回归有效 30%,它需要少 30% 的记录才能达到相同的结果。已经表明,这种方法对偏离正态性的抵抗力相对较强,因为预测变量可以是非正态的... 阅读更多

k-NN 算法的优势是什么?

Ginni
更新于 2022年2月10日 11:29:39

236 次浏览

k 近邻算法是一种分类方法,它不假设类成员 (Y) 与预测变量 X1、X2、…。Xn 之间关系的结构。这是一种非参数方法,因为它不包含对假定函数形式中的参数的估计,包括线性回归中假定的线性形式。此方法从数据集中数据预测变量值的相似性中提取数据。k-NN 方法的优势在于它们的完整性和对参数假设的需求。在存在大型训练集的情况下,当每个... 阅读更多

什么是 K 近邻算法?

Ginni
更新于 2022年2月10日 11:24:41

400 次浏览

k 近邻算法是一种分类方法,它不假设类成员 (Y) 与预测变量 X1、X2、…。Xn 之间关系的结构。这是一种非参数方法,因为它不包括对假定函数形式中的参数的估计,包括线性回归中假定的线性形式。此方法从数据集中数据预测变量值的相似性中提取数据。k 近邻方法中的概念是识别训练数据集中与需要分类的新数据相同的 k 条记录。它可以... 阅读更多

如何减少预测变量的数量?

Ginni
更新于 2022年2月10日 11:22:49

252 次浏览

数据挖掘中一个常见的问题是利用回归方程来预测因变量的值,当它可以有多个变量可供选择作为此模型中的预测变量时。另一个考虑因素有利于包含众多变量,希望出现以前隐藏的关系。例如,一家公司发现购买椅子和桌子腿防磨保护套的客户信用风险较低。在将所有可能的变量放入模型之前,有几个理由要谨慎行事。设置完整的预测变量可能价格昂贵或不可行... 阅读更多

什么是热图?

Ginni
更新于 2022年2月10日 11:19:52

445 次浏览

热图是数值数据的图形显示,其中颜色用于表示值。在数据挖掘的上下文中,热图对于两种用途特别有用 - 用于可视化相关表和用于可视化数据中的缺失值。在这两种情况下,信息都以二维表的形式传达。热图是对数据的图形描述,需要一套颜色编码来定义多个值。热图用于各种形式的分析,但最常用于显示用户在特定网页或网页模板上的行为。热图可用于显示... 阅读更多

广告