找到 413 篇文章 关于数据挖掘

数据挖掘中约束的分类有哪些?

Ginni
更新于 2022年2月18日 10:02:36

366 次查看

基于约束的算法需要约束来减少频繁项集生成阶段的搜索空间(关联规则创建步骤与穷举算法相同)。约束的重要性是明确的,它们只生成对客户有意义的关联规则。该方法非常简单,规则空间减小,从而使剩余规则利用约束。有三种类型的约束,如下所示:实例约束 - 实例约束定义了如何在聚类分析中对实例对或实例集进行分组。从……中有两种类型的约束 阅读更多

如何测量图中两个顶点之间的相似度或距离?

Ginni
更新于 2022年2月18日 10:09:11

1K+ 次查看

有两种类型的度量,例如测地线距离和基于随机游走的距离。测地线距离 - 图中两个顶点之间距离的一个简单度量是顶点之间的最短路径。通常,两个顶点之间的测地线距离是指顶点之间最短路径的边数。对于图中未连接的两个顶点,测地线距离表示为无穷大。通过利用测地线距离,它可以表示图分析和聚类的各种有用度量。给定一个图 G = (V, E),其中 V ... 阅读更多

二分图有哪些应用?

Ginni
更新于 2022年2月18日 07:31:57

2K+ 次查看

在二分图中,顶点可以分成两个不相交的集合,使得每条边都连接一个集合中的一个顶点和另一个集合中的一个顶点。对于 AllElectronics 用户购买数据,一组顶点定义用户,每个顶点一个用户。另一个集合定义产品,每个顶点一个产品。一条边将用户连接到产品,定义用户购买该产品。二分图有各种应用,如下所示:网络搜索引擎 - 在网络搜索引擎中,搜索日志被归档到数据用户查询和 ... 阅读更多

如何从高维数据中找到子空间聚类?

Ginni
更新于 2022年2月18日 07:30:18

347 次查看

已经有多种方法被归类为三大类,包括子空间搜索技术、基于相关性的聚类技术和双聚类技术。子空间搜索技术 - 子空间搜索方法搜索多个子空间的聚类。因此,聚类是在子空间中彼此相同的对象的子集。相似度是通过传统的度量获得的,包括距离或密度。例如,CLIQUE 算法是一种子空间聚类技术。它可以在维度递增序列中指定子空间和这些子空间中的聚类,并使用反单调性来剪枝其中不存在聚类的子空间。一个更大的 ... 阅读更多

什么是主动学习?

Ginni
更新于 2022年2月18日 07:25:56

442 次查看

主动学习是一种重复性的监督学习类型,与数据充足但类标签稀缺或获取成本高的情况相关。学习算法是主动的,因为它可以仔细地查询用户(例如,人工预言机)以获取标签。用于理解该方法的概念的多个元组小于典型监督学习中所需的数量。它用于保持成本降低,主动学习者的目标是利用尽可能少的标记示例来实现高精度。令 D 为正在考虑的所有数据。有几种方法 ... 阅读更多

什么是贝叶斯信念网络?

Ginni
更新于 2022年2月18日 07:24:24

871 次查看

朴素贝叶斯分类器假设类条件独立性,即,给定元组的类标签,属性的值被假设为彼此条件独立。这简化了计算。当假设影响真实时,因此朴素贝叶斯分类器与多个分类器相比效率更高。贝叶斯信念网络定义联合条件概率分布。它们允许在变量子集之间表示类条件独立性。它们支持因果关系的图形结构,学习可以在其上实现。训练后的贝叶斯信念网络用于分类。贝叶斯信念网络也称为 ... 阅读更多

如何可视化数据以支持交互式决策树构建?

Ginni
更新于 2022年2月18日 07:20:57

166 次查看

基于感知的分类 (PBC) 是一种基于多维可视化方法的交互式方法,允许用户在构建决策树时整合关于数据的背景知识。通过与数据进行视觉交互,用户更有可能对数据产生更深入的了解。生成的树可能比使用传统决策树归纳技术构建的树更小,因此更容易解释,同时实现大致相同的准确性。PBC 需要一种像素导向方法来考虑其类标签数据的多维数据。圆段方法被采用,它将 d 维信息对象映射到一个圆 ... 阅读更多

模式挖掘有哪些应用?

Ginni
更新于 2022年2月18日 07:19:16

2K+ 次查看

模式挖掘有各种应用,如下所示:模式挖掘通常用作多个数据密集型应用程序中的预处理中的噪声过滤和数据清理。例如,它可以用于探索微阵列数据,其中包含数万个维度(例如,描述基因)。模式挖掘有助于发现隐藏在数据中的内在机制和聚类。例如,给定 DBLP 数据集,频繁模式挖掘可以简单地发现有趣的聚类,例如合著者聚类(通过确定通常合作的作者)和会议聚类(通过确定多个作者和术语的共享)。这种架构 ... 阅读更多

数据立方体计算有哪些技术?

Ginni
更新于 2022年2月18日 07:17:14

7K+ 次查看

以下是有效计算数据立方体的一般优化技术,如下所示:排序、哈希和分组 - 必须将排序、哈希和分组操作用于维度属性以重新排序和聚类关联的元组。在立方体计算中,聚合是在共享相同维度值集的元组上实现的。因此,分析排序、哈希和分组服务以访问和分组此类数据以支持此类聚合的评估至关重要。它可以按分支、日期和项目计算总销售额。按分支和……对元组或单元进行排序可能更有效 阅读更多

数据挖掘与信息处理和联机分析处理有什么关系?

Ginni
更新于 2022年2月18日 07:15:30

960 次查看

数据仓库应用程序主要有三种类型:信息处理、分析处理和数据挖掘。信息处理 - 它提供查询、基本数值分析以及使用交叉表、表格、图表或图形进行文档记录的功能。数据仓库数据处理的现代趋势是开发低成本的基于 Web 的访问工具,并将其与 Web 浏览器集成。分析处理 - 它提供基本的 OLAP 操作,例如切片和切块、钻取、上卷和旋转。它通常处理历史信息,包括汇总形式和详细形式。在线分析处理相较于信息处理的主要优势在于对数据仓库数据进行多维信息分析。数据 ... 阅读更多

广告