找到关于数据库的6705 篇文章

什么是稀疏化?

Ginni
更新于 2022年2月14日 13:01:09

482 次浏览

对于 m 个数据点的 m x m 邻近矩阵可以定义为一个密集图,其中每个节点都与其他一些节点连接,并且某些节点组之间边的权重遵循它们的成对邻近性。尽管每个对象都与其他每个对象具有一定的相似性,但对于大多数数据集而言,对象与少数对象非常相似,而与大多数其他对象则相似性较弱。此特性可用于稀疏化邻近图(矩阵),方法是在开始实际聚类过程之前将一些低相似性(高差异性)值设置为 0。稀疏化……阅读更多

基于图的聚类方法有哪些?

Ginni
更新于 2022年2月14日 12:59:00

1K+ 次浏览

将一组物理或抽象对象组合成相同对象类别的过程称为聚类。一个聚类是一组数据对象,这些对象在同一个聚类内彼此相同,并且与其他聚类中的对象不同。在许多应用中,一组数据对象可以被集体视为一个组。聚类分析是一项重要的活动。聚类有助于识别异常值。相同的值被组织成聚类,而那些落在聚类之外的值被称为异常值。聚类技术考虑数据元组……阅读更多

基于网格的聚类算法有哪些?

Ginni
更新于 2022年2月14日 12:31:29

2K+ 次浏览

网格是一种有效组织数据集的方法,至少在低维度下是这样。其概念是将每个属性的适用值划分为多个连续区间,形成一组网格单元。每个对象都落入其等效属性区间包含对象值的网格单元中。对象可以在一次遍历记录的过程中创建到网格单元中,并且还可以同时收集关于每个单元的数据,包括单元中的点数。有多种方法可以使用网格实现聚类,但大多数方法都基于……阅读更多

什么是SOM算法?

Ginni
更新于 2022年2月14日 12:27:03

338 次浏览

SOM 代表自组织特征映射。这是一种聚类和数据可视化技术,它依赖于神经网络的观点。不管 SOM 的神经网络基础如何,它都只是在原型聚类的修改背景下简单地呈现出来。SOM 算法如下:初始化质心。重复选择下一个对象。确定与该对象最接近的质心。刷新该质心以及邻近的质心,即在确定的邻域内。直到质心变化不大或达到阈值。将每个对象分配到其最近的质心,并恢复质心和聚类。初始化 - 此步骤(第 1 行)可以……阅读更多

什么是SOM?

Ginni
更新于 2022年2月14日 12:20:16

237 次浏览

SOM 代表自组织特征映射。这是一种聚类和数据可视化方法,依赖于神经网络的观点。SOM 的目标是发现一组质心(在 SOM 术语中为参考向量),并将数据集中每个对象分配到最能支持该对象接近度的质心。在神经网络方法中,每个质心都与一个神经元相关联。与增量 K 均值一样,数据对象一次处理一个,并刷新最近的质心。与 K 均值不同的是,SOM 对质心施加拓扑顺序,并且还升级附近的质心……阅读更多

什么是基于原型的聚类?

Ginni
更新于 2022年2月14日 12:18:15

2K+ 次浏览

在基于原型的聚类中,聚类是一组对象,其中某个对象比其他聚类的原型更接近代表该聚类的原型。一个简单的基于原型的聚类算法,它需要聚类中元素的质心作为聚类的原型。基于原型的聚类有以下几种方法:允许对象属于多个聚类。此外,一个对象属于每个聚类都有一定的权重。这种方法解决了某些对象与多个聚类原型同样接近的事实。一个聚类是……阅读更多

聚类算法的特性是什么?

Ginni
更新于 2022年2月14日 12:16:41

3K+ 次浏览

聚类算法有以下几种特性:顺序依赖性 - 对于某些算法,产生的特征和聚类数量可能会根据处理数据的顺序而变化,甚至可能差异很大。虽然阻止此类算法似乎是可取的,但有时顺序依赖性关联较小,或者算法可能具有一些理想的特性。非确定性 - 包括 K 均值在内的聚类算法不依赖于顺序,但它们每次运行都会产生多个结果,因为它们基于需要随机选择的初始化步骤。因为聚类的特性可能从一个……阅读更多

聚类的元素是什么?

Ginni
更新于 2022年2月14日 12:14:45

693 次浏览

将一组物理或抽象对象组合成相同对象类别的过程称为聚类。一个聚类是一组数据对象,这些对象在同一个聚类内彼此相同,并且与其他聚类中的对象不同。在许多应用中,一组数据对象可以被集体视为一个组。聚类分析是一项重要的活动。聚类分析用于根据对这些记录进行的各种度量形成相同记录的组或聚类。关键设计是定义聚类在……阅读更多

什么是数据特征?

Ginni
更新于 2022年2月14日 12:13:01

2K+ 次浏览

以下是一些可以强烈影响聚类分析的数据特征:高维性 - 在高维数据集中,传统的欧几里得密度概念(即每单位体积的点数)变得重要。人们认为,随着维数的增加,体积呈指数增长,除非点数也随维数呈指数增长,否则密度趋于 0。它还可以使邻近性在高维空间中变得更加均匀。考虑这一事实的另一种方法是,有更多维度(属性)有助于邻近性……阅读更多

K-Means 和 DBSCAN 之间的区别是什么?

Ginni
更新于 2022年2月14日 12:10:58

9K+ 次浏览

K-Means K-means 聚类是一种划分算法。K-means 将数据集中的每个数据重新分配到新形成的聚类之一。使用距离或相似性度量将数据或数据点分配到相邻的聚类。在 k-means 中,一个对象被分配到最接近的中心。它可以定义不能连接的约束,并且它将 k-means 中的中心分配过程修改为最接近的适用中心分配。当对象依次分配到中心时,在每个步骤中,它都可以提供迄今为止的分配不会破坏某些不能连接的约束。一个对象被分配到最接近的中心……阅读更多

广告