找到 413 篇文章 关于数据挖掘

K-Means 和 DBSCAN 之间的区别是什么?

Ginni
更新于 2022年2月14日 12:10:58

9K+ 次浏览

K-Means K-means 聚类是一种划分算法。K-means 将数据集中的每个数据重新分配到新形成的其中一个集群中。使用距离或相似性度量将数据或数据点分配给最近的集群。在 k-means 中,一个对象被生成到最近的中心。它可以定义不能链接的约束,并且它将 k-means 中的中心分配过程修改为最近的适用中心分配。当对象按顺序创建到中心时,在每个步骤中,它都可以提供到目前为止的分配不会破坏某些不能链接的约束。一个对象被创建到最近的中心…… 阅读更多

层次聚类中的元素是什么?

Ginni
更新于 2022年2月14日 11:39:03

199 次浏览

层次聚类方法通过将数据对象合并到集群树中来运行。层次聚类算法是自上而下或自下而上的。精确的层次聚类技术的特征在于其缺乏执行调整的能力,因为合并或拆分决策已完成。层次聚类有各种元素,如下所示:缺乏全局目标函数凝聚层次聚类方法使用多个元素来在每个步骤中局部决定必须合并哪些集群(或对于分裂方法而言必须分裂哪些集群)。这种方法产生了聚类算法,这些算法避免了尝试解决复杂的组合优化问题的困难。能够处理…… 阅读更多

什么是凝聚层次聚类?

Ginni
更新于 2022年2月14日 11:36:52

3K+ 次浏览

凝聚层次聚类是一种自下而上的聚类方法,其中集群具有子集群,子集群依次具有子集群,等等。它从将每个对象放在其自己的集群中开始,然后将这些原子集群组合成越来越高的集群,直到某些对象在一个集群中或直到满足特定的终止条件。几种层次聚类方法被用于此。它们仅在其对集群间相似性的描述上有所不同。例如,一种称为 AGNES(凝聚嵌套)的方法使用单链接技术并按如下方式操作。假设有一组对象放在一个矩形中。最初,每个对象…… 阅读更多

什么是二分 K-Means?

Ginni
更新于 2022年2月14日 11:32:59

5K+ 次浏览

二分 K-means 算法是基本 K-means 算法的一个简单改进,它依赖于一个简单的概念,例如为了获得 K 个集群,将一些点的集合分成两个集群,选择其中一个集群进行分割,等等,直到产生 K 个集群。k-means 算法产生输入参数 k,并将 n 个对象集合划分为 k 个集群,以便得到的集群内相似性高,而集群间相似性低。集群相似性是根据集群中对象的平均值来评估的,这可以看作是集群的…… 阅读更多

数据挖掘中 K-Means 算法的其他问题是什么?

Ginni
更新于 2022年2月14日 10:26:01

9K+ 次浏览

K-Means 算法有各种问题,如下所示:处理空集群 - 给定先验的基本 K-means 算法的第一个问题是,如果在分配阶段没有点分配给集群,则可以获得空集群。如果发生这种情况,则需要一种方法来选择替代质心,因为平方误差将大于必要值。一种方法是选择距离某些最近质心最远的点。如果这去除了当前导致某些总平方误差的点。另一种方法是选择替代…… 阅读更多

什么是 K-means 聚类?

Ginni
更新于 2022年2月14日 10:20:04

5K+ 次浏览

K-means 聚类是最常见的划分算法。K-means 将数据集中的每个数据重新分配到新形成的其中一个集群中。使用距离或相似性度量将记录或数据点分配给最近的集群。k-means 算法创建输入参数 k,并将 n 个对象的组划分为 k 个集群,以便得到的集群内相似性很大,而集群间相似性低。集群相似性是根据集群中对象的平均值来计算的,这可以看作是集群的质心或重心。有…… 阅读更多

数据挖掘中有哪些类型的集群?

Ginni
更新于 2022年2月14日 10:01:41

588 次浏览

聚类分析用于根据对这些记录进行的各种度量形成相同记录的组或集群。它可以以对分析目标有益的方式定义集群。此数据已用于多个领域,例如天文学、考古学、医学、化学、教育、心理学、语言学和社会学。有各种类型的集群,如下所示:完全分离的 - 集群是一组对象,其中每个元素都比集群外的某些对象更接近集群中的其他每个元素。有时可以使用阈值…… 阅读更多

数据挖掘中有哪些类型的聚类?

Ginni
更新于 2022年2月14日 09:59:59

1K+ 次浏览

有各种类型的聚类,如下所示:层次聚类与划分聚类 - 不同类型聚类之间的区别在于集群集是嵌套的还是非嵌套的,或者用流行术语来说,是层次的还是划分的。划分聚类是将数据对象组划分为不重叠的子集(集群),其中每个数据对象都恰好位于一个子集中。它允许集群具有子集群,因此需要层次聚类,它是一组嵌套的集群,被分配为树。树中的每个节点(集群)(叶子节点除外)都是…… 阅读更多

数据挖掘中聚类的例子有哪些?

Ginni
更新于 2022年2月14日 09:56:26

4K+ 次浏览

将一组物理或抽象对象组合成相同对象的类的过程称为聚类。集群是一组数据对象,这些对象在同一个集群内彼此相同,并且与其他集群中的对象不同。在许多应用中,一组数据对象可以作为一个组被集体考虑。聚类分析是一项重要的活动。聚类分析用于根据对这些记录进行的各种度量形成相同记录的组或集群。关键设计是定义集群…… 阅读更多

基于支持期望的技术有哪些?

Ginni
更新于 2022年2月14日 09:54:31

94 次浏览

确定模式预期支持度有两种方法:(a)基于概念层次的方法和(b)基于邻域的间接关联方法。基于概念层次的支持度预期仅仅依靠客观度量无法充分去除无趣的低频模式。例如,面包和笔记本电脑是高频项。即使项集{面包,笔记本电脑}是低频的,并且可能存在负相关,它也不是令人感兴趣的,因为其支持度不足对领域专家来说是显而易见的。因此,需要一种主观方法来决定预期支持度,以防止生成此类低频模式。基于间接关联的支持度预期考虑一对项,……阅读更多

广告