找到 6705 篇文章 相关数据库

层次聚类中的元素是什么?

Ginni
更新于 2022年2月14日 11:39:03

199 次查看

层次聚类方法通过将数据对象合并到一个聚类树中来运行。层次聚类算法是自顶向下或自底向上的。准确的层次聚类技术的特征由于其缺乏执行调整而退化,因为合并或拆分决策已完成。层次聚类有各种元素,如下所示-缺乏全局目标函数凝聚层次聚类方法使用几个元素在每个步骤中局部决定哪些聚类必须合并(或对于分裂方法进行分裂)。此方法产生聚类算法,以防止承担解决复杂组合优化问题的难度。能够处理... 阅读更多

什么是凝聚层次聚类?

Ginni
更新于 2022年2月14日 11:36:52

3K+ 次查看

凝聚层次聚类是一种自底向上的聚类方法,其中聚类具有子聚类,子聚类依次具有子聚类,依此类推。它从将每个对象放在其聚类中开始,然后将这些原子聚类组合成越来越高的聚类,直到某些对象在一个聚类中或直到它需要一个明确的终止条件。几种层次聚类方法用于此类型。它们仅在其对聚类间相似性的描述中有所不同。例如,一种称为 AGNES(凝聚嵌套)的方法需要单链接技术并按如下方式运行。假设有一组对象放置在一个矩形中。最初,每个对象... 阅读更多

什么是二分 K 均值?

Ginni
更新于 2022年2月14日 11:32:59

5K+ 次查看

二分 K 均值算法是基本 K 均值算法的一个简单发展,它依赖于一个简单的概念,例如为了获得 K 个聚类,将一些点的集合分成两个聚类,选择其中一个聚类进行分裂,依此类推,直到产生 K 个聚类。k 均值算法生成输入参数 k,并将 n 个对象的一个集合划分为 k 个聚类,以便产生的聚类内相似性高,但聚类间类比低。聚类相似性是根据聚类中对象的平均值计算的,可以将其视为聚类的... 阅读更多

数据挖掘中 K 均值算法的附加问题有哪些?

Ginni
更新于 2022年2月14日 10:26:01

9K+ 次查看

K 均值算法有各种问题,如下所示-处理空聚类-之前给出的基本 K 均值算法的第一个问题是,如果在分配阶段没有将任何点分配给聚类,则可能会获得空聚类。如果发生这种情况,则需要一种方法来选择替换质心,因为平方误差将大于必要。一种方法是选择距某个最近质心最远的点。如果这去除了当前贡献某些总平方误差的点。另一种方法是选择替换... 阅读更多

什么是 K 均值聚类?

Ginni
更新于 2022年2月14日 10:20:04

5K+ 次查看

K 均值聚类是最常见的划分算法。K 均值将数据集中的每个数据重新分配到新形成的聚类中的一个。使用距离或相似性度量将记录或数据点分配到最近的聚类。k 均值算法创建输入参数 k,并将 n 个对象的组划分为 k 个聚类,以便产生的聚类内相似性大,但聚类间类比低。聚类相似性是关于聚类中对象的平均值计算的,可以将其视为聚类的质心或重心。有... 阅读更多

数据挖掘中聚类的类型有哪些?

Ginni
更新于 2022年2月14日 10:01:41

588 次查看

聚类分析用于根据对这些记录进行的各种测量形成相同记录的组或聚类。它可以以有利于分析目标的方式定义聚类。此数据已用于多个领域,例如天文学、考古学、医学、化学、教育、心理学、语言学和社会学。有各种类型的聚类,如下所示-分离良好-聚类是一组对象,其中每个元素都比不在聚类中的某个对象更靠近聚类中的每个其他元素。有时可以使用阈值... 阅读更多

数据挖掘中聚类的类型有哪些?

Ginni
更新于 2022年2月14日 09:59:59

1K+ 次查看

有各种类型的聚类,如下所示-层次聚类与划分聚类-几种聚类类型之间的感知是聚类集是嵌套的还是非嵌套的,或者用流行的术语来说,是层次的还是划分的。划分聚类是将数据对象组划分为不重叠的子集(聚类),包括每个数据对象确实在一个子集中。它可以允许聚类具有子聚类,因此需要层次聚类,它是一组嵌套的聚类,被分配为树。树中每个节点(聚类)(除了叶节点)是... 阅读更多

数据挖掘中聚类的例子有哪些?

Ginni
更新于 2022年2月14日 09:56:26

4K+ 次查看

将一组物理或抽象对象组合成相同对象的类的过程称为聚类。聚类是一组数据对象,这些数据对象在同一聚类内彼此相同,并且与其他聚类中的对象不同。在许多应用程序中,一组数据对象可以被视为一个组。聚类分析是一项重要的活动。聚类分析用于根据对这些记录进行的各种测量形成相同记录的组或聚类。关键设计是定义聚类... 阅读更多

基于支持期望的技术有哪些?

Ginni
更新于 2022年2月14日 09:54:31

94 次查看

有两种方法可以使用(概念层次结构和称为间接关联的基于邻域的方法)来确定模式的预期支持。基于概念层次结构的支持期望仅靠客观测量不足以消除无趣的非频繁模式。例如,考虑面包和笔记本电脑是频繁项目。即使项目集 {面包,Iaptop conputer} 不频繁并且可能负相关,它也不令人着迷,因为它们缺乏支持对领域专家来说是显而易见的。因此,需要一种主观方法来决定预期支持,以防止生成此类非频繁模式。基于间接关联的支持期望考虑一对项目,... 阅读更多

挖掘负模式的技术有哪些?

Ginni
更新于 2022年2月14日 09:52:28

259 次查看

为挖掘非频繁模式而产生的第一类技术将每个项目视为一个对称二元变量。事务信息可以通过使用负项目对其进行增强来二值化。它显示了一个将初始数据更改为具有正负项目的交易的实例。通过在增强的事务上使用包括 Apriori 在内的当前频繁项目集生成算法,可以导出一些负项目集。这种方法仅在将几个变量视为对称二元(即,它用于包含仅少量项目的否定项的负模式)时才有可能。如果每个项目应该... 阅读更多

广告