找到关于数据结构的1861 篇文章

什么是凝聚层次聚类?

Ginni
更新于 2022年2月14日 11:36:52

3K+ 次浏览

凝聚层次聚类是一种自下而上的聚类方法,其中集群包含子集群,子集群依次包含子集群,等等。它从将每个对象放在其自己的集群开始,然后将这些原子集群组合成越来越大的集群,直到某些对象在一个集群中,或者直到满足某个确定的终止条件。几种层次聚类方法都用到这种类型。它们的区别仅在于它们对集群间相似性的描述。例如,一种称为 AGNES(凝聚嵌套)的方法使用单链接技术,其操作如下。假设有一组对象放置在一个矩形中。最初,每个对象……阅读更多

什么是二分 K 均值?

Ginni
更新于 2022年2月14日 11:32:59

5K+ 次浏览

二分 K 均值算法是对基本 K 均值算法的一个简单改进,它基于一个简单的概念:为了获得 K 个集群,将一组点分成两个集群,选择其中一个集群进行分割,依次类推,直到产生 K 个集群。K 均值算法输入参数 k,并将 n 个对象的集合分成 k 个集群,以便生成的集群内相似度高,而集群间相似度低。集群相似度是根据集群中对象的平均值来评估的,这可以看作是集群的……阅读更多

数据挖掘中 K 均值算法的附加问题有哪些?

Ginni
更新于 2022年2月14日 10:26:01

9K+ 次浏览

K 均值算法有各种问题,如下所示:处理空集群 - 之前给出的基本 K 均值算法的第一个问题是,如果在分配阶段没有点分配给集群,则可能会获得空集群。如果发生这种情况,则需要一种方法来选择替换质心,因为平方误差将大于必要值。一种方法是选择距离某个最近质心最远的点。如果这去除了当前贡献一些总平方误差的点。另一种方法是选择替换……阅读更多

什么是 K 均值聚类?

Ginni
更新于 2022年2月14日 10:20:04

5K+ 次浏览

K 均值聚类是最常见的划分算法。K 均值将数据集中的每个数据重新分配到新形成的集群中的一个。使用距离或相似性度量将记录或数据点分配到最近的集群。K 均值算法创建输入参数 k,并将 n 个对象的集合分成 k 个集群,以便生成的集群内相似度高,而集群间相似度低。集群相似度是根据集群中对象的平均值来计算的,这可以看作是集群的质心或重心。有……阅读更多

数据挖掘中的集群类型有哪些?

Ginni
更新于 2022年2月14日 10:01:41

588 次浏览

聚类分析用于根据对这些记录进行的各种度量形成相同记录的组或集群。它可以以对分析目标有益的方式定义集群。此数据已用于多个领域,例如天文学、考古学、医学、化学、教育、心理学、语言学和社会学。有各种类型的集群,如下所示:良好分离 - 集群是一组对象,其中每个元素都比集群之外的某些对象更接近集群中的其他每个元素。有时可以使用阈值……阅读更多

数据挖掘中的聚类类型有哪些?

Ginni
更新于 2022年2月14日 09:59:59

1K+ 次浏览

有各种类型的聚类,如下所示:层次与划分 - 几种聚类类型之间的区别在于集群集是嵌套的还是非嵌套的,或者用流行的术语来说,是层次的还是划分的。划分聚类是将数据对象组分成非重叠子集(集群)的分布,其中每个数据对象都恰好在一个子集中。它允许集群具有子集群,因此需要层次聚类,这是一组嵌套的集群,被分配为树。树中每个节点(集群)(除叶节点外)都是……阅读更多

数据挖掘中聚类的示例有哪些?

Ginni
更新于 2022年2月14日 09:56:26

4K+ 次浏览

将一组物理或抽象对象组合成相同对象的类别的过程称为聚类。集群是一组数据对象,这些对象在同一集群内彼此相同,并且与其他集群中的对象不同。在许多应用程序中,一组数据对象可以被集体视为一个组。聚类分析是一项重要的日常活动。聚类分析用于根据对这些记录进行的各种度量形成相同记录的组或集群。关键设计是定义集群……阅读更多

基于支持期望的技术有哪些?

Ginni
更新于 2022年2月14日 09:54:31

94 次浏览

有两种方法可以使用(概念层次结构和一种称为间接关联的基于邻域的方法)来确定模式的预期支持。基于概念层次结构的支持期望仅靠客观衡量不足以去除无趣的低频模式。例如,考虑面包和笔记本电脑是频繁出现的商品。即使项目集{面包,笔记本电脑}不频繁且可能负相关,它也不是令人感兴趣的,因为它们的缺乏支持对领域专家来说是显而易见的。因此,需要一种主观的方法来确定预期支持,以避免生成这种不频繁的模式。基于间接关联的支持期望考虑一对项目……阅读更多

挖掘负模式的技术有哪些?

Ginni
更新于 2022年2月14日 09:52:28

259 次浏览

为挖掘低频模式而产生的第一类技术将每个项目视为对称二元变量。事务信息可以通过使用负项目对其进行增强来二值化。它显示了将初始数据更改为具有正负项目的交易的实例。通过对增广事务使用包括 Apriori 在内的当前频繁项目集生成算法,可以派生一些负项目集。这种方法只有在将多个变量视为对称二元(即,它被视为仅包含少量项目否定的负模式)时才有可能。如果每个项目应该……阅读更多

什么是规范标签?

Ginni
更新于 2022年2月11日 13:45:01

396 次浏览

处理图同构问题的标准方法是将每个图映射到一个特定的字符串表示形式,称为其代码或规范标签。规范标签具有这样的属性:如果两个图同构,则它们的代码应该相等。此属性使我们能够通过分析图的规范标签来测试图同构。构建图规范标签的第一阶段是发现图的邻接矩阵描述。它显示了给定图的此类矩阵的一个实例。一个图可以有多个邻接矩阵……阅读更多

广告