对于 m 个数据点的 m x m 邻近矩阵可以定义为一个密集图,其中每个节点都与其他一些节点连接,并且某些节点组之间边的权重遵循它们的成对邻近性。尽管每个对象都与其他每个对象具有一定的相似性,但对于大多数数据集而言,对象与少数对象非常相似,而与大多数其他对象则相似性较弱。此特性可用于稀疏化邻近图(矩阵),方法是在开始实际聚类过程之前将一些低相似性(高差异性)值设置为 0。稀疏化……阅读更多
SOM 代表自组织特征映射。这是一种聚类和数据可视化技术,它依赖于神经网络的观点。不管 SOM 的神经网络基础如何,它都只是在原型聚类的修改背景下简单地呈现出来。SOM 算法如下:初始化质心。重复选择下一个对象。确定与该对象最接近的质心。刷新该质心以及邻近的质心,即在确定的邻域内。直到质心变化不大或达到阈值。将每个对象分配到其最近的质心,并恢复质心和聚类。初始化 - 此步骤(第 1 行)可以……阅读更多
SOM 代表自组织特征映射。这是一种聚类和数据可视化方法,依赖于神经网络的观点。SOM 的目标是发现一组质心(在 SOM 术语中为参考向量),并将数据集中每个对象分配到最能支持该对象接近度的质心。在神经网络方法中,每个质心都与一个神经元相关联。与增量 K 均值一样,数据对象一次处理一个,并刷新最近的质心。与 K 均值不同的是,SOM 对质心施加拓扑顺序,并且还升级附近的质心……阅读更多