什么是基于原型的聚类？

数据挖掘数据库数据结构

在基于原型的聚类中，一个簇是一组对象，其中某些对象更接近于代表该簇的原型，而不是更接近于其他簇的原型。一个简单的基于原型的聚类算法，需要簇中元素的中心作为簇的原型。

基于原型的聚类有各种方法，如下所示：

对象可以属于多个簇。此外，一个对象属于每个簇都有一定的权重。这种方法解决了某些对象与多个簇原型同样接近的事实。
一个簇被建模为一个统计分布，即对象是由一个统计分布中的随机相位产生的，该分布的特征是多个统计参数，包括均值和方差。这种观点概括了原型的概念，并允许使用完善的统计方法。
簇被限制为具有恒定的关联性。这些关系是约束，定义了邻域关系，例如两个簇彼此邻近的程度。约束簇之间的关系可以定义数据的执行和可视化。

模糊C均值利用模糊逻辑和模糊集理论中的概念来提出一种聚类设计，它类似于K均值，但不需要将一个点硬性分配到一个簇中。

混合模型聚类采用了一种方法，即一组簇可以建模为分布的组合，每个簇一个。聚类方案依赖于自组织映射（SOM），在需要簇彼此具有预先指定关联性的结构（包括二维网格结构）中实现聚类。

**模糊聚类** - 如果数据对象分布在独立性良好的集合中，那么将对象清晰地划分为不相交的簇似乎是一种理想的方法。但在某些情况下，数据集中的对象不能被划分为独立性良好的簇，并且在将对象分配到特定簇时会存在一定的任意性。

考虑一个位于两个簇边界附近的对象，但更接近其中一个簇。在某些情况下，为每个对象和每个簇分配一个权重可能更合适，该权重表示对象属于该簇的程度。

概率方法也可以支持这样的权重。虽然概率方法在多种情况下都很有益，但在某些时候，确定合适的统计模型很复杂。在一般情况下，需要非概率聚类方法来提供相同的功能。

Ginni

更新于： 2022年2月14日

2K+ 浏览量

开启你的职业生涯

通过完成课程获得认证

广告

© . All rights reserved.