什么是基于原型的聚类?
在基于原型的聚类中,一个簇是一组对象,其中某些对象更接近于代表该簇的原型,而不是更接近于其他簇的原型。一个简单的基于原型的聚类算法,需要簇中元素的中心作为簇的原型。
基于原型的聚类有各种方法,如下所示:
对象可以属于多个簇。此外,一个对象属于每个簇都有一定的权重。这种方法解决了某些对象与多个簇原型同样接近的事实。
一个簇被建模为一个统计分布,即对象是由一个统计分布中的随机相位产生的,该分布的特征是多个统计参数,包括均值和方差。这种观点概括了原型的概念,并允许使用完善的统计方法。
簇被限制为具有恒定的关联性。这些关系是约束,定义了邻域关系,例如两个簇彼此邻近的程度。约束簇之间的关系可以定义数据的执行和可视化。
模糊C均值利用模糊逻辑和模糊集理论中的概念来提出一种聚类设计,它类似于K均值,但不需要将一个点硬性分配到一个簇中。
混合模型聚类采用了一种方法,即一组簇可以建模为分布的组合,每个簇一个。聚类方案依赖于自组织映射(SOM),在需要簇彼此具有预先指定关联性的结构(包括二维网格结构)中实现聚类。
**模糊聚类** - 如果数据对象分布在独立性良好的集合中,那么将对象清晰地划分为不相交的簇似乎是一种理想的方法。但在某些情况下,数据集中的对象不能被划分为独立性良好的簇,并且在将对象分配到特定簇时会存在一定的任意性。
考虑一个位于两个簇边界附近的对象,但更接近其中一个簇。在某些情况下,为每个对象和每个簇分配一个权重可能更合适,该权重表示对象属于该簇的程度。
概率方法也可以支持这样的权重。虽然概率方法在多种情况下都很有益,但在某些时候,确定合适的统计模型很复杂。在一般情况下,需要非概率聚类方法来提供相同的功能。
广告