数据挖掘中聚类的例子有哪些?
将一组物理或抽象对象组合成相同对象的类别的过程称为聚类。聚类是一组数据对象,这些数据对象在同一聚类中彼此相同,并且与其他聚类中的对象不同。在许多应用中,一组数据对象可以被视为一个集体。聚类分析是一项重要的人类活动。
聚类分析用于根据对这些记录进行的各种度量形成相同记录的组或聚类。关键设计是以对分析目标有用的方式定义聚类。这些数据已在多个领域使用,例如天文学、考古学、医学、化学、教育、心理学、语言学和社会学。
以下是一些聚类的示例:
生物学 - 生物学家花费数年时间创建了所有生物(如界、门、纲、目、科、属和种)的分类法(分层分类)。因此,一些早期聚类分析工作试图创建一种数值分类学科,该学科可以找到这种分类结构也就不足为奇了。
此外,生物学家已使用聚类来分析可访问的大量遗传数据。例如,聚类已被用于发现具有相同功能的基因组。
信息检索 - 万维网包含数十亿个网页,对搜索引擎的查询结果可以恢复数百万个网页。聚类可用于将这些搜索结果分组为几个聚类,每个聚类都代表查询的特定方面。
例如,“电影”查询可以恢复合并到包括评论、预告片、明星和影院等类别的网页。每个聚类都可以细分为子类别(子聚类),形成支持用户分析查询结果的分层结构。
气候 - 它可以学习地球的气候,需要发现大气和海洋中的模式。聚类分析已被用于发现极地地区和对陆地气候具有重要影响的海洋区域的大气压力的模式。
心理学和医学 - 疾病或病症通常有多种变化,聚类研究可用于识别这些多种亚型。例如,聚类可用于识别几种类型的抑郁症。聚类分析还用于识别疾病的空间或时间分配模式。
商业 - 企业收集大量有关现有和潜在用户的数据。它通常用于将用户细分为少量团队,以便进行更多分析和营销活动。
广告