什么是数据挖掘图和网络?


图定义了一类比集合、序列、格和树更通用的机制。在互联网和社交网络、数据网络、生物网络、生物信息学、化学信息学、计算机视觉以及多媒体和内容检索等方面,有着广泛的图应用。挖掘图和网络的应用如下:

图模式挖掘 - 它是在一个或一组图中挖掘频繁子图。挖掘图模式的方法多种多样,可以分为基于 Apriori 的方法和基于模式增长的方法。

它可以挖掘闭合图的集合,如果不存在合适的超图 g' 产生与 g 相同的支持计数,则图 g 是闭合的。此外,还有几种变体图模式,例如近似频繁图、连贯图和密集图。用户定义的约束可以深入到图模式挖掘阶段以提高挖掘效率。

网络的统计建模 - 网络包括一组节点,每个节点等价于与一组属性相关的对象,以及一组连接这些节点的边(或链接),描述对象之间的关系。

如果某些节点和链接属于相同的类型,则网络是同质的,包括朋友网络、合著者网络或互联网页面网络。如果节点和连接属于不同的类型,则网络是异质的,包括出版物网络(连接作者、会议、论文和文本)和医疗保健网络(连接医生、护士、患者、疾病和治疗方法)。

通过信息网络分析进行数据清洗、集成和验证 - 在大型网络中相互关联的数据的多个元素之间可能存在信息冗余。可以通过分析此类网络中的信息冗余,利用网络分析实现高质量的数据清洗、数据集成、数据验证和可信度搜索。

图和同质网络的聚类和分类 - 已经开发出基于大型网络的聚类分析方法,以揭示网络机制、查找隐藏的社区、中心节点和异常值,具体取决于网络拓扑机制及其相关属性。已经开发了几种类型的网络聚类方法,可以将其归类为分区、层次或基于密度的算法。

异质网络的聚类、排序和分类 - 异质网络包括多个类型的互连节点和连接。此类互连机制包含丰富的数据,可用于相互改进节点和链接,并将观察结果从一种类型传播到另一种类型。

此类异质网络的聚类和排序可以紧密结合在上下文中实现,其中聚类中排名靠前的节点在计算聚类凝聚力时比其排名较低的对应节点贡献更多。

更新时间:2022年2月18日

2K+ 浏览量

开启你的 职业生涯

通过完成课程获得认证

立即开始
广告

© . All rights reserved.