什么是网络挖掘的类型?


网络挖掘定义了使用数据挖掘技术从网络数据中提取有益模式、趋势和数据的过程,通常借助于网络,处理来自基于网络的记录和服务、服务器日志和超链接的数据。网络挖掘的主要目标是通过收集和分析数据来发现网络数据中的模式,从而获得重要的见解。

网络挖掘可以被广泛地视为将改进后的数据挖掘方法应用于网络,而数据挖掘则表示为应用算法在一个知识发现过程中,在主要结构化的数据中寻找模式。

网络挖掘具有支持多个数据类型集合的独特属性。网络具有多个方面,为挖掘过程提供了多种方法,例如包含文本的网页、通过超链接连接的网页以及可以通过网络服务器日志监控的用户活动。

网络挖掘有多种类型,如下所示:

网络内容挖掘 - 网络内容挖掘是网络挖掘的一种过程,它从网站 (WWW) 中提取重要的描述性数据。内容包括音频、视频、文本文档、超链接和结构化记录。网络内容旨在以文本、列表、图像、视频和表格的形式向用户提供记录。

内容挖掘的功能是数据提取,其中结构化数据是从非结构化网站复制的。目标是通过利用提取的结构化数据,支持对多个网站的数据聚合。

网络结构挖掘 - 网络结构挖掘是网络挖掘的核心技术之一,它处理超链接结构。结构挖掘本质上显示了网站的结构化摘要。它识别网站中链接网页之间的关系。

网络挖掘只是从网络挖掘信息的数据挖掘。有几种算法技术用于从网络查找数据。结构挖掘分析网站的超链接以汇集信息记录并将其分类为相似性和关系等元素。页面内挖掘是在文档级别实现的一种挖掘类型,而超链接级别挖掘称为页面间挖掘。

网络使用挖掘 - 网络使用挖掘用于从 Web 日志数据中提取有用的记录、信息、知识,并有助于识别用户对网页的访问模式。

在挖掘中,对 Web 资源的使用,个人会考虑网站访问者的请求记录,这些记录通常作为 Web 服务器日志收集。虽然网页集的内容和架构遵循网页作者的意图,但单个请求显示了用户如何查看这些网页。网络使用挖掘可能会揭示网页创建者未提出的关系。

更新于:2022年2月15日

8K+ 浏览量

启动您的职业生涯

完成课程获得认证

开始学习
广告