数据挖掘的历史是什么?


数据挖掘是从存储在存储库中的大量数据中转移,使用包括统计和数学技术在内的模式识别技术,查找有用的新关联、模式和趋势的过程。它是对事实数据集的分析,以发现意想不到的关系,并以对数据所有者来说既合乎逻辑又有所帮助的新方法总结记录。

它是选择、探索和建模大量信息以查找最初未知的规律或关系的过程,以获得对数据库所有者来说清晰且有益的结果。

数据挖掘类似于数据科学。它由一个人在特定情况下对特定数据集进行,并具有目标。此阶段包含多种类型的服务,包括文本挖掘、网络挖掘、音频和视频挖掘、图像数据挖掘和社交媒体挖掘。它是通过简单或高度特定的软件完成的。

通过外包数据挖掘,所有工作都可以更快地完成,并且运营成本较低。特定公司还可以使用新技术来保存手动无法找到的数据。多个平台上提供了大量数据,但可访问的知识却非常有限。

在数据中查找有用模式的方法已被赋予多个名称,包括数据挖掘、知识提取、数据发现、数据收集、数据考古和数据模式处理。数据挖掘已被统计学家、数据分析师和管理信息系统 (MIS) 社区使用。

它还在数据库领域获得了越来越多的关注。知识发现于数据库的过程是在 1989 年的第一次 KDD 研讨会上发明的(Piatetsky-Shapiro 1991),以维护知识是数据驱动发现的最终产品。它在人工智能和机器学习领域得到了推广。

KDD 定义了从数据中发现有用知识的完整过程,而数据挖掘定义了此过程中的特定步骤。数据挖掘是应用特定算法从数据中提取模式。KDD 过程与数据挖掘步骤(在该过程中)之间的差异是此对象的中心点。

KDD 过程中的后续步骤,包括数据准备、数据选择、数据清理、结合适当的先验知识以及对挖掘结果的适当分析,对于确保从数据中获得有用的知识至关重要。

盲目应用数据挖掘技术(在统计文献中被正确地称为数据挖掘)可能是一项危险的活动,很容易导致发现毫无意义和无效的设计。

更新时间: 2021 年 11 月 24 日

886 次浏览

开启您的职业生涯

通过完成课程获得认证

开始
广告