数据挖掘背后的动机是什么?
数据挖掘是通过共享存储在存储库中的大量数据,使用包括统计和数学技术在内的模式识别技术,发现有用的新关联、模式和趋势的过程。它是对事实数据集的分析,以发现意想不到的关系,并以对数据所有者而言既合乎逻辑又有帮助的新颖方式总结记录。
它是选择、探索和建模大量信息以查找最初未知的规律或关系以获得对数据库所有者而言清晰且有益的结果的过程。
它不仅限于使用计算机算法或统计技术。它是一个商业智能过程,可以与信息技术一起用于支持公司决策。
数据挖掘类似于数据科学。它由一个人在特定情况下对特定数据集进行,并具有特定目标。此阶段包含多种类型的服务,包括文本挖掘、网络挖掘、音频和视频挖掘、图像数据挖掘和社交媒体挖掘。它是通过简单或高度特定的软件完成的。
近年来,数据挖掘在信息市场和整个社会中引起了极大的关注,这是因为大量数据的广泛可用性和迫切需要将此类数据转化为有益的数据和知识。获得的信息和知识可用于从行业分析、欺诈检测和用户留存到生产控制和科学探索等各种软件。
数据挖掘可以被认为是数据技术自然发展的结果。数据库系统市场已支持以下功能的演化方向,包括数据收集和数据库创建、数据管理和高级数据分析。
例如,最近数据收集和数据库创建结构的发展为后来开发有效的结构以进行数据存储和检索以及查询和事务处理奠定了必要的基础。随着各种数据库系统将查询和事务处理作为通用实践,高级数据分析已发展成为下一个目标。
数据可以存储在多种类型的数据库和数据存储库中。一个出现在数据仓库中的数据存储库结构,它是位于单个站点处的多个异构数据源的存储库,这些数据源在统一的模式下组织,以支持管理决策制定。
数据仓库技术涉及数据清理、数据集成和联机分析处理 (OLAP),特别是具有汇总、整合和聚合等功能的分析技术,以及从多个角度查看数据的能力。
广告