数据挖掘与信息处理和联机分析处理有什么关系?
数据仓库应用程序有三种类型,例如信息处理、分析处理和数据挖掘。
信息处理 - 它提供查询、基本数值分析和使用交叉表、表格、图表或图形进行文档记录。数据仓库数据处理的现代趋势是创建低成本的基于 Web 的访问工具,使其与 Web 浏览器集成。
分析处理 - 它提供基本的 OLAP 操作,例如切片和切块、钻取、汇总和透视。它通常处理以汇总和详细形式存在的历史信息。联机分析处理相对于信息处理的主要领域是数据仓库数据的多维信息分析。
数据挖掘 - 它通过发现隐藏的模式和关联、创建分析模型、实现分类和预测以及使用可视化工具显示挖掘结果来提供知识发现。
信息处理基于查询,可以发现有用的数据。对这些查询的答案直接反映数据库中保存的数据或可由聚合服务计算得出。它们不反映数据库中隐藏的复杂设计或可预测性。因此,信息处理不是数据挖掘。
联机分析处理更接近数据挖掘,因为它可以更改从数据仓库的用户定义子集中以多种粒度汇总的数据。OLAP 和数据挖掘的服务可以被认为是不相交的 -
OLAP 是一种数据汇总/聚合工具,支持轻松的数据分析,而数据挖掘能够自动发现大量数据中隐藏的隐式设计和有趣的知识。
OLAP 工具的目标是简化和提供交互式数据分析,而数据挖掘工具的目标是尽可能地自动化该过程,同时允许用户支持该过程。通过这种方式,数据挖掘比传统的联机分析处理更进一步。
可以采用数据挖掘的另一种观点,其中数据挖掘涵盖数据定义和数据建模。由于 OLAP 系统可以显示来自数据仓库的信息的一般定义,因此 OLAP 服务本质上用于用户导向的数据汇总和比较(通过钻取、透视、切片、切块等)。
数据挖掘不仅限于分析存储在数据仓库中的数据。它可以探索比数据仓库中支持的汇总记录更详细的粒度级别存在的数据。
它还可以探索事务性、空间、文本和多媒体记录,这些记录难以使用现代多维数据库技术建模。在这种情况下,在数据挖掘服务和管理的数据的复杂性方面,数据挖掘涵盖比 OLAP 更广泛的范围。