数据仓库和OLAP与数据挖掘有什么关系?
数据仓库和数据集市被广泛应用于各个领域。企业高管利用数据仓库和数据集市中的数据来实施数据分析并制定战略决策。在一些公司中,数据仓库被用作企业管理的计划-执行-评估“闭环”反馈系统的一个组成部分。
数据仓库广泛应用于银行业和金融服务业、消费品和零售分销行业以及受控制造业,包括按需生产。一般来说,数据仓库的使用时间越长,其发展程度就越高。这种演变贯穿于各个阶段。
最初,数据仓库通常用于生成文档和回答预定义的查询。它可以用来分析汇总和详细的信息,并将结果以文档和图表的形式显示。后来,数据仓库被用于战略目标,实施多维分析和复杂的切片和切块操作。
最后,数据仓库可以用于使用数据挖掘工具进行知识发现和战略决策。在这个框架中,数据仓库的工具可以分为访问和检索工具、数据库文档工具、数据分析工具和数据挖掘工具。
业务用户需要有方法来了解数据仓库中存在什么(通过元数据),如何创建数据仓库的内容,如何使用分析工具测试内容,以及如何显示此类分析的结果。
数据仓库应用主要有三种类型:信息处理、分析处理和数据挖掘。
**信息处理** - 它提供查询、基本统计分析和使用交叉表、表格、图表或图形进行文档编制。数据仓库数据处理的最新趋势是创建低成本的基于 Web 的访问工具,然后将其与 Web 浏览器统一起来。
**分析处理** - 它提供基本的 OLAP 操作,包括切片和切块、钻取、上卷和旋转。它通常对汇总和详细结构的历史信息进行操作。联机分析处理相对于数据处理的主要优势在于对数据仓库信息进行多维数据分析。
**数据挖掘** - 它通过查找隐藏的模式和关联、构建分析模型、实施分类和预测以及使用可视化工具显示挖掘结果来提供知识发现。
数据挖掘包含比 OLAP 更自动化和更深入的分析,预计数据挖掘将拥有更广泛的软件。数据挖掘可以帮助业务经理找到并接触到更合适的用户,并获得可以支持推动市场份额和提高利润的关键业务洞察力。