数据挖掘中的OLAP工具有哪些?


OLAP 工具主要分为三类,如下所示:

MOLAP − MOLAP 代表多维 OLAP。它支持元组作为数据存储单元。MOLAP 应用专用的 n 维数组存储引擎和 OLAP 中间件来处理数据。因此,OLAP 查询通过直接寻址关联的多维视图(数据立方体)来完成。

这种结构专注于将事务信息预计算成聚合,从而导致快速的查询执行性能。特别是,MOLAP 在加载时预计算并在每个层次结构级别存储聚合度量,并存储和索引这些值以供立即检索。

完整的预计算需要大量的开销,包括处理时间和存储空间。对于稀疏数据,MOLAP 需要稀疏矩阵压缩算法来增强存储使用,因此通常与保存在 RDBMS 中的数据相比,数据在磁盘上的大小更小。

基于 MOLAP 的产品通常以聚合形式排列、导航和分析数据。它们需要与软件紧密耦合,并且基于多维数据库 (MDDB) 系统。有效的实现以类似于使用方式的形式保存数据,并使用改进的存储方法来最小化存储。

ROLAP − ROLAP 代表关系型 OLAP。它可以基于大家熟悉的 RDBMS 技术来存储数据。在这种情况下,数据和相关的聚合保存在 RDBMS 中,OLAP 中间件可以实现数据立方体的管理和探索。

此架构的目标是优化 RDBMS 后端,并支持其他工具和服务,包括数据立方体导航逻辑。由于使用了 RDBMS 后端,因此 ROLAP 的主要优势在于管理大量数据时的可扩展性。

ROLAP 系统通常从驻留在关系数据库中的数据工作,其中基础数据和维度表存储为关系表。此模型允许对记录进行多维分析。

它是业界最新且增长最快的 OLAP 技术领域。此方法允许生成二维关系表的多个多维视图,从而避免围绕所需视图构建记录。

MQE − MQE 代表托管查询环境。一些产品能够提供 ad-hoc 查询,例如数据立方体和切片和切块分析功能。这是通过开发一个从 DBMS 中选择数据的查询来完成的,该查询将请求的数据传递到系统,然后将其放置到数据立方体中。

此数据立方体可以本地存储在桌面中,并在那里进行操作以减少开销,每次执行查询时都需要创建结构。将数据存储在数据立方体中后,可以对其应用多维分析和操作。

更新时间: 2022年2月15日

4K+ 次查看

启动你的 职业生涯

通过完成课程获得认证

开始学习
广告

© . All rights reserved.