数据挖掘中的OLAP工具有哪些?
OLAP 工具主要分为三类,如下所示:
MOLAP − MOLAP 代表多维 OLAP。它支持元组作为数据存储单元。MOLAP 应用专用的 n 维数组存储引擎和 OLAP 中间件来处理数据。因此,OLAP 查询通过直接寻址关联的多维视图(数据立方体)来完成。
这种结构专注于将事务信息预计算成聚合,从而导致快速的查询执行性能。特别是,MOLAP 在加载时预计算并在每个层次结构级别存储聚合度量,并存储和索引这些值以供立即检索。
完整的预计算需要大量的开销,包括处理时间和存储空间。对于稀疏数据,MOLAP 需要稀疏矩阵压缩算法来增强存储使用,因此通常与保存在 RDBMS 中的数据相比,数据在磁盘上的大小更小。
基于 MOLAP 的产品通常以聚合形式排列、导航和分析数据。它们需要与软件紧密耦合,并且基于多维数据库 (MDDB) 系统。有效的实现以类似于使用方式的形式保存数据,并使用改进的存储方法来最小化存储。
ROLAP − ROLAP 代表关系型 OLAP。它可以基于大家熟悉的 RDBMS 技术来存储数据。在这种情况下,数据和相关的聚合保存在 RDBMS 中,OLAP 中间件可以实现数据立方体的管理和探索。
此架构的目标是优化 RDBMS 后端,并支持其他工具和服务,包括数据立方体导航逻辑。由于使用了 RDBMS 后端,因此 ROLAP 的主要优势在于管理大量数据时的可扩展性。
ROLAP 系统通常从驻留在关系数据库中的数据工作,其中基础数据和维度表存储为关系表。此模型允许对记录进行多维分析。
它是业界最新且增长最快的 OLAP 技术领域。此方法允许生成二维关系表的多个多维视图,从而避免围绕所需视图构建记录。
MQE − MQE 代表托管查询环境。一些产品能够提供 ad-hoc 查询,例如数据立方体和切片和切块分析功能。这是通过开发一个从 DBMS 中选择数据的查询来完成的,该查询将请求的数据传递到系统,然后将其放置到数据立方体中。
此数据立方体可以本地存储在桌面中,并在那里进行操作以减少开销,每次执行查询时都需要创建结构。将数据存储在数据立方体中后,可以对其应用多维分析和操作。
数据结构
网络
关系型数据库管理系统
操作系统
Java
iOS
HTML
CSS
Android
Python
C语言编程
C++
C#
MongoDB
MySQL
Javascript
PHP