数据仓库 - OLAP



联机分析处理服务器(OLAP)基于多维数据模型。它允许管理人员和分析师通过快速、一致和交互的方式访问信息,从而深入了解信息。本章涵盖OLAP的类型、OLAP的操作、OLAP与统计数据库以及OLTP之间的区别。

OLAP服务器的类型

我们有四种类型的OLAP服务器:

  • 关系型OLAP(ROLAP)
  • 多维OLAP(MOLAP)
  • 混合OLAP(HOLAP)
  • 专用SQL服务器

关系型OLAP

ROLAP服务器位于关系后端服务器和客户端前端工具之间。为了存储和管理仓库数据,ROLAP使用关系型或扩展关系型DBMS。

ROLAP包括以下内容:

  • 聚合导航逻辑的实现。
  • 针对每个DBMS后端的优化。
  • 其他工具和服务。

多维OLAP

MOLAP使用基于数组的多维存储引擎来实现数据的多维视图。使用多维数据存储,如果数据集稀疏,则存储利用率可能会降低。因此,许多MOLAP服务器使用两级数据存储表示来处理密集和稀疏数据集。

混合OLAP

混合OLAP是ROLAP和MOLAP的组合。它提供了ROLAP更高的可扩展性和MOLAP更快的计算速度。HOLAP服务器允许存储大量详细信息的详细信息。聚合分别存储在MOLAP存储中。

专用SQL服务器

专用SQL服务器为只读环境中星型和雪花模式上的SQL查询提供高级查询语言和查询处理支持。

OLAP操作

由于OLAP服务器基于数据的多维视图,因此我们将讨论多维数据中的OLAP操作。

以下是OLAP操作的列表:

  • 上卷
  • 下钻
  • 切片和切块
  • 旋转

上卷

上卷对数据立方体进行以下任何一种方式的聚合:

  • 通过沿着维度概念层次向上移动
  • 通过减少维度

下图说明了上卷的工作原理。

Roll-up
  • 上卷是通过沿着维度“位置”的概念层次向上移动来执行的。

  • 最初的概念层次是“街道 < 城市 < 省份 < 国家”。

  • 在上卷时,数据通过从城市级别到国家级别上移位置层次结构来聚合。

  • 数据被分组到城市而不是国家。

  • 执行上卷时,将从数据立方体中删除一个或多个维度。

下钻

下钻是上卷的反向操作。它通过以下任何一种方式执行:

  • 通过沿着维度概念层次向下移动
  • 通过引入新维度。

下图说明了下钻的工作原理:

Drill-Down
  • 下钻是通过沿着维度“时间”的概念层次向下移动来执行的。

  • 最初的概念层次是“天 < 月 < 季度 < 年”。

  • 在下钻时,时间维度从季度级别下降到月级别。

  • 执行下钻时,将向数据立方体中添加一个或多个维度。

  • 它将数据从不太详细的数据导航到高度详细的数据。

切片

切片操作从给定的立方体中选择一个特定的维度并提供一个新的子立方体。考虑以下显示切片工作原理的图。

Slice
  • 此处,对维度“时间”执行切片,使用条件“时间=Q1”。

  • 它将通过选择一个或多个维度来形成一个新的子立方体。

切块

切块从给定的立方体中选择两个或多个维度并提供一个新的子立方体。考虑以下显示切块操作的图。

Dice

基于以下选择条件对立方体进行切块操作涉及三个维度。

  • (位置=“多伦多”或“温哥华”)
  • (时间=“Q1”或“Q2”)
  • (项目=“手机”或“调制解调器”)

旋转

旋转操作也称为旋转。它旋转视图中的数据轴,以便提供数据的替代表示。考虑以下显示旋转操作的图。

Pivot

OLAP 与 OLTP

序号 数据仓库(OLAP) 操作数据库(OLTP)
1 涉及信息的历时处理。 涉及日常处理。
2 OLAP系统由知识工作者(如高管、经理和分析师)使用。 OLTP系统由职员、DBA或数据库专业人员使用。
3 有助于分析业务。 有助于运营业务。
4 它侧重于信息输出。 它侧重于数据输入。
5 基于星型模式、雪花模式和事实星座模式。 基于实体关系模型。
6 包含历史数据。 包含当前数据。
7 提供汇总和合并的数据。 提供原始和高度详细的数据。
8 提供数据的汇总和多维视图。 提供数据的详细和平面关系视图。
9 用户数量为数百。 用户数量为数千。
10 访问的记录数量为数百万。 访问的记录数量为数十。
11 数据库大小从100 GB到1 TB 数据库大小从100 MB到1 GB。
12 高度灵活。 提供高性能。
广告