什么是数据立方体?


数据立方体使数据能够在多个维度上建模和查看。它由维度和事实表示。换句话说,维度是组织需要保存记录的相关视图或实体。

例如,AllElectronics 可以创建一个销售数据仓库来维护商店销售相关维度的记录,例如时间、商品、分店和地点。这些维度使商店能够跟踪商品的月度销售额以及商品销售的分店和地点。

每个维度都可以有一个与其相关的表。它被称为维度表,进一步表示维度。例如,商品的维度表可以包含商品名称、品牌和类型等属性。维度表可以由用户或专业人员确定,也可以根据数据分布自动创建和调整。

多维数据模型通常围绕一个中心设计组织,例如销售。此设计由事实表定义。事实是数学度量。销售数据仓库的事实示例包括销售额(以美元计)、销售量(已售商品数量)和预算金额。事实表包含事实或度量的名称以及与每个关联维度表的键。

数据立方体是从数据库中的一组属性生成的。选择特定的属性作为度量属性,即其值感兴趣的属性。其他属性被选为维度或功能属性。度量属性根据维度进行聚合。

例如,XYZ 可以创建一个销售数据仓库来维护商店销售记录,维度包括时间、商品、分店和地点。这些维度允许商店跟踪商品的月度销售额以及商品销售的分店和地点。

每个维度都可以有一个与其关联的表。它被称为维度表,定义了维度。例如,商品的维度表可以包含商品名称、品牌和类型等属性。

数据立方体技术是具有多种应用的有趣方法。在某些情况下,数据立方体可能是稀疏的,因为并非每个维度中的每个单元格都可以在数据库中找到对应的信息。如果查询包含低于数据立方体中支持的级别的常量,则不清楚如何充分利用数据立方体中保存的预先计算结果。

更新于:2021年11月23日

1K+ 浏览量

开启你的 职业生涯

通过完成课程获得认证

开始学习
广告