• SAP HANA Video Tutorials

SAP HANA - 数据仓库中的模式



模式是对数据仓库中表的逻辑描述。模式通过连接多个事实表和维度表来满足某些业务逻辑而创建。

数据库使用关系模型来存储数据。但是,数据仓库使用连接维度表和事实表以满足业务逻辑的模式。数据仓库中使用了三种类型的模式:

  • 星型模式
  • 雪花模式
  • 星系模式

星型模式

在星型模式中,每个维度都连接到一个事实表。每个维度仅由一个维度表示,并且不会进一步规范化。

维度表包含用于分析数据的属性集。

示例 - 在下面给出的示例中,我们有一个事实表 FactSales,它具有所有 Dim 表的主键以及度量单位_sold 和美元_sold 用于进行分析。

我们有四个维度表:DimTime、DimItem、DimBranch、DimLocation

Star Schema

每个维度表都连接到事实表,因为事实表具有每个维度表的主键,该主键用于连接两个表。

事实表中的事实/度量与维度表中的属性一起用于分析目的。

雪花模式

在雪花模式中,一些维度表被进一步规范化,并且 Dim 表连接到单个事实表。规范化用于组织数据库的属性和表,以最大程度地减少数据冗余。

规范化涉及将一个表分解成更少的冗余的小表,而不会丢失任何信息,并且较小的表连接到维度表。

Snowflakes Schema

在上面的示例中,DimItem 和 DimLocation 维度表被规范化,而不会丢失任何信息。这称为雪花模式,其中维度表进一步规范化为较小的表。

星系模式

在星系模式中,存在多个事实表和维度表。每个事实表存储一些维度表的主键以及度量/事实以进行分析。

Galaxy Schema

在上面的示例中,有两个事实表 FactSales、FactShipping 和多个连接到事实表的维度表。每个事实表都包含连接的 Dim 表的主键以及度量/事实以执行分析。

广告