什么是雪花模型?


雪花模型是星型模型的一种变体,其中一些维度表被规范化,通过进一步将记录划分为其他表。生成的模式图形成类似于雪花形状。

雪花模型是星型模型的扩展,其中星形的每个点都分解成更多点。它被称为雪花模型,因为雪花模型类似于雪花。雪花化是规范化 STAR 模式中维度表的一种方法。当它完全规范化所有维度表时,生成的结构会模拟一个雪花,中间是事实表。

雪花化可以提高特定查询的性能。该模式的组织方式是每个事实都围绕着其相关的维度,而这些维度又与其他维度相关联,分支成雪花图案。

雪花模型包含一个事实表,它连接到多个维度表,这些维度表可以通过多对一关系连接到其他维度表。雪花模型中的表通常规范化到第三范式。每个维度表在一个层次结构中实现恰好一个级别。

星型模式将维度表的所有属性存储在一个非规范化表中。这需要比更规范的雪花模型更多的磁盘空间。雪花化通过将基数低的属性更改为单独的维度表来规范化维度,这些维度表通过使用外键与主要的维度表关联。雪花模型的目的是最大限度地减少磁盘空间,但这并不推荐,因为它会对查询执行产生不利影响。

在雪花模型中,模式表被规范化以去除冗余。在雪花模型中,维度表被分解成多个维度表。

创建雪花模型是为了在更复杂的维度和关系之间进行灵活的查询。它与维度级别之间多对多和一对多关系相关。

雪花模型的优点

  • 雪花模型的主要优点是查询性能的提高,因为所需的磁盘存储空间减少,并且连接了较小的查找表。

  • 它支持维度级别和组件之间更高程度的可扩展性。

  • 没有冗余,因此更容易维护。

雪花模型的缺点

  • 雪花模型的主要缺点是由于查找表数量的增加而需要额外的维护工作。它也被定义为多事实星型模式。

  • 查询更复杂,因此难以学习。

  • 表越多,连接越多,因此查询执行时间越长。

更新时间: 2021-11-23

754 次查看

开启你的 职业生涯

通过完成课程获得认证

开始学习
广告