星型模式和雪花模式的区别?
星型模式
星型模式是一种用于将记录组织成维度表、事实表和物化视图的方案。所有信息都存储在列中,需要元数据来识别充当多维对象的列。
星型模式是一种关系模式,其设计描述了多维数据模型。星型模式是显式的数据仓库模式。它被称为星型模式,因为这种模式的实体关系图呈现出一个星形,其中点从主表发散。模式的中心包含一个大型的事实表,而星形的点是维度表。
雪花模式
雪花模式是星型模式模型的一种变体,其中一些维度表被规范化,将数据进一步划分为更多表。生成的模式图形成类似于雪花的形状。
雪花模式是星型模式的扩展,其中星形的每个点都分解成更多点。它被称为雪花模式,因为雪花模式的图模拟了雪花。雪花化是一种规范化星型模式中维度表的方法。当它完全规范化某些维度表时,产生的结构类似于雪花,中间是事实表。
雪花模式和星型模式模型之间的区别在于,雪花模式的维度表可以保持规范化形式。这样的表易于维护,并且还节省存储空间,因为当维度结构作为列参与时,大型维度表可能变得非常大。
由于大部分空间都是冗余信息,因此创建规范化结构将减少总空间需求。但是,雪花结构可能会降低浏览效率,因为需要更多连接才能执行查询。因此,系统性能可能会受到不利影响。性能基准测试可用于确定此设计是否合适。
让我们看看星型模式和雪花模式之间的比较。
星型模式 | 雪花模式 |
---|---|
它是一种简单的数据库设计。 | 它是一种复杂的数据库设计。 |
在星型模式中,只需要一个连接就可以建立事实表和任何维度表之间的关系。 | 雪花模式需要多个连接才能检索数据。 |
多维数据集处理速度更快。 | 由于连接复杂,多维数据集处理速度可能会变慢。 |
它不使用规范化。 | 它使用规范化和反规范化。 |
星型模式使用的连接数量较少。 | 雪花模式使用的连接数量较多。 |
广告