数据仓库数据建模
数据建模是指在数据仓库平台内处理和设计数据模型的过程。它包括创建合适的数据库模式,以便传输可以存储并对用户有用的数据。数据仓库建模有两个原因:首先,可以通过模式可视化仓库数据之间的关系;其次,精心设计的模式可以降低成本并提高效率,从而实现有效的数据仓库结构。数据仓库中的数据建模与操作型数据库系统中的数据建模不同,因此它可以有效地处理复杂的查询。
数据建模生命周期
在这个生命周期中,我们将逐步了解如何将业务需求转化为在IT系统中处理数据的目标。其目的是为业务创建一个存储区域,为此,逻辑和物理数据建模都很有帮助。数据建模生命周期中使用的三个步骤如下:
概念数据模型
概念数据模型指的是对关系的有组织的视图,即在实体之间找到最高级别的关系。其目的是建立实体及其之间的关系。
概念数据模型的特点:
仅显示数据,例如实体及其关系。
实际数据库中几乎没有其他数据。
未指定属性和主键。
它主要用于面向业务的受众。
逻辑数据模型
它以结构化的形式显示信息,而无需了解其物理外观。其主要目的是使用业务数据结构、流程和关系来创建一个单一视图。
逻辑数据模型的特点:
每个实体都具有属性。
实体与关系一起存在。
存在主键和非主键属性。
属性名称对用户友好。
比概念数据模型更详细。
存在主键和外键关系。
外键关系(指定引用完整性)。
物理数据模型
它指的是数据库结构的可视化,即复制表结构、列、数据类型、键、约束和表之间的关系后,模型在数据库中的外观。其主要目的是将逻辑数据模型显示在数据仓库托管的关系数据库系统的物理结构中。它还可以使用新的数据结构来提高查询性能。
物理数据模型的特征:
实体和属性分别称为表和列。
列的数据类型、长度和值必须精确。
主键和外键用于定义表之间的关系。
所有表和列的规范。
结论
本文介绍了数据仓库中的数据建模,用于在数据仓库中处理和设计数据模型。模式用于可视化关系并提高效率,从而降低成本。数据建模生命周期包括三个部分:第一部分是概念数据模型,它指的是对关系的有组织的视图;第二部分是逻辑数据模型,它创建单个视图和结构信息,而无需其物理外观;第三部分是物理数据模型,它将逻辑数据模型可视化为物理数据模型,从而提高查询性能。