数据仓库的多层架构


在本文中,我们将讨论数据仓库的多层架构。

简介

数据仓库就像一个大型存储库,用于存储信息,以便人们可以利用这些信息做出更明智的决策。这些信息来自不同的来源,例如数据库和其他跟踪交易的系统。信息会定期添加到仓库中。仓库是一个中心位置,所有这些数据都在这里进行组织并易于分析。它整合了来自不同来源的数据。它将其转换为可访问和分析的格式。为了确保数据仓库的有效运作,它必须具有多层架构。

多层架构的必要性

数据仓库是一个复杂的系统。它需要多层来处理大量数据。需要一个多级结构。系统的每一层都高效地执行其特定功能。多层架构提供了许多好处。这些包括:更好的数据质量、更快的查询响应时间、更好的数据集成和可扩展性。

多层架构

多层架构中有四层。它们是:数据源层、ETL 层、数据存储层和数据访问层。下面将简要解释这些层。

数据源层

它是多层架构的第一层。它包含需要集成到数据仓库中的所有数据源。这些来源可以是数据库、平面文件或外部来源,例如社交媒体平台。数据源层负责在将数据传递到下一层之前收集、验证和组织数据。

ETL 层

这是多层架构的第二层。它负责从数据源提取数据。它将数据转换为适合数据仓库的格式。它还将其加载到数据存储层。此层确保加载到数据仓库中的数据的质量和一致性。

数据存储层

这是多层架构的第三层。它负责存储 ETL 层转换和加载的数据。此层可以分为两个子层:暂存区和数据仓库。暂存区用于在将数据加载到数据仓库之前临时存储数据。数据仓库是数据的最终目的地,用于报告和分析。

数据访问层

它是多层架构的第四层。它负责向用户提供对数据的访问权限。此层可以分为两个子层 -

  • 表示层为用户提供了一个用户友好的界面来访问和分析数据。

  • 应用层负责管理业务逻辑并确保数据的安全性和完整性。

多层数据仓库架构组件

多层数据仓库架构具有以下组件:数据源、数据集成层、暂存区、数据仓库数据库、数据市集、OLAP 多维数据集、前端工具、元数据存储库。

多层数据仓库架构可以分为三个主要部分。它们是:底层、中间层和顶层。下面将简要解释这些层。

底层(数据源和数据存储)

此层包含数据源和数据存储。它通常使用仓库数据库服务器(例如 RDBMS)实现。网关(例如 ODBC、OLE-DB 和 JDBC)用于从运营和外部源提取数据。

中间层

此层是 OLAP 服务器。OLAP 服务器可以使用关系型 OLAP (ROLAP) 模型或多维 OLAP (MOLAP) 模型实现。ROLAP 是扩展的关系型数据库管理系统。它将操作从标准数据映射到标准数据。而 MOLAP 是一种专用服务器,直接实现多维数据和操作。

顶层

此层是前端客户端层。它具有查询和报告工具、分析工具和数据挖掘工具,例如趋势分析和预测。

数据仓库模型

从架构角度来看,有三种类型的数据仓库模型 -

企业级仓库

  • 它收集来自组织所有部分的数据并将其集成起来,以提供组织的完整视图。

  • 它可能非常庞大且复杂,需要大量的建模和设计才能实施。

数据市集

  • 它包含来自企业级仓库的特定于特定用户组的数据子集。

  • 它比企业级仓库更小且更容易实施,通常用于部门级报告和分析。

虚拟仓库

  • 它是一组位于运营数据库之上的视图,而不是一个单独的数据库。

  • 它易于创建,但需要在运营数据库服务器上增加容量才能支持高效的查询。

多层架构的优点

以下是数据仓库多层架构的主要优点 -

可扩展性

可以根据数据仓库的需要添加、删除或更新组件。

更好的性能

多层可以实现并行和高效的处理,从而提高性能和反应时间。

模块化

模块化设计允许创建、测试和部署单独的组件。

安全性

对各个层应用安全措施可以增强数据仓库的整体安全性。

改进的资源管理

不同的层可以调整为使用适当的硬件资源,从而降低成本并提高效率。

更易于维护

可以更新或维护各个组件,而不会影响整个数据仓库。

提高可靠性

多层架构提供冗余和故障转移功能,从而增强数据仓库的整体可靠性。

更新于: 2023年5月17日

4K+ 阅读量

开启你的 职业生涯

通过完成课程获得认证

开始学习
广告