数据仓库 - 概述



数据仓库是一个中心存储库,用于存储来自一个或多个异构数据源的数据。数据仓库用于信息报告和分析,并存储历史数据和当前数据。DW 系统中的数据用于分析报告,业务分析师、销售经理或知识工作者随后将其用于决策。

DW 系统中的数据是从运营事务系统(如销售、营销、人力资源、供应链管理等)加载的。在加载到 DW 系统进行信息处理之前,它可能会经过运营数据存储或其他转换。

数据仓库 - 主要特性

DW 系统的主要特性如下:

  • 它是中心数据存储库,存储来自一个或多个异构数据源的数据。

  • DW 系统存储当前数据和历史数据。通常,DW 系统存储 5-10 年的历史数据。

  • DW 系统始终与运营事务系统分开。

  • DW 系统中的数据用于不同类型的分析报告,范围从季度到年度比较。

DW 系统的需求

假设您有一个住房贷款机构,数据来自多个应用程序,例如营销、销售、ERP、人力资源、物料管理等。这些数据在数据仓库中进行提取、转换和加载。

例如,如果您需要比较产品的季度/年度销售额,则不能使用运营事务数据库,因为这会挂起事务系统。因此,为此目的使用数据仓库。

DW 和 ODB 的区别

数据仓库和运营数据库(事务数据库)的区别如下:

  • 事务系统设计用于已知的负载和事务,例如更新用户记录、搜索记录等。但是,数据仓库事务更复杂,并提供一般形式的数据。

  • 事务系统包含组织的当前数据,而数据仓库通常包含历史数据。

  • 事务系统支持多个事务的并行处理。需要并发控制和恢复机制来维护数据库的一致性。

  • 运营数据库查询允许读取和修改操作(删除和更新),而 OLAP 查询只需要对存储数据的只读访问(SELECT 语句)。

DW 架构

数据仓库涉及数据清洗、数据集成和数据整合。

DW Architecture

数据仓库具有三层架构:**数据源层、集成层**和**表示层**。上图显示了数据仓库系统的常见架构。

广告