数据仓库设计的流程是什么?


数据仓库可以使用三种方法构建:

  • 自顶向下方法

  • 自底向上方法

  • 两种方法的结合

自顶向下方法从完整的规划和设计开始。当技术成熟且易于掌握,并且需要解决的业务问题清晰易懂时,这种方法非常有用。

自底向上方法从实验和原型开始。这在业务建模和技术发展的初期阶段非常有利。它使组织能够以较低的成本向前发展,并在做出重大承诺之前计算技术的优势。

在组合方法中,组织可以利用自顶向下方法的计划性和战略性特点,同时保留自底向上方法的快速执行和机会性软件。

一般来说,仓库设计流程包括以下步骤:

  • 可以选择一个要建模的业务流程,例如订单、发票、发货、库存、账户管理、销售和总账。如果业务流程是组织性的,涉及多个复杂的业务对象集合,则应遵循数据仓库模型。但是,如果流程是部门性的,并且侧重于分析一种类型的业务流程,则必须选择数据市场模型。

  • 可以选择业务流程的粒度。粒度是此流程的事实表中要表示的数据的基本原子级别,例如单个交易、单个每日快照等。

  • 可以选择适用于每个事实表记录的维度。典型的维度包括时间、项目、客户、供应商、仓库、交易类型和状态。

  • 可以选择填充每个事实表记录的度量。典型的度量是可加的数值量,例如销售额和销售单位。

由于数据仓库的设计和构建,仓库的最初部署包括初始安装、推广计划、培训和指导。还应处理平台更新和维护。

数据仓库管理将包括数据刷新、数据源同步、灾难恢复计划、访问控制和安全管理、数据增长管理、数据库性能管理以及数据仓库的增强和扩展。

范围管理包括控制查询、维度和文档的数量和范围;限制数据仓库的大小;或限制时间表、预算或资源。

有各种各样的数据仓库设计工具可用。数据仓库开发工具支持定义和编辑元数据存储库内容(包括模式、脚本或规则)、回答查询、输出报表以及在关系数据库系统目录之间传输元数据的功能。

**规划和分析工具**研究更改刷新率或时间窗口时模式更改和刷新性能的影响。

更新于:2021年11月22日

3000+ 次浏览

启动你的职业生涯

通过完成课程获得认证

开始学习
广告
© . All rights reserved.