如何设计个体事实表?


设计个体事实表的方法如下:

选择数据仓储 - 最简单的方法是选择信息来源。典型的数据仓储包括采购订单、发货单、零售销售、付款或用户连接。这些可以是单一来源数据仓储的实例。

在某些情况下,可以定义一个包含多个遗留来源的数据仓储。多来源数据仓储的一个实例是用户盈利能力,其中定义收入的遗留来源应与表示成本的遗留来源相结合。

数据仓库设计人员应通过首先仅执行单一来源数据仓储来限制风险,以减少冗长的提取系统开发功能的数量。它还可以规定仅在一致维度组的上下文中实现这些独立的数据仓储,因此数据仓储可以插入到数据仓库总线中。

声明事实表粒度 - 在建议的维度设计中,必须非常清楚地表示事实表数据是什么。如果没有清晰的描述,设计就无法继续进行,数据架构师会浪费宝贵的时间来争论什么是维度,什么是事实。

事实表粒度最好尽可能低,或尽可能细致。选择低级别粒度有很多好处,包括单一交易、单日快照或单一文档项目。

粒度越低,设计就越强大。可以认为低粒度方法在响应意外的新查询和响应更多新数据元素的建立方面,远优于高粒度方法。

选择维度 - 由于事实表的粒度已经确定,维度的选择相对简单。粒度通常会决定一组主要的或标记的维度。例如,订单上行项目的标记维度集必须包含订单日期、用户、产品以及仅包含订单号的适当退化维度。

在维度模型中,事实表是在特定粒度下同时测量的一组值。一般的测量值是数值型的,但它们不必是数值型的。

选择事实 - 事实表的粒度也使单个事实的选择成为可能,并阐明了这些事实的范围。

更新于:2022年2月9日

421 次浏览

开启你的职业生涯

完成课程获得认证

开始
广告
© . All rights reserved.