使用DAX进行数据建模 - 概念
商业智能(BI)在多个领域和组织中变得越来越重要。基于历史数据的决策制定和预测在竞争日益激烈的世界中变得至关重要。对于任何类型的数据分析,都存在大量来自内部和外部不同来源的数据。
然而,挑战在于根据当前需求从可用的大数据中提取相关数据,并以一种有利于从数据中预测不同见解的方式存储它。因此,使用关键业务术语获得的数据模型是一个有价值的沟通工具。数据模型还需要提供一种快速生成报告的方式,以满足需要。
用于BI系统的数据建模使您能够满足许多数据挑战。
BI数据模型的先决条件
BI的数据模型应该满足正在进行数据分析的业务需求。以下是任何数据模型都必须满足的最低限度基础 -
数据模型需要针对特定业务
适用于一个业务线的模型可能不适用于另一个业务线。因此,数据模型必须基于特定的业务、使用的业务术语、数据类型及其关系来开发。它应该基于组织的目标和决策类型。
数据模型需要具有内置的智能
数据模型应通过元数据、层次结构和继承包含内置的智能,以促进高效且有效的商业智能流程。通过此,您将能够为不同的用户提供一个共同的平台,消除流程的重复。
数据模型需要健壮
数据模型应准确地呈现特定于业务的数据。它应该能够有效地存储磁盘和内存,以便于快速处理和报告。
数据模型需要可扩展
数据模型应该能够以快速有效的方式适应不断变化的业务场景。可能需要包含新的数据或新的数据类型。可能需要有效地处理数据刷新。
BI的数据建模
BI的数据建模包括以下步骤 -
- 塑造数据
- 加载数据
- 定义表之间的关系
- 定义数据类型
- 创建新的数据洞察
塑造数据
构建数据模型所需的数据可以来自各种来源,并且可以采用不同的格式。您需要确定从每个数据源中哪些部分的数据需要进行特定的数据分析。这称为塑造数据。
例如,如果您要检索组织中所有员工的数据,则需要确定每个员工的哪些详细信息与当前上下文相关。换句话说,您需要确定需要导入员工表的哪些列。这是因为,数据模型中表的列越少,对该表的计算速度就越快。
加载数据
您需要加载已识别的数据 - 每个表中包含所选列的数据表。
定义表之间的关系
接下来,您需要定义各个表之间的逻辑关系,以促进组合来自这些表的数据,即如果您有一个包含产品信息的表 - 产品 - 和一个包含产品的各种销售交易的表 - 销售 -,通过定义这两个表之间的关系,您可以按产品汇总销售情况。
定义数据类型
为数据模型中的数据识别合适的数据类型对于计算的准确性至关重要。对于您导入的每个表中的每一列,您都需要定义数据类型。例如,文本数据类型、实数数据类型、整数数据类型等。
创建新的数据洞察
这是BI数据建模中的一个关键步骤。构建的数据模型可能需要与需要了解数据趋势并在很短时间内做出必要决策的几个人共享。因此,从源数据创建新的数据洞察将非常有效,避免分析的重复工作。
新的数据洞察可以采用元数据的形式,特定业务人员可以轻松理解和使用。
数据分析
数据模型准备就绪后,可以根据需要分析数据。呈现分析结果也是一个重要步骤,因为决策将基于报告做出。