数据仓库 - ETL & 报表工具



ETL 工具从所有这些异构数据源中提取数据,转换数据(例如应用计算、连接字段、键、删除不正确的数据字段等),并将其加载到数据仓库中。

提取

ETL 加载期间需要一个暂存区。需要暂存区的原因有很多。源系统仅在特定时间段内可用于提取数据。此时间段小于总数据加载时间。因此,暂存区允许您在时间段结束前从源系统提取数据并将其保存在暂存区中。

当您想要将来自多个数据源的数据组合在一起或想要将两个或多个系统连接在一起时,需要暂存区。

例如 - 您将无法执行从两个物理上不同的数据库中的两个表连接的 SQL 查询。

不同系统的的数据提取时间段根据时区和运营时间而有所不同。从源系统提取的数据可用于多个数据仓库系统、运营数据存储等。

ETL 允许您执行复杂的转换,并且需要额外的区域来存储数据。

Extraction

转换

在数据转换中,您对提取的数据应用一组函数以将其加载到目标系统中。不需要任何转换的数据称为直接移动或直通数据。

您可以对从源系统提取的数据应用不同的转换。例如,您可以执行自定义计算。如果您想要销售收入的总和,而数据库中没有此数据,则可以在转换期间应用 SUM 公式并加载数据。

例如 - 如果您在表中以不同的列分别具有名字和姓氏,则可以在加载前使用连接。

加载

在加载阶段,数据加载到最终目标系统,它可以是平面文件或数据仓库系统。

BI 报表工具

BI(商业智能)工具由业务用户用于从数据仓库中的交易数据创建基本、中等和复杂的报表,并通过使用信息设计工具/UDT创建数据模型。各种 SAP 和非 SAP 数据源可用于创建报表。

市场上有很多 BI 报表、仪表盘和数据可视化工具可用。其中一些如下所示 -

  • SAP Business Objects Web Intelligence (WebI)
  • 水晶报表
  • SAP Lumira
  • 仪表盘设计器
  • IBM Cognos
  • Microsoft BI 平台
  • Tableau 商业智能
  • JasperSoft
  • Oracle BI OBIEE
  • Pentaho
  • QlickView
  • SAP BW
  • SAS 商业智能
  • Necto
  • Tibco Spotfire
广告