• SAP HANA Video Tutorials

SAP HANA - SQL 数据分析



SQL 数据分析任务用于理解和分析来自多个数据源的数据。它用于删除不正确、不完整的数据,并在数据加载到数据仓库之前防止数据质量问题。

以下是 SQL 数据分析任务的好处:

  • 它有助于更有效地分析源数据。

  • 它有助于更好地理解源数据。

  • 它删除不正确、不完整的数据,并在数据加载到数据仓库之前提高数据质量。

  • 它与提取、转换和加载任务一起使用。

数据分析任务检查有助于理解数据源并识别数据中需要修复的问题的配置文件。

您可以在 Integration Services 包中使用数据分析任务来分析存储在 SQL Server 中的数据,并识别数据质量的潜在问题。

注意 - 数据分析任务仅适用于 SQL Server 数据源,不支持任何其他基于文件或第三方的数据源。

访问要求

要运行包含数据分析任务的包,用户帐户必须具有对 tempdb 数据库的读取/写入权限以及创建表的权限。

数据分析器查看器

数据分析查看器用于查看分析器输出。数据分析查看器还支持钻取功能,以帮助您理解在分析输出中识别出的数据质量问题。此钻取功能会向原始数据源发送实时查询。

数据分析任务设置和审查

设置数据分析任务

它涉及执行包含数据分析任务的包以计算配置文件。该任务将输出以 XML 格式保存到文件或包变量中。

查看配置文件

要查看数据配置文件,请将输出发送到文件,然后使用数据分析查看器。此查看器是一个独立的实用程序,以摘要和详细信息格式显示配置文件输出,并具有可选的钻取功能。

数据分析 - 配置选项

数据分析任务具有以下便捷的配置选项:

通配符列

在配置配置文件请求时,该任务接受列名称位置的“*”通配符。这简化了配置,并使发现不熟悉数据的特征变得更容易。当任务运行时,该任务会分析每个具有适当数据类型的列。

快速分析

您可以选择快速分析以快速配置任务。快速分析使用所有默认配置文件和设置来分析表或视图。

数据分析任务可以计算八种不同的数据配置文件。其中五种配置文件可以检查单个列,其余三种分析多列或列之间的关系。

数据分析 - 任务输出

数据分析任务将选定的配置文件输出为类似于 DataProfile.xsd 架构的 XML 格式。

您可以保存架构的本地副本,并在 Microsoft Visual Studio 或其他架构编辑器、XML 编辑器或文本编辑器(如记事本)中查看架构的本地副本。

广告