- SAP BODS 教程
- SAP BODS - 首页
- 数据仓库 & ETL
- 数据仓库 - 概述
- 数据仓库 - 类型
- 数据仓库 - 产品与供应商
- ETL - 简介
- SAP BO 数据服务
- SAP BODS - 概述
- SAP BODS - 架构
- SAP BODS - 数据服务设计器
- SAP BODS 仓库
- SAP BODS - 仓库概述
- 仓库创建与更新
- 数据服务管理控制台
- SAP BODS - DSMC 模块
- SAP BODS - DS 设计器简介
- SAP BODS - DS 设计器中的 ETL 流程
- SAP BODS 数据存储和格式
- SAP BODS - 数据存储概述
- SAP BODS - 更改数据存储
- SAP BODS - 内存数据存储
- SAP BODS - 链接数据存储
- SAP BODS - 适配器数据存储
- SAP BODS - 文件格式
- COBOL Copybook 文件格式
- 从数据库表中提取数据
- 从 Excel 工作簿提取数据
- SAP BODS 转换
- SAP BODS - 转换类型
- 向数据流添加转换
- SAP BODS - 查询转换
- SAP BODS 管理
- SAP BODS - 数据服务概述
- 创建嵌入式数据流
- 调试与恢复机制
- 数据评估和数据分析
- SAP BODS - 调整技巧
- SAP BODS 有用资源
- SAP BODS - 问答
- SAP BODS - 快速指南
- SAP BODS - 有用资源
- SAP BODS - 讨论
SAP BODS - 查询转换
这是数据服务中最常用的转换,您可以执行以下功能:
- 从数据源过滤数据
- 连接来自多个数据源的数据
- 对数据执行函数和转换
- 从输入到输出模式的列映射
- 分配主键
- 添加新的列、模式和函数到输出模式
由于查询转换是最常用的转换,因此工具面板中为此查询提供了快捷方式。
要添加查询转换,请按照以下步骤操作:
步骤 1 - 点击查询转换工具面板。点击数据流工作区中的任意位置。将其连接到输入和输出。
双击查询转换图标时,将打开一个用于执行查询操作的查询编辑器。
查询转换中包含以下区域:
- 输入模式
- 输出模式
- 参数
输入和输出模式包含列、嵌套模式和函数。“模式输入”和“模式输出”显示转换中当前选择的模式。
要更改输出模式,请在列表中选择模式,右键单击并选择“设为当前”。
数据质量转换
数据质量转换不能直接连接到包含嵌套表的上一级转换。要连接这些转换,您应该在嵌套表和数据质量转换之间的转换中添加查询转换或 XML 管道转换。
如何使用数据质量转换?
步骤 1 - 转到对象库 → 转换选项卡
步骤 2 - 展开数据质量转换,并添加要添加到数据流的转换或转换配置。
步骤 3 - 绘制数据流连接。双击转换的名称,将打开转换编辑器。在输入模式中,选择要映射的输入字段。
注意 - 要使用关联转换,您可以向输入选项卡添加用户定义的字段。
文本数据处理转换
文本数据处理转换允许您从大量文本中提取特定信息。您可以搜索特定于组织的事实和实体,例如客户、产品和财务事实。
此转换还会检查实体之间的关系并允许提取。使用文本数据处理提取的数据可用于商业智能、报告、查询和分析。
实体提取转换
在数据服务中,文本数据处理借助实体提取完成,实体提取从非结构化数据中提取实体和事实。
这涉及分析和处理大量文本数据,搜索实体,将它们分配到适当的类型,并以标准格式呈现元数据。
实体提取转换可以从任何文本、HTML、XML 或某些二进制格式(例如 PDF)内容中提取信息并生成结构化输出。您可以根据工作流以多种方式使用输出。您可以将其用作另一个转换的输入,或写入多个输出源,例如数据库表或平面文件。输出以 UTF-16 编码生成。
实体提取转换可用于以下场景:
从大量文本中查找特定信息。
使用现有信息从非结构化文本中查找结构化信息以建立新的连接。
产品质量报告和分析。
TDP 和数据清理之间的区别
文本数据处理用于从非结构化文本数据中查找相关信息。但是,数据清理用于标准化和清理结构化数据。
参数 | 文本数据处理 | 数据清理 |
---|---|---|
输入类型 | 非结构化数据 | 结构化数据 |
输入大小 | 大于 5KB | 小于 5KB |
输入范围 | 具有多种变体的广泛领域 | 有限的变体 |
潜在用途 | 从非结构化数据中获取潜在的有意义信息 | 存储到仓库中的数据质量 |
输出 | 以实体、类型等形式创建注释。输入不变 | 创建标准化字段,输入已更改 |