- Talend 教程
- Talend - 首页
- Talend - 简介
- Talend - 系统要求
- Talend - 安装
- Talend Open Studio
- Talend - 数据集成
- Talend - 模型基础
- 数据集成组件
- Talend - 作业设计
- Talend - 元数据
- Talend - 上下文变量
- Talend - 作业管理
- Talend - 处理作业执行
- Talend - 大数据
- Hadoop 分布式文件系统
- Talend - MapReduce
- Talend - 使用 Pig
- Talend - Hive
- Talend 有用资源
- Talend - 快速指南
- Talend - 有用资源
- Talend - 讨论
Talend - 作业设计
这是业务模型的技术实现/图形表示。在这个设计中,一个或多个组件相互连接以运行数据集成流程。因此,当您在设计面板中拖放组件并使用连接器连接它们时,作业设计会将所有内容转换为代码,并创建一个完整的可运行程序,形成数据流。
创建作业
在资源库窗口中,右键单击“作业设计”,然后单击“创建作业”。
提供作业的名称、用途和说明,然后单击“完成”。
您会看到您的作业已在“作业设计”下创建。
现在,让我们使用此作业添加组件、连接和配置它们。在这里,我们将采用 Excel 文件作为输入,并生成具有相同数据的 Excel 文件作为输出。
向作业添加组件
调色板中有几个组件可供选择。还有一个搜索选项,您可以在其中输入组件的名称来选择它。
由于这里我们采用 Excel 文件作为输入,因此我们将从调色板中将 tFileInputExcel 组件拖放到设计器窗口。
现在,如果您单击设计器窗口的任何位置,都会出现一个搜索框。找到 tLogRow 并选择它以将其带入设计器窗口。
最后,从调色板中选择 tFileOutputExcel 组件,并将其拖放到设计器窗口。
现在,组件的添加已完成。
连接组件
添加组件后,必须连接它们。右键单击第一个组件 tFileInputExcel,然后绘制一条主线到 tLogRow,如下所示。
同样,右键单击 tLogRow,然后在 tFileOutputExcel 上绘制一条主线。现在,您的组件已连接。
配置组件
在作业中添加和连接组件后,需要配置它们。为此,双击第一个组件 tFileInputExcel 以配置它。在“文件名/流”中提供输入文件的路径,如下所示。
如果您的 Excel 文件第一行包含列名,请在“标题”选项中输入 1。
单击“编辑模式”,并根据您的输入 Excel 文件添加列及其类型。添加模式后,单击“确定”。
单击“是”。
在 tLogRow 组件中,单击“同步列”,并选择要从中生成行的模式。这里我们选择了“基本模式”,字段分隔符为“,”。
最后,在 tFileOutputExcel 组件中,提供要存储输出 Excel 文件的路径
以及工作表名称。**单击“同步列”。**
执行作业
完成添加、连接和配置组件后,您就可以执行 Talend 作业了。单击“运行”按钮开始执行。
您将在基本模式下看到输出,分隔符为“,”。
您还可以看到您的输出已保存为 Excel 文件,路径为您提到的输出路径。