Talend - 作业设计



这是业务模型的技术实现/图形表示。在这个设计中,一个或多个组件相互连接以运行数据集成流程。因此,当您在设计面板中拖放组件并使用连接器连接它们时,作业设计会将所有内容转换为代码,并创建一个完整的可运行程序,形成数据流。

创建作业

在资源库窗口中,右键单击“作业设计”,然后单击“创建作业”。

Creating Job

提供作业的名称、用途和说明,然后单击“完成”。

Description of Job

您会看到您的作业已在“作业设计”下创建。

Job Design

现在,让我们使用此作业添加组件、连接和配置它们。在这里,我们将采用 Excel 文件作为输入,并生成具有相同数据的 Excel 文件作为输出。

向作业添加组件

调色板中有几个组件可供选择。还有一个搜索选项,您可以在其中输入组件的名称来选择它。

Palette

由于这里我们采用 Excel 文件作为输入,因此我们将从调色板中将 tFileInputExcel 组件拖放到设计器窗口。

Designer window

现在,如果您单击设计器窗口的任何位置,都会出现一个搜索框。找到 tLogRow 并选择它以将其带入设计器窗口。

Search Box

最后,从调色板中选择 tFileOutputExcel 组件,并将其拖放到设计器窗口。

File Output Excel

现在,组件的添加已完成。

New Job

连接组件

添加组件后,必须连接它们。右键单击第一个组件 tFileInputExcel,然后绘制一条主线到 tLogRow,如下所示。

Connecting Components

同样,右键单击 tLogRow,然后在 tFileOutputExcel 上绘制一条主线。现在,您的组件已连接。

Components Conected Draw Main Line

配置组件

在作业中添加和连接组件后,需要配置它们。为此,双击第一个组件 tFileInputExcel 以配置它。在“文件名/流”中提供输入文件的路径,如下所示。

如果您的 Excel 文件第一行包含列名,请在“标题”选项中输入 1。

Header Option

单击“编辑模式”,并根据您的输入 Excel 文件添加列及其类型。添加模式后,单击“确定”。

Adding Schema

单击“是”。

Propagate

在 tLogRow 组件中,单击“同步列”,并选择要从中生成行的模式。这里我们选择了“基本模式”,字段分隔符为“,”。

Progress Information

最后,在 tFileOutputExcel 组件中,提供要存储输出 Excel 文件的路径

Sync Columns

以及工作表名称。**单击“同步列”。**

执行作业

完成添加、连接和配置组件后,您就可以执行 Talend 作业了。单击“运行”按钮开始执行。

Basic Run Log Row

您将在基本模式下看到输出,分隔符为“,”。

Basic Mode

您还可以看到您的输出已保存为 Excel 文件,路径为您提到的输出路径。

Output Path
广告