Apache NiFi - 处理器



Apache NiFi 处理器是创建数据流的基本模块。每个处理器都有不同的功能,有助于创建输出 FlowFile。下图所示的数据流使用 GetFile 处理器从一个目录获取文件,并使用 PutFile 处理器将其存储到另一个目录。

PutFile processor

GetFile

GetFile 处理器用于从特定目录获取特定格式的文件。它还为用户提供其他选项以更好地控制获取过程。我们将在下面的属性部分讨论它。

GetFile

GetFile 设置

以下是 GetFile 处理器的不同设置:

名称

在“名称”设置中,用户可以根据项目或更具意义的名称为处理器定义任何名称。

启用

用户可以使用此设置启用或禁用处理器。

惩罚持续时间

此设置允许用户在 FlowFile 失败时添加惩罚时间。

产量持续时间

此设置用于指定处理器的产量时间。在此期间,不会再次调度该过程。

公告级别

此设置用于指定该处理器的日志级别。

自动终止关系

此设置列出了该特定进程的所有可用关系的复选框。通过选中复选框,用户可以对处理器进行编程,以便在该事件发生时终止 FlowFile,并且不将其进一步发送到流中。

Automatically Terminate Relationships

GetFile 调度

以下是 GetFile 处理器提供的调度选项:

调度策略

您可以通过选择“时间驱动”来按时间安排进程,或者通过选择“CRON 驱动”选项来选择指定的 CRON 字符串。

并发任务

此选项用于定义此处理器的并发任务调度。

执行

用户可以使用此选项定义是让处理器在所有节点上运行还是仅在主节点上运行。

运行计划

它用于为时间驱动策略定义时间或为 CRON 驱动策略定义 CRON 表达式。

Run Schedule

GetFile 属性

GetFile 提供多个属性,如下图所示,包括必填属性(如输入目录和文件过滤器)和可选属性(如路径过滤器和最大文件大小)。用户可以使用这些属性来管理文件获取过程。

GetFile Properties

GetFile 注释

此部分用于指定有关处理器的任何信息。

GetFile Comments

PutFile

PutFile 处理器用于将文件从数据流存储到特定位置。

PutFile

PutFile 设置

PutFile 处理器具有以下设置:

名称

在“名称”设置中,用户可以根据项目或更具意义的名称为处理器定义任何名称。

启用

用户可以使用此设置启用或禁用处理器。

惩罚持续时间

此设置允许用户在 FlowFile 失败时添加惩罚时间。

产量持续时间

此设置用于指定处理器的产量时间。在此期间,该过程不会再次被调度。

公告级别

此设置用于指定该处理器的日志级别。

自动终止关系

此设置列出了该特定进程的所有可用关系的复选框。通过选中复选框,用户可以对处理器进行编程,以便在该事件发生时终止 FlowFile,并且不将其进一步发送到流中。

Automatically Terminate

PutFile 调度

以下是 PutFile 处理器提供的调度选项:

调度策略

您可以通过选择“时间驱动”来按时间安排进程,或者通过选择“CRON 驱动”选项来选择指定的 CRON 字符串。还有一个实验性策略“事件驱动”,它将在特定事件发生时触发处理器。

并发任务

此选项用于定义此处理器的并发任务调度。

执行

用户可以使用此选项定义是让处理器在所有节点上运行还是仅在主节点上运行。

运行计划

它用于为时间驱动策略定义时间或为 CRON 驱动策略定义 CRON 表达式。

Putfile Run Schedule

PutFile 属性

PutFile 处理器提供诸如“目录”之类的属性,用于指定文件传输的输出目录以及其他管理传输的属性,如下图所示。

PutFile Properties

PutFile 注释

此部分用于指定有关处理器的任何信息。

Putfile Comments
广告