- Apache NiFi 教程
- Apache NiFi - 首页
- Apache NiFi - 简介
- Apache NiFi - 基本概念
- Apache NiFi - 环境设置
- Apache NiFi - 用户界面
- Apache NiFi - 处理器
- Apache NiFi - 处理器分类
- Apache NiFi - 处理器关系
- Apache NiFi - FlowFile
- Apache NiFi - 队列
- Apache NiFi - 处理组
- Apache NiFi - 标签
- Apache NiFi - 配置
- Apache NiFi - 管理
- Apache NiFi - 创建数据流
- Apache NiFi - 模板
- Apache NiFi - API
- Apache NiFi - 数据来源
- Apache NiFi - 监控
- Apache NiFi - 升级
- Apache NiFi - 远程处理组
- Apache NiFi - 控制器设置
- Apache NiFi - 报表任务
- Apache NiFi - 自定义处理器
- Apache NiFi - 自定义控制器服务
- Apache NiFi - 日志记录
- Apache NiFi 有用资源
- Apache NiFi - 快速指南
- Apache NiFi - 有用资源
- Apache NiFi - 讨论
Apache NiFi - 处理器
Apache NiFi 处理器是创建数据流的基本模块。每个处理器都有不同的功能,有助于创建输出 FlowFile。下图所示的数据流使用 GetFile 处理器从一个目录获取文件,并使用 PutFile 处理器将其存储到另一个目录。
GetFile
GetFile 处理器用于从特定目录获取特定格式的文件。它还为用户提供其他选项以更好地控制获取过程。我们将在下面的属性部分讨论它。
GetFile 设置
以下是 GetFile 处理器的不同设置:
名称
在“名称”设置中,用户可以根据项目或更具意义的名称为处理器定义任何名称。
启用
用户可以使用此设置启用或禁用处理器。
惩罚持续时间
此设置允许用户在 FlowFile 失败时添加惩罚时间。
产量持续时间
此设置用于指定处理器的产量时间。在此期间,不会再次调度该过程。
公告级别
此设置用于指定该处理器的日志级别。
自动终止关系
此设置列出了该特定进程的所有可用关系的复选框。通过选中复选框,用户可以对处理器进行编程,以便在该事件发生时终止 FlowFile,并且不将其进一步发送到流中。
GetFile 调度
以下是 GetFile 处理器提供的调度选项:
调度策略
您可以通过选择“时间驱动”来按时间安排进程,或者通过选择“CRON 驱动”选项来选择指定的 CRON 字符串。
并发任务
此选项用于定义此处理器的并发任务调度。
执行
用户可以使用此选项定义是让处理器在所有节点上运行还是仅在主节点上运行。
运行计划
它用于为时间驱动策略定义时间或为 CRON 驱动策略定义 CRON 表达式。
GetFile 属性
GetFile 提供多个属性,如下图所示,包括必填属性(如输入目录和文件过滤器)和可选属性(如路径过滤器和最大文件大小)。用户可以使用这些属性来管理文件获取过程。
GetFile 注释
此部分用于指定有关处理器的任何信息。
PutFile
PutFile 处理器用于将文件从数据流存储到特定位置。
PutFile 设置
PutFile 处理器具有以下设置:
名称
在“名称”设置中,用户可以根据项目或更具意义的名称为处理器定义任何名称。
启用
用户可以使用此设置启用或禁用处理器。
惩罚持续时间
此设置允许用户在 FlowFile 失败时添加惩罚时间。
产量持续时间
此设置用于指定处理器的产量时间。在此期间,该过程不会再次被调度。
公告级别
此设置用于指定该处理器的日志级别。
自动终止关系
此设置列出了该特定进程的所有可用关系的复选框。通过选中复选框,用户可以对处理器进行编程,以便在该事件发生时终止 FlowFile,并且不将其进一步发送到流中。
PutFile 调度
以下是 PutFile 处理器提供的调度选项:
调度策略
您可以通过选择“时间驱动”来按时间安排进程,或者通过选择“CRON 驱动”选项来选择指定的 CRON 字符串。还有一个实验性策略“事件驱动”,它将在特定事件发生时触发处理器。
并发任务
此选项用于定义此处理器的并发任务调度。
执行
用户可以使用此选项定义是让处理器在所有节点上运行还是仅在主节点上运行。
运行计划
它用于为时间驱动策略定义时间或为 CRON 驱动策略定义 CRON 表达式。
PutFile 属性
PutFile 处理器提供诸如“目录”之类的属性,用于指定文件传输的输出目录以及其他管理传输的属性,如下图所示。
PutFile 注释
此部分用于指定有关处理器的任何信息。