Apache NiFi - 处理器分类



在本章中,我们将讨论 Apache NiFi 中的处理器分类。

数据摄取处理器

数据摄取类别的处理器用于将数据摄取到 NiFi 数据流中。这些通常是 Apache NiFi 中任何数据流的起点。属于这些类别的一些处理器包括 GetFile、GetHTTP、GetFTP、GetKAFKA 等。

路由和中介处理器

路由和中介处理器用于根据 FlowFile 属性或内容中的信息将 FlowFile 路由到不同的处理器或数据流。这些处理器还负责控制 NiFi 数据流。属于此类别的一些处理器包括 RouteOnAttribute、RouteOnContent、ControlRate、RouteText 等。

数据库访问处理器

此数据库访问类别的处理器能够从数据库中选择或插入数据,或执行和准备其他 SQL 语句。这些处理器主要使用 Apache NiFi 的数据连接池控制器设置。属于此类别的一些处理器包括 ExecuteSQL、PutSQL、PutDatabaseRecord、ListDatabaseTables 等。

属性提取处理器

属性提取处理器负责在 NiFi 数据流中提取、分析、更改 FlowFile 属性处理。属于此类别的一些处理器包括 UpdateAttribute、EvaluateJSONPath、ExtractText、AttributesToJSON 等。

系统交互处理器

系统交互处理器用于在任何操作系统中运行进程或命令。这些处理器还运行多种语言的脚本以与各种系统交互。属于此类别的一些处理器包括 ExecuteScript、ExecuteProcess、ExecuteGroovyScript、ExecuteStreamCommand 等。

数据转换处理器

属于数据转换的处理器能够更改 FlowFile 的内容。这些可以用于完全替换 FlowFile 的数据,通常在用户必须将 FlowFile 作为 HTTP 主体发送以调用 InvokeHTTP 处理器时使用。属于此类别的一些处理器包括 ReplaceText、JoltTransformJSON 等。

发送数据处理器

发送数据处理器通常是数据流中的最终处理器。这些处理器负责将数据存储或发送到目标服务器。在成功存储或发送数据后,这些处理器将 FlowFile 与成功关系一起删除。属于此类别的一些处理器包括 PutEmail、PutKafka、PutSFTP、PutFile、PutFTP 等。

拆分和聚合处理器

这些处理器用于拆分和合并 FlowFile 中存在的内容。属于此类别的一些处理器包括 SplitText、SplitJson、SplitXml、MergeContent、SplitContent 等。

HTTP 处理器

这些处理器处理 HTTP 和 HTTPS 调用。属于此类别的一些处理器包括 InvokeHTTP、PostHTTP、ListenHTTP 等。

AWS 处理器

AWS 处理器负责与 Amazon Web Services 系统交互。属于此类别的一些处理器包括 GetSQS、PutSNS、PutS3Object、FetchS3Object 等。

广告