Apache NiFi - 基本概念



Apache NiFi 由一个 Web 服务器、流控制器和一个处理器组成,这些组件都在 Java 虚拟机上运行。它还具有 3 个存储库:Flowfile 存储库、内容存储库和溯源存储库,如下面的图所示。

Apache Web Server

Flowfile 存储库

此存储库存储每个通过 Apache NiFi 数据流的 Flowfile 的当前状态和属性。此存储库的默认位置位于 Apache NiFi 的根目录中。可以通过更改名为“nifi.flowfile.repository.directory”的属性来更改此存储库的位置。

内容存储库

此存储库包含 NiFi 中所有 Flowfile 中的所有内容。其默认目录也位于 NiFi 的根目录中,可以使用“org.apache.nifi.controller.repository.FileSystemRepository”属性更改它。此目录使用大量磁盘空间,因此建议在安装磁盘中有足够的可用空间。

溯源存储库

该存储库跟踪并存储 NiFi 中所有流经 Flowfile 的所有事件。有两个溯源存储库 - **易失性溯源存储库**(在此存储库中,所有溯源数据在重新启动后都会丢失)和**持久性溯源存储库**。其默认目录也位于 NiFi 的根目录中,可以使用“org.apache.nifi.provenance.PersistentProvenanceRepository”和“org.apache.nifi.provenance.VolatileProvenanceRepositor”属性分别更改这两个存储库。

Provenance Repository
广告

© . All rights reserved.