Apache Flume 简介

什么是 Flume？

Apache Flume 是一款用于收集、聚合和传输大量流式数据的工具/服务/数据摄取机制，例如来自各种来源的日志文件、事件（等等）到中心化数据存储。

Flume 是一款高度可靠、分布式且可配置的工具。它主要设计用于将流式数据（日志数据）从各种 Web 服务器复制到 HDFS。

假设一个电子商务 Web 应用程序想要分析特定区域的客户行为。为此，他们需要将可用的日志数据移动到 Hadoop 中进行分析。在这里，Apache Flume 可以帮上忙。

Flume 用于以更高的速度将应用程序服务器生成的日志数据移动到 HDFS。

以下是使用 Flume 的优势：

Flume 的一些显著特性如下：

Flume 高效地将来自多个 Web 服务器的日志数据导入中心化存储（HDFS、HBase）。
使用 Flume，我们可以立即将来自多个服务器的数据导入 Hadoop。
除了日志文件，Flume 还用于导入社交网络站点（如 Facebook 和 Twitter）和电子商务网站（如 Amazon 和 Flipkart）生成的巨量事件数据。
Flume 支持大量的源和目标类型。
Flume 支持多跳流、扇入扇出流、上下文路由等。
Flume 可以水平扩展。

打印页面