Apache Pig tutorial

Apache Pig 教程

Apache Pig 是 MapReduce 之上的一个抽象层。它是一个用于分析大型数据集的工具/平台,将数据集表示为数据流。Pig 通常与Hadoop一起使用;我们可以使用 Pig 在 Hadoop 中执行所有数据操作。

目标读者

本教程面向所有在 Hadoop 上工作的专业人士,他们希望执行 MapReduce 操作,而无需在 Java 中编写复杂的代码。

前提条件

为了充分利用本教程,您应该很好地理解 Hadoop 的基础知识和 HDFS 命令。如果您精通 SQL,那将更有帮助。

广告