HCatalog Tutorial

HCatalog 教程

HCatalog 是 Hadoop 的表存储管理工具,它将 Hive 元存储的表格数据暴露给其他 Hadoop 应用程序。它允许使用不同数据处理工具(Pig、MapReduce)的用户轻松将数据写入网格。HCatalog 确保用户无需担心数据存储的位置或格式是什么。本教程较为简短,仅介绍 HCatalog 的基础知识及如何使用它。

受众

本教程面向希望使用 Hadoop 框架在“大数据分析”领域谋求职业的专业人员。数据抽取、转换、加载 (ETL) 开发人员和从事分析工作的专业人员也可以有效利用本教程。

先决条件

在继续本教程之前,你需要掌握 Java 核心知识、SQL 数据库概念、Hadoop 文件系统以及任何 Linux 操作系统版本的基本知识。

广告
© . All rights reserved.