Apache Tajo Tutorial

Apache Tajo 教程

Apache Tajo 是一个开源的分布式数据仓库框架,用于 Hadoop。Tajo 最初由韩国一家基于 Hadoop 的基础设施公司 Gruter 启动。后来,英特尔、Etsy、NASA、Cloudera 和 Hortonworks 的专家也为该项目做出了贡献。Tajo 在韩语中指的是鸵鸟。2014 年 3 月,Tajo 被授予顶级开源 Apache 项目。本教程将探讨 Tajo 的基础知识,然后解释集群设置、Tajo shell、SQL 查询、与其他大数据技术的集成,最后以一些示例结束。

目标读者

在继续本教程之前,您必须具备扎实的 Java 核心知识、任何 Linux 操作系统知识以及数据库管理系统 (DBMS) 知识。

前提条件

本教程是为立志在大数据分析领域发展职业的专业人士准备的。本教程将使您充分了解 Apache Tajo。

广告