Apache Tajo 教程


Apache Tajo 是一个用于 Hadoop 的开源分布式数据仓库框架。 Tajo 最初是由 Gruter 创立的,Gruter 是韩国一家基于 Hadoop 的基础设施公司。后来,来自 Intel、Etsy、NASA、Cloudera、Hortonworks 的专家也为该项目做出了贡献。 Tajo在韩语中是鸵鸟的意思。 2014年3月,Tajo被授予顶级开源Apache项目。本教程将探索 Tajo 的基础知识并继续,它将解释集群设置、Tajo shell、SQL 查询、与其他大数据技术的集成,最后以一些示例结束。

适用人群


在继续本教程之前,你必须对核心 Java、任何 Linux 操作系统和 DBMS 有充分的了解。

学习前提


本教程是为有志从事大数据分析工作的专业人士准备的。本教程将使你对 Apache Tajo 有足够的了解。