HCatalog 教程


HCatalog 是 Hadoop 的表存储管理工具,可将 Hive Metastore 的表格数据公开给其他 Hadoop 应用程序。它使具有不同数据处理工具(Pig、MapReduce)的用户能够轻松地将数据写入网格。 HCatalog 确保用户不必担心他们的数据存储在何处或以何种格式存储。这是一个小教程,仅解释 HCatalog 的基础知识以及如何使用它。

适用人群


本教程适用于有志于使用 Hadoop 框架从事大数据分析的专业人士。通常从事分析的 ETL 开发人员和专业人员也可以使用本教程来获得良好的效果。

学习前提


在继续本教程之前,你需要具备核心 Java、SQL 的数据库概念、Hadoop 文件系统和任何 Linux 操作系统风格的基本知识。