Hive 教程


Hive 是一种数据仓库基础设施工具,用于在 Hadoop 中处理结构化数据。它驻留在 Hadoop 之上以汇总大数据,并使查询和分析变得容易。

这是一个简短的教程,介绍了如何将 Apache Hive HiveQL 与 Hadoop 分布式文件系统一起使用。本教程可能是你使用 Hive 成为成功的 Hadoop 开发人员的第一步。

适用人群


本教程是为有志于使用 Hadoop 框架从事大数据分析的专业人士准备的。通常从事分析的 ETL 开发人员和专业人员也可以使用本教程来获得良好的效果。

学习前提


在继续本教程之前,你需要具备核心 Java、SQL 的数据库概念、Hadoop 文件系统和任何 Linux 操作系统风格的基本知识。