Spark SQL 教程


Apache Spark 是专为快速计算而设计的闪电般快速的集群计算。它建立在 Hadoop MapReduce 之上,它扩展了 MapReduce 模型以有效地使用更多类型的计算,包括交互式查询和流处理。这是一个简短的教程,解释了 Spark SQL 编程的基础知识。

适用人群


本教程是为渴望使用 Spark 框架学习大数据分析基础知识并成为 Spark 开发人员的专业人士准备的。此外,它对分析专业人员和 ETL 开发人员也很有用。

学习前提


在开始学习本教程之前,我们假设你之前已经接触过 Scala 编程、数据库概念和任何 Linux 操作系统风格。