Skip to content

Apache Hive

简介

Apache Hive 是基于 Hadoop 的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的 sql 查询功能,可以将 sql 语句转换为 MapReduce 任务进行运行。

其优点是学习成本低,可以通过类 SQL 语句快速实现简单的 MapReduce 统计,不必开发专门的 MapReduce 应用,十分适合数据仓库的统计分析。

Hive 是一个数据仓库基础工具在 Hadoop 中用来处理结构化数据。

它架构在 Hadoop 之上,总归为大数据,并使得查询和分析方便。