Hive学习笔记总结

01.Hive是什么

1. Hive介绍

  • Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。

  • Hive是SQL解析引擎,它将SQL语句转译成M/R Job然后在Hadoop执行。

2. Hive架构

  • 用户接口,包括 CLI,JDBC/ODBC,WebUI

  • 元数据存储,通常是存储在关系数据库如 mysql, derby 中

  • 解释器、编译器、优化器、执行器

  • Hadoop:用 HDFS 进行存储,利用 MapReduce 进行计算

Ps:hive的元数据并不存放在hdfs上,而是存储在数据库中(metastore),目前只支持 mysql、derby。H