1 背景知识

1.1 解决问题

解决HDFS不支持单条记录的快速查找和更新的问题。

1.2 适用情况

  • 存在亿万条记录的数据库,只有千万或者百万条记录使用RDBMS更加合适

  • 确保你的应用不需要使用RDBMS的高级特性(第二索引,事务机制,高级查询语言等)

  • 足够的硬件配置,即节点数,HDFS在少于5个节点时并不会表现得很好,HBase也存在相同情况。

2 设计理念

2.1 概述

2.1.1 简介

  • 使用Java语言开发的NoSQL类型的分布式数据库

  • 不支持RDBMS的一些高级特性,如事务机制,第二索引,高级查询语言等

  • 支持线性和模块化扩展,可以通过在商用机器上增加RegionServer来线性提高性能

2.1.2 HBase特性: