一、常见的NoSQL数据库?什么是HBase?
1、常见的NoSQL数据库
- Redis:基于内存,提供RDB、AOF持久化;从3.x开始,提供Redis Cluster(分布式存储,核心Hash分区)
- HBase:基于HDFS之上的NoSQL数据库;主从架构(HMaster、RegionServer),单点故障
列式存储
HBase HDFS
表 目录
列族 目录
数据 文件(HFile:默认大小:128M)
- Cassandra:列式存储、不需要HDFS;去中心化架构
- MongoDB:文档(BSON文档,是JSON的二进制)型的NoSQL,最像关系型数据库的NoSQL数据库
2、行式存储:
- 关系型数据库(Oracle、MySQL等等),insert update delete
- 列式存储:HBase、Cassandra,适合select操作, 在Spark SQL中,默认数据源:Parquet文件(列式存储文件)
二、HBase的体系架构、表结构
1、HBase的表结构