NOSQL之Redis、MongDB、Habase、Cassandra的介绍与比较

一、Redis介绍

1.1Redis优点

(1)Redis拥有非常丰富的数据结构：

(2)Redis提供事务的功能，可以保证一串命令的原子性，中间不会被任何打断。

(3)数据存储在内存中，读写非常的高速，可以达到10W/s的频率。

1.2Redis缺点

(1)Redis 3.0才出现官方的集群方案，但仍存在一些架构上的问题。

(2)持久化功能体验不佳：Redis 提供了RDB和AOF两种持久化机制:RDB将数据库的快照(snapshot)以二进制的方式保存到磁盘中，需要每个一段时间将数据写到磁盘上，代价非常高；AOF则以协议文本的方式，将所有对数据库进行过写入的命令(及其参数)记录到AOF文件中，以此达到记录数据库状态的目的。而aof方法只能追踪变化的数据，类似于mysql的binlog方法，但追加的log可能过大，同事所有操作需要重新执行一遍，恢复速度较慢。

(3)由于是内存数据库，所以，单台机器，存储的数据量，跟机器本身的内存大小。虽然redis本身有key的过期策略，但是还是很需要提前预估和节约内存。如果内存增长过快，需要定期删除数据。

1.3Redis适用场景

(1)会话缓存:目前最常见的Redis使用场景是会话缓存，使用Redis来作为会话缓存，而不使用类似Memcached的其他会话缓存，是因为Redis提供持久化。当维护并不要求严格一致性记录的缓存时，用户们并不希望看到购物车信息不见了。

(2)全页缓存:除了基本的会话token,Redis 提供了一个非常容易操作的FPC平台。回到一致性的问题，即使重启了Redis实例，由于磁盘持久化的原因，用户并不会看到加载页面时速度明显的下降。

(3)队列：Redis内存存储引擎可以进行list和set操作，这使它可以作为一个很好的消息队列平台来使用，对Redis进行队列操作，就像本地使用Python对lists进行push和pop操作。

(4)排行榜/计数器：Redis在内存中对数字的递增和递减操作实现的非常好，(Set)集合和(Sorted Set)有序集合让我们在进行这种操作时更加容易，Redis只是正好提供了这两种数据结果。所以在进行类似在有序集合中查找前十个用户这种操作，我们只需要一行代码

ZRANGE user_scores 0 10

(5)订阅/发布功能：Redis的订阅发布功能。使用Redis订阅发布功能的案例非常普遍，甚至有人用它来搭建社交网络连接，还可作为基于发布/订阅的脚本触发器，甚至用Redis的发布/订阅功能来建立聊天系统。

二、MONGDB介绍

2.1MONGDB优点

(1). 强大的自动化 shading 功能；

(2). 全索引支持，查询非常高效；

(3). 面向文档（BSON）存储，数据模式简单而强大。

(4). 支持动态查询，查询指令也使用JSON形式的标记，可轻易查询文档中内嵌的对象及数组。

(5). 支持 javascript 表达式查询，可在服务器端执行任意的 javascript函数。

2.2MONGDB缺点

(1). 单个文档大小限制为16M，32位系统上，不支持大于2.5G的数据；

(2). 对内存要求比较大，至少要保证热数据（索引，数据及系统其它开销）都能装进内存；

(3). 非事务机制，无法保证事件的原子性。
2.2MONGDB适用场景

(1). 适用于实时的插入、更新与查询的需求，并具备应用程序实时数据存储所需的复制及高度伸缩性；

(2). 非常适合文档化格式的存储及查询；

(3). 高伸缩性的场景：MongoDB 非常适合由数十或者数百台服务器组成的数据库。

(4). 对性能的关注超过对功能的要求。

三、Hbase介绍

HBase 是 Apache Hadoop 中的一个子项目，属于 bigtable 的开源版本，所实现的语言为Java。HBase 依托于 Hadoop 的 HDFS作为最基本存储基础单元。

3.1Hbase优点

(1). 存储容量大，一个表可以容纳上亿行，上百万列；

(2). 可通过版本进行检索，能搜到所需的历史版本数据；

(3). 负载高时，可通过简单的添加机器来实现水平切分扩展，跟Hadoop的无缝集成保障了其数据可靠性（HDFS）和海量数据分析的高性能（MapReduce）；

(4). 在第3点的基础上可有效避免单点故障的发生。

3.2Hbase缺点

(1). 基于Java语言实现及Hadoop架构意味着其API更适用于Java项目；

(2). node开发环境下所需依赖项较多、配置麻烦（或不知如何配置，如持久化配置），缺乏文档；

(3). 占用内存很大，且鉴于建立在为批量分析而优化的HDFS上，导致读取性能不高；

(4). API相比其它 NoSql 的相对笨拙。

3.3Hbase适用场景

(1). bigtable类型的数据存储；

(2). 对数据有版本查询需求；

(3). 应对超大数据量要求扩展简单的需求。

四、Cassandra介绍

Cassandra 是一个来自 Apache 的分布式数据库，具有高度可扩展性，可用于管理大量的结构化数据。它提供了高可用性，没有单点故障。

4.1Cassandra优点

(1)弹性可扩展性 - Cassandra是高度可扩展的; 它允许添加更多的硬件以适应更多的客户和更多的数据根据要求。

(2)始终基于架构 - Cassandra没有单点故障，它可以连续用于不能承担故障的关键业务应用程序。

(3)快速线性性能 - Cassandra是线性可扩展性的，即它为你增加集群中的节点数量增加你的吞吐量。因此，保持一个快速的响应时间。

(4)灵活的数据存储 - Cassandra适应所有可能的数据格式，包括：结构化，半结构化和非结构化。它可以根据您的需要动态地适应变化的数据结构。

(5)便捷的数据分发 - Cassandra通过在多个数据中心之间复制数据，可以灵活地在需要时分发数据。

(6)事务支持 - Cassandra支持属性，如原子性，一致性，隔离和持久性（ACID）。

(7)快速写入 - Cassandra被设计为在廉价的商品硬件上运行。它执行快速写入，并可以存储数百TB的数据，而不牺牲读取效率。

4.2Cassandra缺点

(1)它未采用hdfs文件系统，所以存在与Hadoop难以协同的问题。数据源在cassandra存储体系中，不利于mapreduce分析。

(2)该开源体系尚不成熟，代码稳定性存在不确定性，先后被一些大型互联网公司采用又弃用。

(3)其快速查询的功能有hbase这样的列存式数据库这样的替代品。

参考链接：

(1)https://www.objectrocket.com/blog/how-to/top-5-redis-use-cases

(2)https://redis.io/documentation

(3)http://redisbook.readthedocs.io/en/latest/internal/aof.html#id

(4)https://www.w3cschool.cn/cassandra/

(5)http://www.dataguru.cn/thread-189148-1-1.html

posted @ 2018-02-02 17:33 Rainydayfmb 阅读(814) 评论(0) 收藏举报

刷新页面返回顶部

Rainydayfmb

山在那里，我正年轻，我得去看看。

NOSQL之Redis、MongDB、Habase、Cassandra的介绍与比较

公告