NOSQL之Redis、MongDB、Habase、Cassandra的介绍与比较

一、Redis介绍                                                                        

1.1Redis优点

(1)Redis拥有非常丰富的数据结构:

(2)Redis提供事务的功能,可以保证一串命令的原子性,中间不会被任何打断。

(3)数据存储在内存中,读写非常的高速,可以达到10W/s的频率。

1.2Redis缺点

(1)Redis 3.0才出现官方的集群方案,但仍存在一些架构上的问题。

(2)持久化功能体验不佳:Redis 提供了RDB和AOF两种持久化机制:RDB将数据库的快照(snapshot)以二进制的方式保存到磁盘中,需要每个一段时间将数据写到磁盘上,代价非常高;AOF则以协议文本的方式,将所有对数据库进行过写入的命令(及其参数)记录到AOF文件中,以此达到记录数据库状态的目的。而aof方法只能追踪变化的数据,类似于mysql的binlog方法,但追加的log可能过大,同事所有操作需要重新执行一遍,恢复速度较慢。

(3)由于是内存数据库,所以,单台机器,存储的数据量,跟机器本身的内存大小。虽然redis本身有key的过期策略,但是还是很需要提前预估和节约内存。如果内存增长过快,需要定期删除数据。

1.3Redis适用场景

(1)会话缓存:目前最常见的Redis使用场景是会话缓存,使用Redis来作为会话缓存,而不使用类似Memcached的其他会话缓存,是因为Redis提供持久化。当维护并不要求严格一致性记录的缓存时,用户们并不希望看到购物车信息不见了。

(2)全页缓存:除了基本的会话token,Redis 提供了一个非常容易操作的FPC平台。回到一致性的问题,即使重启了Redis实例,由于磁盘持久化的原因,用户并不会看到加载页面时速度明显的下降。

(3)队列:Redis内存存储引擎可以进行list和set操作,这使它可以作为一个很好的消息队列平台来使用,对Redis进行队列操作,就像本地使用Python对lists进行push和pop操作。

(4)排行榜/计数器:Redis在内存中对数字的递增和递减操作实现的非常好,(Set)集合和(Sorted Set)有序集合让我们在进行这种操作时更加容易,Redis只是正好提供了这两种数据结果。所以在进行类似在有序集合中查找前十个用户这种操作,我们只需要一行代码

 

ZRANGE user_scores 0 10

 

(5)订阅/发布功能:Redis的订阅发布功能。使用Redis订阅发布功能的案例非常普遍,甚至有人用它来搭建社交网络连接,还可作为基于发布/订阅的脚本触发器,甚至用Redis的发布/订阅功能来建立聊天系统。

 二、MONGDB介绍                                                                       

2.1MONGDB优点 

(1). 强大的自动化 shading 功能;

(2). 全索引支持,查询非常高效;

(3). 面向文档(BSON)存储,数据模式简单而强大。

(4). 支持动态查询,查询指令也使用JSON形式的标记,可轻易查询文档中内嵌的对象及数组。

(5). 支持 javascript 表达式查询,可在服务器端执行任意的 javascript函数。

2.2MONGDB缺点

(1). 单个文档大小限制为16M,32位系统上,不支持大于2.5G的数据;

(2). 对内存要求比较大,至少要保证热数据(索引,数据及系统其它开销)都能装进内存;

(3). 非事务机制,无法保证事件的原子性。
2.2MONGDB适用场景

(1). 适用于实时的插入、更新与查询的需求,并具备应用程序实时数据存储所需的复制及高度伸缩性;

(2). 非常适合文档化格式的存储及查询;

(3). 高伸缩性的场景:MongoDB 非常适合由数十或者数百台服务器组成的数据库。

(4). 对性能的关注超过对功能的要求。

、Hbase介绍                                                                                      

HBase 是 Apache Hadoop 中的一个子项目,属于 bigtable 的开源版本,所实现的语言为Java。HBase 依托于 Hadoop 的 HDFS作为最基本存储基础单元。

3.1Hbase优点

(1). 存储容量大,一个表可以容纳上亿行,上百万列;

(2). 可通过版本进行检索,能搜到所需的历史版本数据;

(3). 负载高时,可通过简单的添加机器来实现水平切分扩展,跟Hadoop的无缝集成保障了其数据可靠性(HDFS)和海量数据分析的高性能(MapReduce)

(4). 在第3点的基础上可有效避免单点故障的发生。

3.2Hbase缺点

(1). 基于Java语言实现及Hadoop架构意味着其API更适用于Java项目;

(2). node开发环境下所需依赖项较多、配置麻烦(或不知如何配置,如持久化配置),缺乏文档;

(3). 占用内存很大,且鉴于建立在为批量分析而优化的HDFS上,导致读取性能不高;

(4). API相比其它 NoSql 的相对笨拙。

3.3Hbase适用场景

(1). bigtable类型的数据存储;

(2). 对数据有版本查询需求;

(3). 应对超大数据量要求扩展简单的需求。

四、Cassandra介绍                                                                                  

Cassandra 是一个来自 Apache 的分布式数据库,具有高度可扩展性,可用于管理大量的结构化数据。它提供了高可用性,没有单点故障。

4.1Cassandra优点

(1)弹性可扩展性 - Cassandra是高度可扩展的; 它允许添加更多的硬件以适应更多的客户和更多的数据根据要求。

(2)始终基于架构 - Cassandra没有单点故障,它可以连续用于不能承担故障的关键业务应用程序。

(3)快速线性性能 - Cassandra是线性可扩展性的,即它为你增加集群中的节点数量增加你的吞吐量。因此,保持一个快速的响应时间。

(4)灵活的数据存储 - Cassandra适应所有可能的数据格式,包括:结构化,半结构化和非结构化。它可以根据您的需要动态地适应变化的数据结构。

(5)便捷的数据分发 - Cassandra通过在多个数据中心之间复制数据,可以灵活地在需要时分发数据。

(6)事务支持 - Cassandra支持属性,如原子性,一致性,隔离和持久性(ACID)。

(7)快速写入 - Cassandra被设计为在廉价的商品硬件上运行。 它执行快速写入,并可以存储数百TB的数据,而不牺牲读取效率。

 4.2Cassandra缺点

(1)它未采用hdfs文件系统,所以存在与Hadoop难以协同的问题。数据源在cassandra存储体系中,不利于mapreduce分析。
(2)该开源体系尚不成熟,代码稳定性存在不确定性,先后被一些大型互联网公司采用又弃用。
(3)其快速查询的功能有hbase这样的列存式数据库这样的替代品。                                                                                                            

参考链接:

(1)https://www.objectrocket.com/blog/how-to/top-5-redis-use-cases

(2)https://redis.io/documentation

(3)http://redisbook.readthedocs.io/en/latest/internal/aof.html#id

(4)https://www.w3cschool.cn/cassandra/

(5)http://www.dataguru.cn/thread-189148-1-1.html

 

posted @ 2018-02-02 17:33  Rainydayfmb  阅读(698)  评论(0编辑  收藏  举报