NOSQL之简介

什么是NOSQL?

NOSQL(NOSQL=Not Only SQL),意味着“不仅仅是SQL”,是一个全新的数据库概念,泛指非关系型的数据库。

为什么需要NoSQL?

  • 1.High performance -对数据库高并发读写的请求。
    WEB2.0网站要根据用户个性化信息来实时生成动态页面和提供动态信息,所以基本上无法使用动态页面静态化技术,因此数据库并发负载非常高,往往要求达到上万次读写请求。关系数据库应付上万次SQL查询还勉强定得住,但是应付上万次SQL写数据请求,硬盘IO就已经无法承受了。其实对于普通的BBS网站,往往也存在高并发写请求的需求,例如网站的实时统计在线用户状态,记录热门帖子的点击次数,投票计数等,因此这时一个相当普遍的需求。
  • 2.Huge Storage - 对海量数据的高效率存储和访问的需求。
    类似Facebook这样的SNS网站,每天用户产生海量的用户动态,以Friendfeed为例,一个月就达到了2.5亿条用户动态,对于关系型数据库来说,在一张2.5亿条记录的表里面进行SQL查询,效率是及其低下乃至于不可忍受的。再例如大型web网站的用户登录系统,例如腾讯,盛大,动辄数以亿计的账号,关系型数据库也很难应付。
  • 3.High Scalability&Hign Availability - 对数据库的高可拓展性和高可用性的需求。
    在基于web的架构中,数据库是最难以进行横向拓展的,当一个应用系统的用户量和访问量与日俱增的时候,你的数据库却没有办法像web server和app server 那样简单的通过添加更多的硬件和服务节点来拓展性能和负载能力。对于很多需要提供24小时不间断服务的网站来说,对数据库系统进行升级和拓展是非常痛苦的事情,往往需要进行停机维护和数据迁移,为什么数据库不能通过不断的添加服务节点来实现拓展呢?

NoSQL数据库的产生就是为了解决大规模数据集合多重数据种类带来的挑战,尤其是大数据应用难题

NoSQL主流产品

NoSQL数据库的四大分类如下:

  • 键值(key-value)存储数据库
    相关产品:Tokyo Cabinet/Tyrant、Redis、Voldemort、Berkeley DB
    典型应用:内容缓存,主要用于处理大量数据的高访问负载。
    数据模型:一系列键值对
    优势:快速查询
    劣势:存储的数据缺少结构化

  • 列存储数据库
    相关产品:Cassandra、HBase、Riak
    典型应用:分布式的文件系统
    数据模型:以列簇式存储,将同一列数据存放在一起。
    优势:查找速度快,可拓展性强,更容易进行分布式拓展。
    劣势:功能相对局限。

  • 文档型数据库
    相关产品:CouchDB、MongoDB
    典型应用:Web应用(与key-value类似,Value是结构化的)
    数据模型:一系列键值对。
    优势:数据结构要求不严格
    劣势:查询性能不高,而且缺乏统一的查询语法。

  • 图形(Graph)数据库
    相关数据库:Neo4J、InfoGrid、Infinite Graph
    典型应用:社交网络
    数据模型:图结构
    优势:利用图结构相关算法。
    劣势:需要对整个图做计算才能得出结果,不容易做分布式的集群方案。

NoSQL的特点

  • 1.易拓展
    NoSQL数据库种类繁多,但是一个共同的特点就是去掉关系数据库的关系型特性。数据之间无关系,这样就非常容易拓展,也无形之间,在架构的层面上带来了可拓展的能力。
  • 2.大数据量,高性能
    NoSQL数据库都具有非常高的读写性能,尤其在大数据量下,同样表现优秀,这得益于它的无关系性,数据库的结构简单。
  • 3.灵活的数据模型
    NoSQL无需事先未要存储的数据建立字段,随时可以存储自定义的数据格式。而在关系数据库里,增删字段是一件非常麻烦的事情。如果是非常大数据量的表,增加字段简直就是一个噩梦。这点在大数据量的Web2.0时代尤其重要。
  • 4.高可用
    NoSQL在不太影响性能的情况,就可以方便的实现高可用的架构。比如Cassandra,HBase模型,通过复制模型也可以实现高可用。
posted @ 2023-03-15 01:09  King-DA  阅读(21)  评论(0)    收藏  举报