Titan

一. Titan优势

  1. Titan
    (1)支持很大的图,集群中机器越大,图越大
    (2)支持很大的并发事务,并发图形处理。大图的复杂查询在毫秒级响应
    (3)用hadoop进行图形分析和批量图形处理
    (4)用TinkerPop完成图形数据模型
    (5)Gremlin作为图形遍历sql
    (6)解决super node问题(给顶点的关联边添加kv参数)

  2. Titan with Cassandra与Titan with Hbase
    (1)hadoop + 强一致性
    【系统中的某个数据被成功更新后,后续任何对该数据的读取操作都将得到更新后的值。分布式系统需要花时间在节点数据更新复制上,严格一致性不存在,要尽量减小节点间数据的复制时间】
    (2)CAP原则:在一个分布式系统中, Consistency(一致性)、 Availability(可用性)、Partition tolerance(分区容错性),三者不可得兼

( a ) 一致性:所有数据备份,在同一时间有相同的值
( b ) 可用性:集群中一部分节点出故障后,是否还响应客户端的读写请求
( c ) 分区容错性:如果分布式系统在一短时间内不能达到一致性,就说明节点间发生了分区现象,要从等待一致性和响应请求的可用性上作出权衡

(3)hbase会停止响应,cassandra在非一致的情况下返回数据

二. Titan架构

  1. OLTP :
    (1)实时性,带有事务的数据量小的存取操作 (RDBMS)
    (2)Cassandra,HBase,BerkeleyDB
  2. OLAP :
    (1)实时性低的,数据量大的分析操作 (数据仓库)
    (2)Spark,Hadoop,Giraph
posted @ 2016-05-31 18:29  lj72808up  阅读(230)  评论(0编辑  收藏  举报