摘要: rpc是Hadoop分布式底层通信的基础,无论是client和namenode,namenode和datanode,以及yarn新框架之间的通信模式等等都是采用的rpc方式。 下面我们来概要分析一下Hadoop2的rpc。 Hadoop通信模式主要是C/S方式,及客户端和服务端的模式。 客户端采用传 阅读全文
posted @ 2016-09-28 20:12 thinker1017 阅读(716) 评论(0) 推荐(0)
摘要: 一致性哈希算法是分布式系统中常用的算法。比如,一个分布式的存储系统,要将数据存储到具体的节点上,如果采用普通的hash方法,将数据映射到具体的节点上,如key%N,key是数据的key,N是机器节点数,如果有一个机器加入或退出这个集群,则所有的数据映射都无效了,如果是持久化存储则要做数据迁移,如果是 阅读全文
posted @ 2016-09-28 20:04 thinker1017 阅读(305) 评论(0) 推荐(0)
摘要: 本文将分两部分介绍,第一部分讲解使用 HBase 新版 API 进行 CRUD 基本操作;第二部分讲解如何将 Spark 内的 RDDs 写入 HBase 的表中,反之,HBase 中的表又是如何以 RDDs 形式加载进 Spark 内的。 环境配置 为了避免版本不一致带来不必要的麻烦,API 和 阅读全文
posted @ 2016-09-28 20:01 thinker1017 阅读(8426) 评论(0) 推荐(0)