摘要:
Zookeeper在Hadoop的HA中的应用 非HA的弊端: HDFS集群的分布式存储是靠namenode节点(namenode负责响应客户端请求)来实现。在非HA集群中一旦namenode宕机,虽然元数据不会丢失,但整个集群将无法对外提供服务,导致HDFS服务的可靠性不高,这在实际应用场景中显然 阅读全文
posted @ 2019-02-22 21:39
流氓小伙子
阅读(412)
评论(0)
推荐(0)
摘要:
一、背景 MapReduce提供了表连接操作其中包括Map端join、Reduce端join还有半连接,现在我们要讨论的是Map端join,Map端join是指数据到达map处理函数之前进行合并的,效率要远远高于Reduce端join,因为Reduce端join是把所有的数据都经过Shuffle,非 阅读全文
posted @ 2019-02-22 11:50
流氓小伙子
阅读(1985)
评论(0)
推荐(1)

浙公网安备 33010602011771号