摘要: MapReduce 一种分布式计算框架,负责离线计算,输入就是HDFS文件系统的数据块。 优:处理大量数据,隐藏细节,自动化并行,负载均衡和容错机制,可以增加集群中的机器 劣:实时性差,响应缓慢 一个典型的MapReduce往往由几千台机器组成,处理以TB计算的数据。 编程模型 利用输入的key/v 阅读全文
posted @ 2019-01-26 10:33 注册以后还能改吧 阅读(119) 评论(0) 推荐(0) 编辑