MapReduce

并行计算框架(MapReduce)

适用于大数据量处理的分布式框架,是为离线数据分析而设计,利用数据的并行性进行分布运算,而后汇总结果的计算框架。

将任务拆分、分布、汇总,开发人员只需要实现业务逻辑;分布任务自动失败重试,单个任务失败不会造成整个任务退出;和HDFS整合,使计算移到数据所在的节点运行

posted @ 2019-05-21 23:11  油辣子  阅读(181)  评论(0)    收藏  举报