MapReduce-边数据
摘要:
边数据 边数据(side data)是作业所需的额外的只读数据,以辅助处理主数据集。所面临的挑战在于如何使所有map或reduce任务(这些任务散布在集群内部)都能够方便而高效地使用边数据。 利用Job来配置作业 Configuration类的各种setter方法能够方便地配置作业的任一键值对。如果 阅读全文
posted @ 2018-09-24 15:04 嘣嘣嚓 阅读(246) 评论(0) 推荐(0)
posted @ 2018-09-24 15:04 嘣嘣嚓 阅读(246) 评论(0) 推荐(0)