摘要:
提高 MapReduce 价值,自定义输入和输出。比如跳过存储到 HDFS 中这个耗时的布置。 而只是从原始数据源接受数据,或者直接将数据发送给某些处理程序。 这些处理程序在 MapReduce 作业完成后使用这些数据。 有时由文件块和输入 split 组成的基础 Hadoop 范式并不能满足需求。 此时自定义 InputFormat 和 OutputFormat 。三种处理输入的模式: 1... 阅读全文
posted @ 2016-03-08 18:28
rocky_24
阅读(778)
评论(0)
推荐(0)

浙公网安备 33010602011771号