摘要: 自定义分区 我们在wordcount小案例中看到结果是1个part-r-000000的文件,那如果我想对统计结果, 按照不同的条件输出到不同的文件(分区),那该如何处理呢? 我们梳理一下这个过程先 一个文本文件,上传到hdfs后以block块存储,split到切片,一个切片对应一个maptask任务 阅读全文
posted @ 2021-04-21 00:13 Tenic 阅读(116) 评论(0) 推荐(0)