摘要:
题目: 一个文件,大小约为100G。文件的每一行都是一个数字,要求对文件中的所有数字进行排序。 对于这个题目,了解过Hadoop的同学可以笑而不语了。即使用spark实现也是非常简单的事情。 先说下如何用Hadoop实现。实际上也没什么好说的:Map任务逐行读入数字,而后在Reduce中输出就可以了,简单粗暴到令人发指。 看下代码好了: package com.zhyea.dev; impor... 阅读全文
posted @ 2017-09-18 07:07
robin·张
阅读(536)
评论(0)
推荐(0)
浙公网安备 33010602011771号