摘要:
hadoop关联文件处理,主要利用了reduce函数相同的KEY值聚合在一起的规则。 阅读全文
posted @ 2014-03-21 19:12
ringwang
阅读(398)
评论(0)
推荐(0)
摘要:
这段代码的功能是过滤需要的URL,里面使用了参数传递,正则表达式匹配(另外使用循环测试,在数据量小于1G的时候差别不大,大量数据没测试) 阅读全文
posted @ 2014-03-21 10:03
ringwang
阅读(3863)
评论(0)
推荐(1)