2014年3月21日
摘要: hadoop关联文件处理,主要利用了reduce函数相同的KEY值聚合在一起的规则。 阅读全文
posted @ 2014-03-21 19:12 ringwang 阅读(398) 评论(0) 推荐(0)
摘要: 这段代码的功能是过滤需要的URL,里面使用了参数传递,正则表达式匹配(另外使用循环测试,在数据量小于1G的时候差别不大,大量数据没测试) 阅读全文
posted @ 2014-03-21 10:03 ringwang 阅读(3863) 评论(0) 推荐(1)