摘要: 一、每次输出文件存在很烦人 二、多重MR 阅读全文
posted @ 2016-12-03 01:09 加拿大小哥哥 阅读(855) 评论(0) 推荐(0)
摘要: 一、问题定义 我在网上找了些,关于二度人脉算法的实现,大部分无非是通过广度搜索算法来查找,犹豫深度已经明确了2以内;这个算法其实很简单,第一步找到你关注的人;第二步找到这些人关注的人,最后找出第二步结果中出现频率最高的一个或多个人(频率这块没完成),即完成。 但如果有千万级别的用户,那在运算时,就肯 阅读全文
posted @ 2016-12-03 01:03 加拿大小哥哥 阅读(3940) 评论(0) 推荐(1)