摘要:
题目: 思路: 首先从 ratings.dat 中计算出电影id,平均评分。得出一个中间表。 通过分析,中间表比 movis.dat 要小,所以优先考虑将中间表加载到内存中,写入到一个hashmap中,做 map join。 Map 端处理movies.dat 中的数据,根据电影 id 关联 has 阅读全文
posted @ 2019-09-02 18:37
Keep-Smile
阅读(3327)
评论(0)
推荐(0)

浙公网安备 33010602011771号