日月的弯刀  
Where Amazing Happens!

随笔分类 -  MapReduce案例

  • ItemCF_基于物品的协同过滤_MapReduceJava代码实现思路
    摘要:ItemCF_基于物品的协同过滤 1. 概念 <!--more--> 2. 原理 如何给用户推荐? 给用户推荐他没有买过的物品--103 3. java代码实现思路 数据集: 第一步:构建物品的同现矩阵 第二步:构建用户的得分矩阵 第三步:同现矩阵*评分矩阵 第四步:拿到最终结果,排序,得到给用户的 阅读全文
    posted @ 2017-03-02 23:34 日月的弯刀 阅读(3233) 评论(0) 推荐(1)
  • TF-IDF_MapReduceJava代码实现思路
    摘要:TF-IDF 1. 概念 2. 原理 3. java代码实现思路 数据集: 三个MapReduce 第一个MapReduce:(利用ik分词器,将一篇博文,也就是一条记录中的content进行词的拆分) 第一个MapReduce最终运行的结果: 1. 得到数据集中微博的总数; 2. 得到每个词在当前 阅读全文
    posted @ 2017-03-02 23:33 日月的弯刀 阅读(1399) 评论(0) 推荐(0)
  • PageRank_网页排名_MapReduceJava代码实现思路
    摘要:PageRank 1. 概念 1. 概念 2. 原理 3. java代码实现思路 1、定义收敛标准 每次算出新的pr-oldpr=差值 ,所有页面的差值累加 ,除以pagecount,得到avg差值 ,如果。小于0.01 2、计算总页面数,并且算出每个页面的初始pr值=1/pagecount 3、 阅读全文
    posted @ 2017-03-02 23:32 日月的弯刀 阅读(420) 评论(0) 推荐(0)