02 2018 档案

摘要:最近用spark的mlib模块中的协同过滤库做个性化推荐。spark里面用的是als算法,本质上是矩阵分解svd降维,把一个M*N的用户商品评分矩阵分解为M*K的userFeature(用户特征矩阵)和K*N的productFeature(商品特征矩阵),由于K远小于N和M,存储和计算获得相应的优化 阅读全文
posted @ 2018-02-07 09:48 明春 阅读(123) 评论(0) 推荐(0) 编辑
摘要:spark内部原理由浅入深 阅读全文
posted @ 2018-02-06 17:20 明春 阅读(281) 评论(0) 推荐(1) 编辑