摘要:
python scikit-learn 环境搭建问题解决记录 阅读全文
摘要:
1.平均值
1.1 全局平均值
1.2 用户评分平均值
1.3 物品评分平均值
1.4 用户分类对物品分类的平均值
分类方法:
1.4.1 平均值分类
1.4.2 活跃度/流行度分类
2.基于邻域的方法
2.1 基于用户的协同过滤
2.2 基于物品的协同过滤
相似度计算方法选择:
基于共现矩阵的相似度
余弦相似度
3.隐语义模型与矩阵分解模型
3.1 ALS 矩阵分解模型
4.加入时间因素
1.基于邻域的模型融合时间信息
5.模型融合
1.级联方式
2.加权融合 阅读全文
摘要:
以上两个join接口都是调用的这个方法: rdd.join的实现:rdd1.join(rdd2) => rdd1.cogroup(rdd2,partitioner) 这是CoGroupedRDD的类声明,其中有两个与java 语法的不同: 1.类型声明中的小于号“<”,这个在scala 中叫做变量类 阅读全文
摘要:
1.大数定律:
2.中心极限定理
3.参数估计 阅读全文