摘要: python scikit-learn 环境搭建问题解决记录 阅读全文
posted @ 2017-01-07 23:55 混沌战神阿瑞斯 阅读(337) 评论(0) 推荐(0) 编辑
摘要: 1.平均值   1.1 全局平均值   1.2 用户评分平均值   1.3 物品评分平均值   1.4 用户分类对物品分类的平均值   分类方法:     1.4.1 平均值分类     1.4.2 活跃度/流行度分类 2.基于邻域的方法   2.1 基于用户的协同过滤   2.2 基于物品的协同过滤   相似度计算方法选择:     基于共现矩阵的相似度     余弦相似度     3.隐语义模型与矩阵分解模型   3.1 ALS 矩阵分解模型   4.加入时间因素   1.基于邻域的模型融合时间信息 5.模型融合   1.级联方式   2.加权融合 阅读全文
posted @ 2017-01-07 23:54 混沌战神阿瑞斯 阅读(886) 评论(0) 推荐(0) 编辑
摘要: 以上两个join接口都是调用的这个方法: rdd.join的实现:rdd1.join(rdd2) => rdd1.cogroup(rdd2,partitioner) 这是CoGroupedRDD的类声明,其中有两个与java 语法的不同: 1.类型声明中的小于号“<”,这个在scala 中叫做变量类 阅读全文
posted @ 2017-01-07 23:52 混沌战神阿瑞斯 阅读(1712) 评论(0) 推荐(0) 编辑
摘要: 1.大数定律: 2.中心极限定理 3.参数估计 阅读全文
posted @ 2017-01-07 21:31 混沌战神阿瑞斯 阅读(521) 评论(0) 推荐(0) 编辑