随笔分类 -  机器学习

摘要:一. 最小二乘法建立模型 关于最小二乘法矩阵分解,我们可以参阅: 一、矩阵分解模型。 用户对物品的打分行为可以表示成一个评分矩阵A(m*n),表示m个用户对n各物品的打分情况。如下图所示: 其中,A(i,j)表示用户user i对物品item j的打分。但是,ALS 的核心就是下面这个假设:的打分矩 阅读全文
posted @ 2016-06-08 14:50 小爷 阅读(11867) 评论(3) 推荐(2)
摘要:主框架图 见:http://r.photo.store.qq.com/psb?/V12VvuOZ2vxbmG/M2gzPWfnBLS8buBT*16Y2xm9QkAAp8TmePOlIPC1MlM!/r/dFMAAAAAAAAA 1.1 生成库——词频库、词语索引库 流程: 项目包: 1.1.1 生 阅读全文
posted @ 2016-03-06 09:13 小爷 阅读(1502) 评论(1) 推荐(1)
摘要:1、信息熵 一些概念 p(x):分类结果x的概率,即分类结果为x的数据量/总数据量信息:l(x) = -log2(p(x))信息熵:信息的期望值 -(p(x1)l(x1) + p(x2)l(x2) + ……) 计算信息熵 1 def calcShannonEnt(dataset): 2 numEnt 阅读全文
posted @ 2016-02-24 01:12 小爷 阅读(432) 评论(0) 推荐(0)
摘要:1、kNN 算法 算法说明: set<X1,X2……Xn> 为已知类别数据集,预测 点Xt 的类别: (1)计算中的set中每一个点与Xt的距离 (2)按距离增序排列 (3)选择距离最小的前k个点 (4)确定前k个点所在的类别的出现频率 (5)返回频率最高的类别作为测试的结果 1 from nump 阅读全文
posted @ 2016-02-22 20:18 小爷 阅读(2851) 评论(0) 推荐(0)