随笔分类 - Information Retrieval
摘要:http://www.sohu.com/a/220353074_744545 编辑距离的作用主要是用来比较两个字符串的相似度的。 编辑操作只有三种:插入,删除,替换。对两个字符串,将其中一个字符串经过上面的这三种操作之后,得和另外一个完全相同的字符串付出的代价就是编辑距离。 例如: 如果str1=”
阅读全文
摘要:DC(Dublin Core) 是数字图书馆中使用的一组简单的包括15个“核心元素”的元数据元素集合,主要用于描述数字对象、馆藏管理和元数据交换。 这15项元数据不仅适用于电子文献目录,也适用于各类电子化的公务文档目录,产品、商品、藏品目录,具有很好的实用性。15项元数据名称(Title)创作、制作...
阅读全文
摘要:http://blog.sciencenet.cn/blog-3075-554630.html个性化推荐很多人都知道,但其中不乏认识上的误区。有的人觉得个性化推荐就是细分市场和精准营销,实际上细分市场和精准营销往往是把潜在的用户分成很多群体,这固然相比基于全体的统计有了长足的进步,但是距离“给每一个...
阅读全文
摘要:(原创文章,转载请注明出处!)协同过滤算法(Collaborative Filtering)基于的根据是,类似的人会喜好类似的物品。如果将用户进行聚类,当来了新用户,将新用户归到相应的类,用类的评分结果来形成新用户的推荐结果。在文章 Collaborative Filtering Based on ...
阅读全文
摘要:(原创文章,转载请注明出处!)用户对物品的推荐数据通常形成一个巨大的矩阵,而且通常用户的数量比物品的数量多,可以通过SVD(奇异值分解)来将矩阵分解,减少计算中使用的数据量,降低计算的复杂度。假设数据R是m x n矩阵,m个用户,n个物品,通过奇异值分解,R=U∑VT。那么将R投影到低维的k(k =...
阅读全文
摘要:(原创文章,转载请注明出处!)推荐系统关注的是人与物品,希望预测出人对物品的喜欢程度。不同的人有相近的喜好(比如:都喜欢武侠小说),不同的物品有相近的特征(比如:都是武侠小说)。当想预测一个用户A对其还没有评价的的物品T的评分时,可以从两个角度来考虑:找和用户A有相近喜欢的人,通过他们对物品T的评分...
阅读全文
摘要:(原创文章,转载请注明出处!)一、问题实现对电影的推荐,数据集中有约1600部电影,有约900个用户对这些电影进行了评价。设每个电影有10个特征,根据推荐系统(一)描述的算法,每个用户也相应的有10的参数,那么总的参数个数 ≈ 1600 * 10 + 900 * 10 ≈ 16000 + 9000 ...
阅读全文
摘要:(原创文章,转载请注明出处!)如何给用户自动的推荐产品?比如推荐书。让用户给他看过的书打分,比如: 0、1、2、3、4、5分。用户可以有很多个,书也可以有很多本不同的。用户给书打分就形成了一个二维表格:用户A用户B用户C用户D用户E小说151442小说24144?小说3??5?1小说43??2?小说...
阅读全文
浙公网安备 33010602011771号