Information Retrieval - 随笔分类 - activeshj

文本相似度计算

摘要：http://www.sohu.com/a/220353074_744545 编辑距离的作用主要是用来比较两个字符串的相似度的。编辑操作只有三种：插入，删除，替换。对两个字符串，将其中一个字符串经过上面的这三种操作之后，得和另外一个完全相同的字符串付出的代价就是编辑距离。例如：如果str1=” 阅读全文

posted @ 2018-08-27 20:16 activeshj 阅读(571) 评论(0) 推荐(0)

Dublin Core (都柏林核心)

摘要：DC(Dublin Core) 是数字图书馆中使用的一组简单的包括15个“核心元素”的元数据元素集合，主要用于描述数字对象、馆藏管理和元数据交换。这15项元数据不仅适用于电子文献目录，也适用于各类电子化的公务文档目录，产品、商品、藏品目录，具有很好的实用性。15项元数据名称（Title）创作、制作... 阅读全文

posted @ 2014-11-26 16:47 activeshj 阅读(1187) 评论(0) 推荐(0)

(转载) 个性化推荐的十大挑战

摘要：http://blog.sciencenet.cn/blog-3075-554630.html个性化推荐很多人都知道，但其中不乏认识上的误区。有的人觉得个性化推荐就是细分市场和精准营销，实际上细分市场和精准营销往往是把潜在的用户分成很多群体，这固然相比基于全体的统计有了长足的进步，但是距离“给每一个... 阅读全文

posted @ 2014-11-25 17:59 activeshj 阅读(163) 评论(0) 推荐(0)

推荐系统（五）

摘要：(原创文章，转载请注明出处！)协同过滤算法（Collaborative Filtering）基于的根据是，类似的人会喜好类似的物品。如果将用户进行聚类，当来了新用户，将新用户归到相应的类，用类的评分结果来形成新用户的推荐结果。在文章 Collaborative Filtering Based on ... 阅读全文

posted @ 2014-10-09 17:50 activeshj 阅读(455) 评论(0) 推荐(0)

推荐系统（四）

摘要：(原创文章，转载请注明出处！)用户对物品的推荐数据通常形成一个巨大的矩阵，而且通常用户的数量比物品的数量多，可以通过SVD（奇异值分解）来将矩阵分解，减少计算中使用的数据量，降低计算的复杂度。假设数据R是m x n矩阵，m个用户，n个物品，通过奇异值分解，R=U∑VT。那么将R投影到低维的k（k =... 阅读全文

posted @ 2014-10-09 09:50 activeshj 阅读(216) 评论(0) 推荐(0)

推荐系统（三）

摘要：(原创文章，转载请注明出处！)推荐系统关注的是人与物品，希望预测出人对物品的喜欢程度。不同的人有相近的喜好（比如：都喜欢武侠小说），不同的物品有相近的特征（比如：都是武侠小说）。当想预测一个用户A对其还没有评价的的物品T的评分时，可以从两个角度来考虑：找和用户A有相近喜欢的人，通过他们对物品T的评分... 阅读全文

posted @ 2014-09-15 22:46 activeshj 阅读(286) 评论(0) 推荐(0)

推荐系统（二）

摘要：(原创文章，转载请注明出处！)一、问题实现对电影的推荐，数据集中有约1600部电影，有约900个用户对这些电影进行了评价。设每个电影有10个特征，根据推荐系统（一）描述的算法，每个用户也相应的有10的参数，那么总的参数个数 ≈ 1600 * 10 + 900 * 10 ≈ 16000 + 9000 ... 阅读全文

posted @ 2014-09-10 23:03 activeshj 阅读(419) 评论(0) 推荐(0)

推荐系统（一）

摘要：(原创文章，转载请注明出处！)如何给用户自动的推荐产品？比如推荐书。让用户给他看过的书打分，比如: 0、1、2、3、4、5分。用户可以有很多个，书也可以有很多本不同的。用户给书打分就形成了一个二维表格：用户A用户B用户C用户D用户E小说151442小说24144?小说3??5?1小说43??2?小说... 阅读全文

posted @ 2014-08-07 21:59 activeshj 阅读(228) 评论(0) 推荐(0)

随笔分类 - Information Retrieval

公告