随笔分类 - Collaborative Filtering Recommendation
摘要:一.题外话 虽然是科普,不过笔者个人认为大道至简,也就是说越简单的东西很可能越值得探讨,或者另外一种说法越简单的东西越不好讲解;其实笔者认为这就是《编程之美》所要传递的——大道至简。 软件构建老师给我推荐的《走出软件作坊》还没看呢。二.概述 高维数据检索(high-dimentional re...
阅读全文
posted @ 2015-05-09 23:36
加拿大小哥哥
摘要:通过LSH hash functions我们能够得到一个或多个hash table,每个桶内的数据之间是近邻的可能性很大。我们希望原本相邻的数据经过LSH hash后,都能够落入到相同的桶内,而不相邻的数据经过LSH hash后,都能够落入到不同的桶中。如果相邻的数据被投影到了不同的桶内,我们称...
阅读全文
posted @ 2015-05-09 22:53
加拿大小哥哥
摘要:需要代码联系作者,不做义务咨询。需要代码联系我QQ:1198552415,本人不做义务咨询。 一.算法实现 基于p-stable分布,并以‘哈希技术分类’中的分层法为使用方法,就产生了E2LSH算法。 E2LSH中的哈希函数定义如下: 其中,v为d维原始数据,a为随机变量,由正态分布产生; w为宽度
阅读全文
posted @ 2015-05-06 10:03
加拿大小哥哥
摘要:搜集了快一个月的资料,虽然不完全懂,但还是先慢慢写着吧,说不定就有思路了呢。 开源的最大好处是会让作者对脏乱臭的代码有羞耻感。 当一个做推荐系统的部门开始重视【数据清理,数据标柱,效果评测,数据统计,数据分析】这些所谓的脏活累活,这样的推荐系统才会有救。 求教GitHub的使用。 简单不...
阅读全文
posted @ 2015-04-25 21:44
加拿大小哥哥
摘要:感谢开源大神,慢慢收集资料。网上资料很少,我在找如何用matlab处理movielens数据集时找到的。 用ml-100k这个数据集,包括主函数和相似度函数。 代码托管于CSDN。
阅读全文
posted @ 2015-04-25 21:27
加拿大小哥哥
摘要:比如,对一本书的评分,下面列出两个描述方式,前者是我所提倡的,括号里的是豆瓣现在采用的。1分:我很不喜欢(很差)2分:我不喜欢(较差)3分:还行(还行)4分:我喜欢(推荐)5分:我非常喜欢(力荐) 一个显然的区别是:前者是从主观出发的,后者则主要是基于客观情况的。前者表达了自己对对象的喜好程度...
阅读全文
posted @ 2015-04-12 17:52
加拿大小哥哥
摘要:下面这是论文笔记,其实主要是摘抄,这片博士论文很有逻辑性,层层深入,所以笔者保留的比较多。 看到第二章,我发现其实这片文章对我来说更多是科普,科普吧……一、论文来源Personalized Web Recommendation via Collaborative Filtering(很奇怪via为...
阅读全文
posted @ 2015-03-10 15:24
加拿大小哥哥
摘要:今晚在数据挖掘研究院看到的一篇文章《自动推荐系统效果为什么不好》,为什么朋友推荐的书总是让我满意,难道朋友在推荐书的时候作了比计算机所能进行的运算还要复杂的大脑活动了吗?用户的诉求和心理很微妙,很多时候你自己都不知道自己的诉求,前1分钟你想吃肯德基,后1分钟你可能放弃这个想法,正如keso说的我...
阅读全文
posted @ 2015-03-09 23:17
加拿大小哥哥
摘要:Hybrid Recommender System based on Fuzzy Clustering and Collaborative Filtering 给出题目,想找的话直接在ElsevierSD里下载即可。 并不是逐句翻译,一些简单的背景比如经济啦什么的直接忽略,不过笔者会在博文里点出来...
阅读全文
posted @ 2015-01-20 21:06
加拿大小哥哥
摘要:数学大神、统计学大神和数据挖掘推荐大神请关注。一、数学期望的理解 早些时候,法国有两个大数学家,一个叫做布莱士·帕斯卡,一个叫做费马。帕斯卡认识两个赌徒,这两个赌徒向他提出了一个问题。他们说,他俩下赌金之后,约定谁先赢满5局,谁就获得全部赌金。赌了半天,A赢了4局,B赢了3局,时间很晚了,他们都不...
阅读全文
posted @ 2015-01-08 20:05
加拿大小哥哥