摘要: [原文链接:http://techblog.netflix.com/2013/03/system-architectures-for.html,需要FQ。同样出自Netflix的Xavier Amatriain之手,介绍了Netflix的推荐系统架构。我之前也转载了他的另两篇博文:Netflix Recommendations: Beyond the 5 stars (Part 1, Part 2)。][本文链接:http://www.cnblogs.com/breezedeus/archive/2013/04/13/3017695.html,转载请注明出处]Wednesday, March 阅读全文
posted @ 2013-04-13 08:42 BreezeDeus 阅读(1812) 评论(0) 推荐(0) 编辑
摘要: [本文链接:http://www.cnblogs.com/breezedeus/archive/2013/01/20/2868930.html,转载请注明出处。]LDA是个generative model,它首先从Dirichlet分布Dir(β)中抽取每个topic对应的参数,然后语料集D中第j篇文档的产生方式如下:1. 选择文档长度: N ~ Poission(ξ) ;2. 选择文档参数: θ ~ Dir(α) ;3. 按照以下方式选取文档中的每个词: (a) 选择一个topic: (b) 从W个词中选取出此词:LDA的图表示如下,其中z、θ和Φ为隐藏变量,α和β为超参数。利用上面LDA的 阅读全文
posted @ 2013-01-20 21:54 BreezeDeus 阅读(15555) 评论(2) 推荐(0) 编辑
摘要: [本文链接:http://www.cnblogs.com/breezedeus/archive/2012/11/12/2765890.html,转载请注明出处。] Talk3:寻路推荐,稳国柱@豆瓣 [ppt下载地址:http://vdisk.weibo.com/s/gNupb] 作者介绍了在豆瓣经历的三个推荐产品:电影推荐、图书推荐和电台的音乐推荐。 1. 电影推荐。在电影推荐中如果纯粹使用CF算法,会产生比较严重的头部效应(热门电影同时被推荐)。用户在一家影院看完某部动作片后,他经常会对在这家影院同时上映的很多电影一起评分。如果直接把CF算法应用于用户的评分数据上,就可能导致喜欢动... 阅读全文
posted @ 2012-11-12 10:44 BreezeDeus 阅读(1854) 评论(0) 推荐(0) 编辑
摘要: [本文链接:http://www.cnblogs.com/breezedeus/archive/2012/11/10/2763545.html,转载请注明出处。] Talk2:面向广告主的推荐,江申@百度 [注:本文中很多语句都直接拷贝自作者的演讲ppt而并未加以标明,具体请对照原ppt(下载地址:http://vdisk.weibo.com/s/gNuoh)。] 作者主要讲的是百度面向广告主的推荐产品,主要指拍卖词推荐。 1. 技术目标要正确。在做产品时,我们当然会有一个目的目标,比如提升用户购买率,或者最大化公司收益等。但如何把这种目的目标数学化,也就是写成数学上可以表达的目标函数... 阅读全文
posted @ 2012-11-10 00:33 BreezeDeus 阅读(1217) 评论(0) 推荐(0) 编辑
摘要: [本文链接:http://www.cnblogs.com/breezedeus/archive/2012/11/05/2754940.html,转载请注明出处。]Dirichlet Process (DP)被称为分布的分布。从DP抽取出的每个样本(一个函数)都可以被认为是一个离散随机变量的分布函数,... 阅读全文
posted @ 2012-11-05 12:57 BreezeDeus 阅读(6394) 评论(2) 推荐(0) 编辑
摘要: [本文链接:http://www.cnblogs.com/breezedeus/archive/2012/11/01/2749030.html,转载请注明出处。] Talk1:Large-scale Ecommerce RS in Etao,袁全@一淘 [ppt下载地址:http://vdisk.weibo.com/s/gNumS] 1. 关于用户的行为数据,作者的经验是用户的点击与购买数据比收藏、打分与观看更有用。与购买数据相比,点击数据在做相关性推荐时(如用户在查看泳衣时给他推荐其他款泳衣)更有效,而做补充性推荐时(如用户购买了泳衣后就给他推荐泳镜)则是购买数据比点击数据更有效。想... 阅读全文
posted @ 2012-11-01 01:36 BreezeDeus 阅读(1834) 评论(0) 推荐(0) 编辑
摘要: [本文链接:http://www.cnblogs.com/breezedeus/archive/2012/10/30/2746914.html,转载请注明出处。]下图是我对Pedro Domingos 2012年的论文“A few useful things to know about machin... 阅读全文
posted @ 2012-10-30 19:35 BreezeDeus 阅读(2231) 评论(3) 推荐(2) 编辑
摘要: [婚恋交友中,女性想要收到更多异性的信件,得多贴些有争议的照片,而不是贴那些大家都觉得不错的照片。这个结论来自于OkCupid的数据科学家,原文见这里。OkCupid号称online dating行业的Google,向他们学习。] [本文链接:http://www.cnblogs.com/breezedeus/archive/2012/10/28/2744002.html,转载请注明出处。] The Mathematics Of Beauty January 10th, 2011 by Christian Rudder This post investigates female ... 阅读全文
posted @ 2012-10-28 21:48 BreezeDeus 阅读(688) 评论(0) 推荐(1) 编辑
摘要: [本文链接:http://www.cnblogs.com/breezedeus/archive/2012/09/05/2671572.html,转载请注明出处] 在K-means聚类算法里,我们首先需要在已有的数据点中选取K个点作为初始中心点。这个bug就出现在中心点的随机选取上,mahout的实现不是真的随机。 【位置】: org.apache.mahout.clustering.kmeans.RandomSeedGenerator#buildRandom(...) , 行 88 - 110 这段。 我简化了一下,mahout的随机抽取逻辑如下: 1: /** 2... 阅读全文
posted @ 2012-09-05 11:10 BreezeDeus 阅读(824) 评论(1) 推荐(0) 编辑
摘要: [本文链接:http://www.cnblogs.com/breezedeus/archive/2012/08/25/2655815.html,转载请注明出处] Facebook的新朋友关系中有92%来自于朋友的朋友(FOFs),来自于Facebook的数据科学家Lars Backstrom在eswc2011的talk中介绍了他们是如何对FOFs进行排序,并最终为用户产生朋友推荐的全过程。上不了videolectures.net的童鞋也可以在http://vdisk.weibo.com/s/b9GAF下载对应的slides。 下面这幅图摘自演讲slides,是整个FOFs推荐系统的一个... 阅读全文
posted @ 2012-08-25 11:53 BreezeDeus 阅读(4890) 评论(0) 推荐(0) 编辑