摘要:1. 思维图 用户冷启动:主要是解决如何给新用户做个性化推荐的问题。 系统冷启动:主要解决如何在一个新开发的网站上设计个性化推荐系统。 物品冷启动:主要解决如何将新的物品推荐给对它感兴趣的用户。 2. 参考博客 https://www.jianshu.com/p/62e5171c85bc 阅读全文
posted @ 2019-12-08 20:00 LuckPsyduck 阅读 (2) 评论 (0) 编辑
摘要:1. A/B测试 新推荐模型上线前要进行A/B测试,与旧的算法比较。AB测试是一种很常用的在线评测算法的实验方法。它通过一定的规则将用户随机分成几组,并对不同组的用户采用不同的算法,然后通过统计不同组用户的各种不同的评测指标比较不同算法, 比如可以统计不同组用户的点击率,通过点击率比较不同算法的性能 阅读全文
posted @ 2019-12-08 19:50 LuckPsyduck 阅读 (7) 评论 (0) 编辑
摘要:1. 整体框架 2. 推荐服务器 3. 优化 4. 算法流程 5. 实时修正 6. 参考文献 https://yq.aliyun.com/articles/39629 阅读全文
posted @ 2019-12-08 11:20 LuckPsyduck 阅读 (5) 评论 (0) 编辑
摘要:1. 概述 广告CTR预估过程中,正负样本比例差距较大,需要采样,但是采用后模型训练的结果是有偏的。 2. 校准方式 用逻辑回归作为激活函数 其中是未进行负采样时正样本的比例,是进行负采样后的正样本的比例。 3. 参考博客 https://zhuanlan.zhihu.com/p/35580375 阅读全文
posted @ 2019-12-07 14:11 LuckPsyduck 阅读 (7) 评论 (0) 编辑
摘要:1. DIN(Deep Interest Network)优点 使用用户兴趣分布来表示用户多种多样的兴趣爱好。 使用Attention机制来实现Local Activation,局部激活相关的历史兴趣信息,与当前候选Ad相关性越高的历史行为,会获得更高的Attention Score。 针对模型训练 阅读全文
posted @ 2019-12-07 10:33 LuckPsyduck 阅读 (4) 评论 (0) 编辑
摘要:1. DCN优点 使用Cross Network,在每一层都运用了Feature Crossing,高效学习高阶特征。 网络结构简单且高效 相比DNN,DCN的Logloss值更低,而且参数的数量少了一个数量级。 2. 网络整体结构 主要分为Embedding和Stacking层,利用Embeddi 阅读全文
posted @ 2019-12-06 14:50 LuckPsyduck 阅读 (9) 评论 (0) 编辑
摘要:1. xDeepFM优势 自动高效的学习隐式和显示的高维特征交互 设计一个新的CIN网络可以显示学习高阶特征交互,且为Vector-Wise 2. xDeepFM整体算法框架 整个网络结构主要分为两部分:压缩交互网络和DNN网络。压缩交互网络主要是实现自动学习显示的高阶特征交互,DNN网络主要是实现 阅读全文
posted @ 2019-12-06 11:35 LuckPsyduck 阅读 (2) 评论 (0) 编辑
摘要:1. 概述 点击率预估是对每次广告的点击情况做预测,判定是否点击或者给出点击概率值。 2. 搜索广告与非搜索广告 搜索广告中存在Query,Query和广告内容的匹配程度对点击率影响很大。 非搜索广告中点击率的计算多来源于用户的兴趣和广告特征、上下文等。 3. 点击率预估与推荐算法 推荐算法只需要给 阅读全文
posted @ 2019-12-06 09:43 LuckPsyduck 阅读 (10) 评论 (0) 编辑
摘要:1. 概述 召回是指从全量信息集合中触发尽可能多的正确结果,并将返回结果给“排序”;排序是对所有召回的内容进行打分排序,选出得分最高的几个结果推荐给用户。 2. 召回策略 常用的主要有协同过滤、向量化召回和深度树匹配模型。 2.1 协同过滤 协同过滤主要分为基于物品的协同过滤、基于用户的协同过滤和基 阅读全文
posted @ 2019-12-04 22:12 LuckPsyduck 阅读 (13) 评论 (0) 编辑
摘要:1. 推荐基础 2. 上下文推荐 3. 标签推荐 4. 用户行为推荐 5. 社交网络推荐 6. 冷启动问题 7. 评分预测 8. 参考博客 https://www.jianshu.com/p/bbcec0dca4c9 阅读全文
posted @ 2019-12-04 16:55 LuckPsyduck 阅读 (3) 评论 (0) 编辑