随笔分类 -  推荐算法

摘要:1.运用场景 CTR模型/圈定人群推荐/long-tail contents recommend。 2.创新点 design a novel network structure named attention-merge layer. look-alike learning models globa 阅读全文
posted @ 2020-10-11 15:40 LuckPsyduck 阅读(302) 评论(0) 推荐(0)
摘要:1.运用场景 CTR模型/item冷启动/多队列召回。 2.创新点 highlight the cold-start channel issue in multi-channel matching,which is essential in real-world integrated persona 阅读全文
posted @ 2020-10-11 15:18 LuckPsyduck 阅读(226) 评论(0) 推荐(0)
摘要:1.运用场景 CTR模型/embedding生成/正负样本选择。 2.创新点 introduce the unified embedding framework developed to model semantic embeddings for personalized search,and th 阅读全文
posted @ 2020-08-30 19:57 LuckPsyduck 阅读(265) 评论(0) 推荐(0)
摘要:京东: 基于Embedding的召回 用户向量表示: 用户行为序列建模 RNN/Attention 停留时长/评论 促销页和搜索页 WSDM2018 AMOE 多目标学习 强化学习 hulu 冷启动探索与实践 引导用户消费物料 研究人的心理状态 用户冷启动和物品冷启动 基于规则 性别年龄 粗分类 网 阅读全文
posted @ 2020-08-03 07:33 LuckPsyduck 阅读(740) 评论(0) 推荐(0)
摘要:1. 名词解释 CPC(Cost Per Click):每次点击的费用,即按照广告被点击的次数收费。 CPM(Cost Per Mille/Cost Per Thousand Click-Through):每千次展示费用,即广告每展示1000次的费用。 CPA(Cost Per Action):每次 阅读全文
posted @ 2020-01-04 11:26 LuckPsyduck 阅读(1075) 评论(0) 推荐(0)
摘要:1. 思维图 用户冷启动:主要是解决如何给新用户做个性化推荐的问题。 系统冷启动:主要解决如何在一个新开发的网站上设计个性化推荐系统。 物品冷启动:主要解决如何将新的物品推荐给对它感兴趣的用户。 2. 参考博客 https://www.jianshu.com/p/62e5171c85bc 阅读全文
posted @ 2019-12-08 20:00 LuckPsyduck 阅读(238) 评论(0) 推荐(0)
摘要:1. A/B测试 新推荐模型上线前要进行A/B测试,与旧的算法比较。AB测试是一种很常用的在线评测算法的实验方法。它通过一定的规则将用户随机分成几组,并对不同组的用户采用不同的算法,然后通过统计不同组用户的各种不同的评测指标比较不同算法, 比如可以统计不同组用户的点击率,通过点击率比较不同算法的性能 阅读全文
posted @ 2019-12-08 19:50 LuckPsyduck 阅读(813) 评论(0) 推荐(0)
摘要:1. 整体框架 2. 推荐服务器 3. 优化 4. 算法流程 5. 实时修正 6. 参考文献 https://yq.aliyun.com/articles/39629 阅读全文
posted @ 2019-12-08 11:20 LuckPsyduck 阅读(168) 评论(0) 推荐(0)
摘要:1.概述 广告CTR预估过程中,正负样本比例差距较大,需要采样,但是采用后模型训练的结果是有偏的。 2. 校准方式 用逻辑回归作为激活函数 其中是未进行负采样时正样本的比例,是进行负采样后的正样本的比例。 3. 参考博客 https://zhuanlan.zhihu.com/p/35580375 h 阅读全文
posted @ 2019-12-07 14:11 LuckPsyduck 阅读(900) 评论(0) 推荐(0)
摘要:1. DIN(Deep Interest Network)优点 使用用户兴趣分布来表示用户多种多样的兴趣爱好。 使用Attention机制来实现Local Activation,局部激活相关的历史兴趣信息,与当前候选Ad相关性越高的历史行为,会获得更高的Attention Score。 针对模型训练 阅读全文
posted @ 2019-12-07 10:33 LuckPsyduck 阅读(1142) 评论(0) 推荐(0)
摘要:1. DCN优点 使用Cross Network,在每一层都运用了Feature Crossing,高效学习高阶特征。 网络结构简单且高效 相比DNN,DCN的Logloss值更低,而且参数的数量少了一个数量级。 2. 网络整体结构 主要分为Embedding和Stacking层,利用Embeddi 阅读全文
posted @ 2019-12-06 14:50 LuckPsyduck 阅读(2628) 评论(0) 推荐(0)
摘要:1. xDeepFM优势 自动高效的学习隐式和显示的高维特征交互 设计一个新的CIN网络可以显示学习高阶特征交互,且为Vector-Wise 2. xDeepFM整体算法框架 整个网络结构主要分为两部分:压缩交互网络和DNN网络。压缩交互网络主要是实现自动学习显示的高阶特征交互,DNN网络主要是实现 阅读全文
posted @ 2019-12-06 11:35 LuckPsyduck 阅读(1060) 评论(0) 推荐(0)
摘要:1. 概述 点击率预估是对每次广告的点击情况做预测,判定是否点击或者给出点击概率值。 2. 搜索广告与非搜索广告 搜索广告中存在Query,Query和广告内容的匹配程度对点击率影响很大。 非搜索广告中点击率的计算多来源于用户的兴趣和广告特征、上下文等。 3. 点击率预估与推荐算法 推荐算法只需要给 阅读全文
posted @ 2019-12-06 09:43 LuckPsyduck 阅读(1809) 评论(0) 推荐(0)
摘要:1. 概述 召回是指从全量信息集合中触发尽可能多的正确结果,并将返回结果给“排序”;排序是对所有召回的内容进行打分排序,选出得分最高的几个结果推荐给用户。 2. 召回策略 常用的主要有协同过滤、向量化召回和深度树匹配模型。 2.1 协同过滤 协同过滤主要分为基于物品的协同过滤、基于用户的协同过滤和基 阅读全文
posted @ 2019-12-04 22:12 LuckPsyduck 阅读(1519) 评论(0) 推荐(0)
摘要:1. 推荐基础 2. 上下文推荐 3. 标签推荐 4. 用户行为推荐 5. 社交网络推荐 6. 冷启动问题 7. 评分预测 8. 参考博客 https://www.jianshu.com/p/bbcec0dca4c9 阅读全文
posted @ 2019-12-04 16:55 LuckPsyduck 阅读(114) 评论(0) 推荐(0)
摘要:1. 提升树 以决策树为基函数的提升方法称为提升树,决策树可以分为分类树和回归树,提升树模型可以表示为决策树的加法模型,其数学表达式为: 其中表示决策树,表示决策树的参数,为决策树的个数。 提升树算法流程: 输入:训练数据集 ① 初始化 ②对每棵树 ③对每个样本,计算残差 ④利用训练一棵决策树,得到 阅读全文
posted @ 2019-12-04 16:28 LuckPsyduck 阅读(393) 评论(0) 推荐(0)
摘要:1. DeepFM算法 结合FM算法和DNN算法,同时提取低阶特征和高阶特征,然后组合。FM算法负责对一阶特征及由一阶特征两两组合成的二阶特征进行特征提取;DNN算法负责对由输入的一阶特征进行全连接等操作形成的高阶特征进行特征提取。 2. DeepFM优势 端到端模型,无需特征工程。 结合了广度和深 阅读全文
posted @ 2019-10-14 10:32 LuckPsyduck 阅读(488) 评论(0) 推荐(0)
摘要:1. FM算法 FM(Factor Machine,因子分解机)算法是一种基于矩阵分解的机器学习算法,为了解决大规模稀疏数据中的特征组合问题。FM算法是推荐领域被验证效果较好的推荐算法之一,在电商、广告、直播等推荐领域有广泛应用。 2. FM算法优势 特征组合:通过对两两特征组合,引入交叉项特征。 阅读全文
posted @ 2019-10-11 15:27 LuckPsyduck 阅读(2408) 评论(0) 推荐(1)
摘要:1. 推荐系统 1.1 总体框架 主要包括:样本选择、数据清洗、特征提取与选择、模型训练、在线预估和排序。 1.2 目的 帮助用户找到想要的商品,挖掘数据分布。 降低信息过载。 提高站点的点击率/转化率。 为用户提供定制化服务。 2. 推荐算法 基于流行度/协同过滤/基于内容/基于模型/多路混合 2 阅读全文
posted @ 2019-10-11 10:00 LuckPsyduck 阅读(310) 评论(0) 推荐(0)