随笔分类 - 推荐系统实践
用于推荐系统的实践,包含代码
摘要:排序模型 先通过召唤阶段将规模缩减,然后使用机器学习模型来对构造好的特征进行学习。再对测试集进行预测,得到测试集中的每个候选集用户点击的概率,返回点击概率最大的topk个文章,作为最终的结果。 排序阶段选择了三个比较有代表性的排序模型,它们分别是: LGB的排序模型 LGB的分类模型 深度学习的分类
阅读全文
摘要: 具体的代码见:http://datawhale.club/t/topic/201 特征构造很重要的是要结合用户的历史点击文章信息。 往往用户的最后一次点击会和其最后几次点击有很大的关联。 所以我们就可以对于每个候选文章, 做出与最后几次点击相关的特征如下: 候选item与最后几次点击的相似性
阅读全文
摘要:具体代码过多,详情见:http://datawhale.club/t/topic/198 一、多路召回介绍 采用不同的召回策略,分别召回商品集,然后再进行排序。下图是多路召回的示意图: 本次比赛采取的多路召回为5路召回,分别是: Youtube DNN 召回 基于文章的召回 文章的协同过滤 基于文章
阅读全文
摘要:导入相关包 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns plt.rc('font', family='SimHei', size=13) import os,
阅读全文
摘要:天池新闻推荐比赛1:赛题理解+baseline 一、比赛信息 比赛链接: https://tianchi.aliyun.com/competition/entrance/531842/information 比赛简介: 赛题以预测用户未来点击新闻文章为任务,该数据来自某新闻APP平台的用户交
阅读全文
浙公网安备 33010602011771号