推荐系统实践 - 随笔分类 - 爱睡觉的皮卡丘

天池新闻推荐比赛5：模型融合

摘要：排序模型先通过召唤阶段将规模缩减，然后使用机器学习模型来对构造好的特征进行学习。再对测试集进行预测，得到测试集中的每个候选集用户点击的概率，返回点击概率最大的topk个文章，作为最终的结果。排序阶段选择了三个比较有代表性的排序模型，它们分别是： LGB的排序模型 LGB的分类模型深度学习的分类阅读全文

posted @ 2020-12-06 22:43 爱睡觉的皮卡丘阅读(176) 评论(0) 推荐(0)

天池新闻推荐比赛4：特征工程

摘要：具体的代码见：http://datawhale.club/t/topic/201 特征构造很重要的是要结合用户的历史点击文章信息。往往用户的最后一次点击会和其最后几次点击有很大的关联。所以我们就可以对于每个候选文章，做出与最后几次点击相关的特征如下：候选item与最后几次点击的相似性阅读全文

posted @ 2020-12-03 22:33 爱睡觉的皮卡丘阅读(130) 评论(0) 推荐(0)

天池新闻推荐比赛3：多路召回

摘要：具体代码过多，详情见：http://datawhale.club/t/topic/198 一、多路召回介绍采用不同的召回策略，分别召回商品集，然后再进行排序。下图是多路召回的示意图：本次比赛采取的多路召回为5路召回，分别是： Youtube DNN 召回基于文章的召回文章的协同过滤基于文章阅读全文

posted @ 2020-11-30 22:04 爱睡觉的皮卡丘阅读(584) 评论(0) 推荐(0)

天池新闻推荐比赛2：数据分析

摘要：导入相关包 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns plt.rc('font', family='SimHei', size=13) import os, 阅读全文

posted @ 2020-11-26 23:06 爱睡觉的皮卡丘阅读(282) 评论(0) 推荐(0)

天池新闻推荐比赛1：赛题理解+baseline

摘要：天池新闻推荐比赛1：赛题理解+baseline 一、比赛信息比赛链接： https://tianchi.aliyun.com/competition/entrance/531842/information 比赛简介：赛题以预测用户未来点击新闻文章为任务，该数据来自某新闻APP平台的用户交阅读全文

posted @ 2020-11-25 20:03 爱睡觉的皮卡丘阅读(631) 评论(0) 推荐(0)

随笔分类 - 推荐系统实践

公告