xd_xumaomao

2024年4月29日

摘要：论文链接：Deep Match to Rank Model for Personalized Click-Through Rate Prediction 代码链接背景目前推荐系统大多集中在研究怎么建模用户的个性化推荐，对user和item相关性的研究比较少，这篇论文结合match和rank阶段的阅读全文

posted @ 2024-04-29 20:31 xd_xumaomao 阅读(1) 评论(0) 推荐(0) 编辑

2024年4月1日

pyspark实践

摘要： from pyspark.sql import SparkSession spark = SparkSession.builder.enableHiveSupport().getOrCreate() spark.conf.set("hive.exec.dynamic.partition.mode", 阅读全文

posted @ 2024-04-01 09:47 xd_xumaomao 阅读(7) 评论(0) 推荐(0) 编辑

2024年3月19日

腾讯gate网络《GateNet: Gating-Enhanced Deep Network for Click-Through Rate Prediction》

摘要： https://blog.csdn.net/m0_37924639/article/details/112503883 https://zhuanlan.zhihu.com/p/261923201 阅读全文

posted @ 2024-03-19 17:24 xd_xumaomao 阅读(2) 评论(0) 推荐(0) 编辑

2024年3月6日

Google multitask模型SNR

摘要：背景 MMoE模型从一定程度上解决了多个目标（任务）在训练过程中的相互耦合的问题，即使用门控概念（gate network）降低了因为share-layer部分带来的“特征耦合”。但其实这是不够的，因为在每一个expert内部，与其他的expert不存在联系，这导致每个expert的表达能力不是“那阅读全文

posted @ 2024-03-06 11:36 xd_xumaomao 阅读(17) 评论(0) 推荐(0) 编辑

2024年2月20日

推荐系统中回归任务常用损失函数

摘要： 1. MSE（均方误差损失）优点： 1. 收敛快缺点： 1. 假设了样本服从正态分布，如果训练样本label不服从正态分布，则MSE并非最大似然估计 2. 对异常点很敏感 2. MAE（平均绝对误差损失）优点：不容易受异常值影响缺点：收敛速度慢，拟合能力弱 3. Huber Loss 结合了阅读全文

posted @ 2024-02-20 13:12 xd_xumaomao 阅读(106) 评论(0) 推荐(0) 编辑

2024年2月18日

粗排模型总结

摘要：双塔模型介绍由于粗排的候选数目比精排多很多，粗排无法做的和精排一样复杂。现在业内比较通用的方案是采用双塔模型，左边塔建模user embedding，右边塔建模item embedding，由于用户的行为经常发生变化，user tower需要经常更新，但是item状态很少发生变化，可以离线算好所有阅读全文

posted @ 2024-02-18 12:03 xd_xumaomao 阅读(42) 评论(0) 推荐(0) 编辑

2024年2月4日

业内技术分享

摘要：双塔张俊林：从对比学习视角，重新审视推荐系统的召回粗排模型 https://zhuanlan.zhihu.com/p/481610113 阅读全文

posted @ 2024-02-04 11:48 xd_xumaomao 阅读(6) 评论(0) 推荐(0) 编辑

美团对偶双塔增强模型

摘要： https://zhuanlan.zhihu.com/p/608636233 待整理阅读全文

posted @ 2024-02-04 11:40 xd_xumaomao 阅读(19) 评论(0) 推荐(0) 编辑

美团超长序列建模论SDIM

摘要： https://zhuanlan.zhihu.com/p/560657191 待整理阅读全文

posted @ 2024-02-04 11:35 xd_xumaomao 阅读(8) 评论(0) 推荐(0) 编辑

阿里超长序列建模ETA

摘要： https://zhuanlan.zhihu.com/p/547087040 待整理阅读全文

posted @ 2024-02-04 11:29 xd_xumaomao 阅读(4) 评论(0) 推荐(0) 编辑

公告