强化学习在美团“猜你喜欢”的实践 - Angry_Panda - 博客园

强化学习在美团“猜你喜欢”的实践

相关：

https://tech.meituan.com/2018/11/15/reinforcement-learning-in-mt-recommend-system.html

图10 使用advantage函数并做state权值共享

图11 支持多组线上实验DDPG模型

图13 实时更新的强化学习框架

posted on 2025-01-18 11:19 Angry_Panda 阅读(35) 评论(0) 收藏举报

刷新页面返回顶部

公告

导航