强化学习在美团“猜你喜欢”的实践

相关:

https://tech.meituan.com/2018/11/15/reinforcement-learning-in-mt-recommend-system.html



image



image


图10 使用advantage函数并做state权值共享

image

图11 支持多组线上实验DDPG模型



image


图13 实时更新的强化学习框架

posted on 2025-01-18 11:19  Angry_Panda  阅读(26)  评论(0)    收藏  举报

导航