随笔档案「2025年11月22日」：MORL | Envelope Q-Learning：有收敛性保证... - MoonOut - 博客园

2025年11月22日

MORL | Envelope Q-Learning：有收敛性保证的 MORL 算法

摘要： EQL 将单目标的 bellman 算子拓展到多目标 RL 上，并复刻了 value iteration 的收敛性保证。阅读全文

posted @ 2025-11-22 21:18 MoonOut 阅读(137) 评论(0) 推荐(1)

数据中心 + 事件驱动优化：面向数据中心绿色可靠运行的强化学习方法

摘要：贾庆山老师团队的事件驱动优化 + 数据中心工作。阅读全文

posted @ 2025-11-22 16:10 MoonOut 阅读(23) 评论(0) 推荐(0)