摘要: EQL 将单目标的 bellman 算子拓展到多目标 RL 上,并复刻了 value iteration 的收敛性保证。 阅读全文
posted @ 2025-11-22 21:18 MoonOut 阅读(80) 评论(0) 推荐(1)
摘要: 贾庆山老师团队的事件驱动优化 + 数据中心工作。 阅读全文
posted @ 2025-11-22 16:10 MoonOut 阅读(17) 评论(0) 推荐(0)