摘要: 一、概念 1、MADQN(Multi-Agent Deep Q-Network)多智能体强化学习算法 2、主要解决分布式系统中的资源分配、任务调度等复杂问题 阅读全文
posted @ 2025-09-30 18:29 牧云文仔 阅读(10) 评论(0) 推荐(0)
摘要: 一、概念 1、MADDPG(Multi-Agent Deep Deterministic Policy Gradient)是一种基于单智能体的DDPG算法扩展,解决多智能体交互场景下的训练不稳定性、环境非平稳性问题,于2017年提出 2、适用于合作、竞争或者混合互动的多智能体任务,例如机器人协作、多 阅读全文
posted @ 2025-09-30 18:06 牧云文仔 阅读(25) 评论(0) 推荐(0)