2025 年 9月 30 日随笔档案 - 牧云文仔

2025年9月30日

摘要：一、概念 1、MADQN（Multi-Agent Deep Q-Network）多智能体强化学习算法 2、主要解决分布式系统中的资源分配、任务调度等复杂问题阅读全文

posted @ 2025-09-30 18:29 牧云文仔阅读(23) 评论(0) 推荐(0)

摘要：一、概念 1、MADDPG（Multi-Agent Deep Deterministic Policy Gradient）是一种基于单智能体的DDPG算法扩展，解决多智能体交互场景下的训练不稳定性、环境非平稳性问题，于2017年提出 2、适用于合作、竞争或者混合互动的多智能体任务，例如机器人协作、多阅读全文

posted @ 2025-09-30 18:06 牧云文仔阅读(33) 评论(0) 推荐(0)

牧云文仔

公告