摘要: 本文首发于:行者AI Qmix是多智能体强化学习中比较经典的算法之一,在VDN的基础上做了一些改进,与VDN相比,在各个agent之间有着较大差异的环境中,表现的更好。 1. IQL与VDN IQL(Independent Q_Learning),是一种比较暴力的解决问题的方法,每个agent都各自 阅读全文
posted @ 2021-05-21 16:42 行者AI 阅读(9402) 评论(0) 推荐(3)