09 2022 档案
摘要:该论文主要讲述了多智能体通信。 简介中提出,很多多智能体任务需要通信,所以提出了两种算法RIAL和DIAL。论文中考虑的任务是完全合作,部分观测,顺序多智能体决策的任务。所有的智能体的目标是相同的,最大化累计折扣奖励。没用智能体能观察到完整的马尔可夫状态,智能体之间可以通过有限离散的信道交流,智能体
阅读全文
摘要:文章介绍了一种提高多智能体之间通信效率的方法(得到最适合的通信带宽)。 首先介绍了多智能体强化学习模型ACML: 算法跟MADDPG是有点类似的,增加了信息生成网络和信息协调网络,actor产生决策的时候还要考虑协调后的信息,变相得到了全局的信息。 但是这种信息可能是冗余的,下面考虑优化: 在生成网
阅读全文