09 2022 档案

Learning to Communicate with Deep Multi-Agent Reinforcement Learning 记录

摘要：该论文主要讲述了多智能体通信。简介中提出，很多多智能体任务需要通信，所以提出了两种算法RIAL和DIAL。论文中考虑的任务是完全合作，部分观测，顺序多智能体决策的任务。所有的智能体的目标是相同的，最大化累计折扣奖励。没用智能体能观察到完整的马尔可夫状态，智能体之间可以通过有限离散的信道交流，智能体阅读全文

posted @ 2022-09-10 17:17 维和战艇机阅读(218) 评论(0) 推荐(0)

Learning Agent Communication under Limited Bandwidth by Message Pruning 记录

摘要：文章介绍了一种提高多智能体之间通信效率的方法（得到最适合的通信带宽）。首先介绍了多智能体强化学习模型ACML：算法跟MADDPG是有点类似的，增加了信息生成网络和信息协调网络，actor产生决策的时候还要考虑协调后的信息，变相得到了全局的信息。但是这种信息可能是冗余的，下面考虑优化：在生成网阅读全文

posted @ 2022-09-07 22:50 维和战艇机阅读(90) 评论(0) 推荐(0)

维和战艇机

09 2022 档案

公告