摘要: 学习解决多人零和博弈中的联盟困境 总结: 将两人的零和博弈扩展到多人零和博弈,并将多人零和博弈中的联盟问题转为社会困境问题用基于强化学习的方法进行解决。先是说明了一般的强化学习方法无法解决,由此在其基础上添加了一个契约机制使联盟问题得到解决。 环境: 多人零和博弈下的联盟困境:将除了两个智能体之外的 阅读全文
posted @ 2022-11-26 02:38 lanthanume 阅读(20) 评论(0) 推荐(0) 编辑