会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
lanthanume
博客园
首页
新随笔
联系
订阅
管理
2022年11月25日
《Partner Selection for the Emergence of Cooperation in Multi-Agent Systems Using Reinforcement Learning》 2020AAMAS
摘要: 基于强化学习的多智能体系统合作伙伴选择 总结: 提出了一个合作伙伴选择模型,模型中的智能体先由单独的奖励目标函数用Q-learnng训练(环境为重复的囚徒困境,进行一定轮次),并且训练过程中的交互信息都会被呈现给其他智能体。基于该信息每个智能体在每一轮开始时挑选合作伙伴并一起参与该困境并从经验中学习
阅读全文
posted @ 2022-11-25 20:21 lanthanume
阅读(52)
评论(0)
推荐(0)
公告