会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
LAKan的笔记
博客园
首页
新随笔
联系
订阅
管理
2022年6月19日
MAPPO学习笔记(1):从PPO算法开始
摘要: 由于这段时间的学习内容涉及到MAPPO算法,并且我对MAPPO算法这种多智能体算法的信息交互机制不甚了解,于是写了这个系列的笔记,目的是巩固知识,并且进行一些粗浅又滑稽的总结。 1.PPO算法的介绍 1.1.PG算法 如果要分类的话,根据学习方法的不同,可以将强化学习分为Value-based方法、
阅读全文
posted @ 2022-06-19 02:49 几块红布
阅读(4799)
评论(0)
推荐(2)
公告