2022 年 6月 19 日随笔档案 - 几块红布

2022年6月19日

摘要：由于这段时间的学习内容涉及到MAPPO算法，并且我对MAPPO算法这种多智能体算法的信息交互机制不甚了解，于是写了这个系列的笔记，目的是巩固知识，并且进行一些粗浅又滑稽的总结。 1.PPO算法的介绍 1.1.PG算法如果要分类的话，根据学习方法的不同，可以将强化学习分为Value-based方法、阅读全文

posted @ 2022-06-19 02:49 几块红布阅读(4899) 评论(0) 推荐(2)

LAKan的笔记

公告