面向分布式强化学习的经验回放框架——Reverb: A Framework for Experience Replay

论文题目:

Reverb: A Framework for Experience Replay

地址:

https://arxiv.org/pdf/2102.04736.pdf

 

 

 

偶然间看到了这个experience replay框架,这个框架可以被看做是公开的工业界使用的面向分布式的经验回放框架,这方面的工作一直较少,可能这样的工作更偏向于工程而不是学术所以导致很少有人在做,即使是那些工业界也少有人在做这方面的工作,但是这样的工作还是蛮有必要的,毕竟算法这东西最后还是要服务于工业界的。

 

 

 

========================================================

 

 

 

这个框架的安装方法(ubuntu系统环境下):

强化学习分布式经验回放框架(experience replay)reverb的安装

 

 

 

========================================================

 

posted on 2022-05-12 08:13  Death_Knight  阅读(31)  评论(0编辑  收藏  举报

导航