RE-EVALUATE: Reproducibility in Evaluating Reinforcement Learning Algorithms


发表时间:2018(2nd Reproducibility in Machine Learning Workshop at ICML 2018)
文章要点:文章想说,现在这些RL算法不好复现,就是因为大家各搞各的,评估标准不一样,计算方式不一样等等。然后作者就提出了一个evaluation pipeline,大概意思就是说大家写算法的时候,train可以各搞各的,test的时候要用相同的标准接口实现,然后用一个单独设计的统一的或者说第三方的evaluation来比较,就没了。
总结:看了这篇文章的第一反应是,这也能发?
疑问:

posted @ 2021-09-23 01:01  initial_h  阅读(96)  评论(0)    收藏  举报