会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
initial_h
https://github.com/initial-h
博客园
首页
新随笔
管理
2021年8月23日
MEASURING THE RELIABILITY OF REINFORCEMENT LEARNING ALGORITHMS
摘要: **发表时间:**2020(ICLR 2020) **文章要点:**这篇文章设计了几个指标来度量RL算法的可靠性。这个可靠性主要是指训练过程稳不稳定啦,算法训练是不是可复现啦,训好的模型的performance是不是稳定呀balabala。整个设计指标还是很简单的。其实一共设计了两个指标(dispe
阅读全文
posted @ 2021-08-23 08:15 initial_h
阅读(110)
评论(0)
推荐(0)
公告