摘要:
郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! arXiv: Learning, (2019) Abstract 深度RL算法需要大量经验才能学习单个任务。原则上,元强化学习(meta-RL)算法使智能体能够从少量经验中学习新技能,但一些主要挑战阻碍了它们的实用性。当前的方法严重依赖于 阅读全文
posted @ 2020-09-08 23:40
穷酸秀才大草包
阅读(1483)
评论(0)
推荐(0)

浙公网安备 33010602011771号