2021年5月19日

摘要: 郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Neural Computation, no. 1 (2000): 219-245 Abstract 本文提出了一种用于连续时间动态系统的强化学习框架,而没有时间、状态和动作的离散先验。基于哈密尔顿-雅各比-贝尔曼(HJB)方程的无穷视野 阅读全文
posted @ 2021-05-19 15:09 穷酸秀才大草包 阅读(472) 评论(0) 推荐(0)

导航