摘要:
郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Neural Computation, no. 1 (2000): 219-245 Abstract 本文提出了一种用于连续时间动态系统的强化学习框架,而没有时间、状态和动作的离散先验。基于哈密尔顿-雅各比-贝尔曼(HJB)方程的无穷视野 阅读全文
posted @ 2021-05-19 15:09
穷酸秀才大草包
阅读(472)
评论(0)
推荐(0)

浙公网安备 33010602011771号