摘要: 当state space太大的时候,需要用一个函数来对state value 或action value进行近似,方便处理 1. Algorithm for state value estimation 1.1 Objective function 这里\(d_{\pi}\)是权重,可以决定哪个st 阅读全文
posted @ 2025-04-01 11:45 penuel 阅读(51) 评论(0) 推荐(0)