摘要: 之前的章节都是基于model base,这节是model free的方法。 1. model-base to model-free: 2. 计算\(q_{\pi k}:\) 3. MC base algorithm: step 1和model base是不一样的,后面的步骤是一样的。 4. MC e 阅读全文
posted @ 2024-11-18 13:47 penuel 阅读(117) 评论(0) 推荐(0)