2021 年 1月 21 日随笔档案 - gy77

2021年1月21日

周博磊老师强化学习纲领笔记第二课：MDP，Policy Iteration与Value Iteration

摘要： gym环境：FrozenLake-v0：http://gym.openai.com/envs/FrozenLake-v0/ 代码来自：周博磊老师的GitHub：https://github.com/cuhkrlcourse/RLexample/tree/master/MDP 环境如下： SFFF ( 阅读全文

posted @ 2021-01-21 17:01 gy77 阅读(639) 评论(0) 推荐(0)

一届书生

本博客所有内容以学习、研究和分享为主，如需转载，请标明作者和出处，并且是非商业用途，谢谢。

公告