2021 年 4月 26 日随笔档案 - 穷酸秀才大草包 - 博客园

2021年4月26日

Evolution Strategies as a Scalable Alternative to Reinforcement Learning

摘要：探索使用进化策略(ES)(一种黑盒优化算法)来替代流行的基于MDP的RL技术(例如Q学习和策略梯度) 阅读全文

posted @ 2021-04-26 11:09 穷酸秀才大草包阅读(316) 评论(0) 推荐(0)

导航

公告