会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
yingfengwu
The so-called excellent person is to let the world, because with me, be a little different.
博客园
首页
新随笔
联系
订阅
管理
01 2020 档案
强化学习的细分类
摘要:强化学习一般分为无模型的强化学习(Model-Free RL)和基于模型的强化学习(Model-Based RL) ·无模型的强化学习又分为Policy Optimization和Q-learning 使用Policy Optimization的算法:Policy Gradient、A2C/A3C、
阅读全文
posted @
2020-01-28 14:54
yingfengwu
阅读(2336)
评论(0)
推荐(0)
Anaconda切换工作目录盘符
摘要:先回到C盘符的根目录再切换到其他盘符
阅读全文
posted @
2020-01-18 16:19
yingfengwu
阅读(2064)
评论(0)
推荐(1)
公告