会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Lee_ing
博客园
首页
新随笔
联系
订阅
管理
05 2022 档案
lec-6-Actor-Critic Algorithms
摘要:AC算法
阅读全文
posted @
2022-05-09 15:57
lee_ing
阅读(60)
评论(0)
推荐(0)
ICLR 2018-A Simple Neural Attentive Meta-Learner
摘要:利用时序卷积+注意力机制弥补RNN的不足
阅读全文
posted @
2022-05-09 12:00
lee_ing
阅读(231)
评论(0)
推荐(0)
lec-5-Policy Gradients
摘要:策略梯度的基本原理及理解
阅读全文
posted @
2022-05-09 10:32
lee_ing
阅读(70)
评论(0)
推荐(0)
lec-4-Introduction to Reinforcement Learning
摘要:介绍强化学习的基本要素以及各种算法
阅读全文
posted @
2022-05-09 10:03
lee_ing
阅读(53)
评论(0)
推荐(0)
ICLR 2017-RL2: Fast Reinforcement Learning via Slow Reinforcement Learning
摘要:利用循环神经网络来进行先验知识的学习,进而优化RL model
阅读全文
posted @
2022-05-08 16:27
lee_ing
阅读(250)
评论(0)
推荐(0)
ICML 2017-Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks
摘要:利用第一次梯度对第二次梯度进行提升。
阅读全文
posted @
2022-05-08 12:16
lee_ing
阅读(92)
评论(0)
推荐(0)
lec-1-Deep Reinforcement Learning, Decision Making, and Control
摘要:介绍RL
阅读全文
posted @
2022-05-08 09:53
lee_ing
阅读(77)
评论(0)
推荐(0)
CogSci 2017-Learning to reinforcement learn
摘要:元学习系统(监督+从属)扩展于RL设置
阅读全文
posted @
2022-05-07 19:30
lee_ing
阅读(112)
评论(0)
推荐(0)
ICANN 2001-Learning to Learn Using Gradient Descent
摘要:利用梯度下降进行元学习
阅读全文
posted @
2022-05-07 17:05
lee_ing
阅读(65)
评论(0)
推荐(0)
公告