05 2022 档案

摘要:AC算法 阅读全文
posted @ 2022-05-09 15:57 lee_ing 阅读(60) 评论(0) 推荐(0)
摘要:利用时序卷积+注意力机制弥补RNN的不足 阅读全文
posted @ 2022-05-09 12:00 lee_ing 阅读(231) 评论(0) 推荐(0)
摘要:策略梯度的基本原理及理解 阅读全文
posted @ 2022-05-09 10:32 lee_ing 阅读(70) 评论(0) 推荐(0)
摘要:介绍强化学习的基本要素以及各种算法 阅读全文
posted @ 2022-05-09 10:03 lee_ing 阅读(53) 评论(0) 推荐(0)
摘要:利用循环神经网络来进行先验知识的学习,进而优化RL model 阅读全文
posted @ 2022-05-08 16:27 lee_ing 阅读(250) 评论(0) 推荐(0)
摘要:利用第一次梯度对第二次梯度进行提升。 阅读全文
posted @ 2022-05-08 12:16 lee_ing 阅读(92) 评论(0) 推荐(0)
摘要:介绍RL 阅读全文
posted @ 2022-05-08 09:53 lee_ing 阅读(77) 评论(0) 推荐(0)
摘要:元学习系统(监督+从属)扩展于RL设置 阅读全文
posted @ 2022-05-07 19:30 lee_ing 阅读(112) 评论(0) 推荐(0)
摘要:利用梯度下降进行元学习 阅读全文
posted @ 2022-05-07 17:05 lee_ing 阅读(65) 评论(0) 推荐(0)