2022 年 5月随笔档案 - lee_ing

摘要：AC算法阅读全文

posted @ 2022-05-09 15:57 lee_ing 阅读(60) 评论(0) 推荐(0)

摘要：利用时序卷积+注意力机制弥补RNN的不足阅读全文

posted @ 2022-05-09 12:00 lee_ing 阅读(231) 评论(0) 推荐(0)

lec-5-Policy Gradients

摘要：策略梯度的基本原理及理解阅读全文

posted @ 2022-05-09 10:32 lee_ing 阅读(70) 评论(0) 推荐(0)

摘要：介绍强化学习的基本要素以及各种算法阅读全文

posted @ 2022-05-09 10:03 lee_ing 阅读(53) 评论(0) 推荐(0)

摘要：利用循环神经网络来进行先验知识的学习，进而优化RL model 阅读全文

posted @ 2022-05-08 16:27 lee_ing 阅读(250) 评论(0) 推荐(0)

摘要：利用第一次梯度对第二次梯度进行提升。阅读全文

posted @ 2022-05-08 12:16 lee_ing 阅读(92) 评论(0) 推荐(0)

摘要：介绍RL 阅读全文

posted @ 2022-05-08 09:53 lee_ing 阅读(77) 评论(0) 推荐(0)

摘要：元学习系统（监督+从属）扩展于RL设置阅读全文

posted @ 2022-05-07 19:30 lee_ing 阅读(112) 评论(0) 推荐(0)

摘要：利用梯度下降进行元学习阅读全文

posted @ 2022-05-07 17:05 lee_ing 阅读(65) 评论(0) 推荐(0)

Lee_ing