2023 年 2月 18 日随笔档案 - 暗恋懒羊羊

2023年2月18日

2.18随笔（强化学习）

摘要：论文阅读： 1、变循环发动机智能控制器设计胡雪兰该文章中将强化学习中的确定性策略梯度（DPG）算法融合进AC（演员-评论家）框架中，用来对变循环发动机（VCE）进行控制研究。算法结构图如下所示：在文章中详细介绍了经典的确定性策略梯度算法和基于优先回放机制的确定性策略梯度算法。给出了两个算法的不阅读全文

posted @ 2023-02-18 21:12 暗恋懒羊羊阅读(148) 评论(0) 推荐(0)

flying23

导航

公告

2.18随笔（强化学习）