导航

2023年2月18日

摘要: 论文阅读: 1、变循环发动机智能控制器设计 胡雪兰 该文章中将强化学习中的确定性策略梯度(DPG)算法融合进AC(演员-评论家)框架中,用来对变循环发动机(VCE)进行控制研究。算法结构图如下所示: 在文章中详细介绍了经典的确定性策略梯度算法和基于优先回放机制的确定性策略梯度算法。给出了两个算法的不 阅读全文

posted @ 2023-02-18 21:12 暗恋懒羊羊 阅读(140) 评论(0) 推荐(0)