02 2026 档案

基于自适应动态规划（ADHDP）的仿真程序实现

摘要：一、ADHDP算法原理 1. 系统架构 graph TD A[环境状态] --> B(执行网络) B --> C[执行动作] C --> D[环境反馈] D --> E(评价网络) E --> B 2. 核心方程贝尔曼最优方程：神经网络逼近： 3. 训练流程初始化执行网络和评价网络权重采集环阅读全文

posted @ 2026-02-02 14:06 令小飞阅读(1) 评论(0) 推荐(0)

02 2026 档案

公告