摘要: 自适应动态规划(Adaptive Dynamic Programming, ADP)是一种结合了动态规划和机器学习技术的算法,用于解决复杂的决策和控制问题。ADP算法通常包括两个主要部分:Actor(执行者)和Critic(评估者)。Actor负责选择最优的动作,而Critic负责评估当前策略的性能 阅读全文
posted @ 2025-06-09 16:47 荒川之主 阅读(87) 评论(0) 推荐(0)