强化学习算法如何控制人形机器人行走的 —— 策略映射动作,动作如何控制电机?
实例:基于actor-critic强化学习的机器人控制框架。强化学习策略π基于机器人当前状态和参考运动状态,计算出一个动作增量δa,加参考关节角度â得到最终的目标关节角度a。最后,低层PD控制器使用这些目标关节角度来驱动机器人,从而实现对参考运动的跟踪和鲁棒的行走。
源自:
https://zhuanlan.zhihu.com/p/1921923640007594397
本博客是博主个人学习时的一些记录,不保证是为原创,个别文章加入了转载的源地址,还有个别文章是汇总网上多份资料所成,在这之中也必有疏漏未加标注处,如有侵权请与博主联系。
如果未特殊标注则为原创,遵循 CC 4.0 BY-SA 版权协议。
posted on 2025-09-23 08:59 Angry_Panda 阅读(43) 评论(0) 收藏 举报
浙公网安备 33010602011771号