摘要: 1.The simplest Actor-Critic(QAC) 2. Advantage actor-critic(A2C) 3. Off-policy actor-critic 4. Deterministic actor-critic(DPG) 阅读全文
posted @ 2025-04-10 16:56 penuel 阅读(33) 评论(0) 推荐(0)
摘要: 1. Basic idea of policy gradient 之前的策略都是用表格表示的,现在改成函数的形式描述策略 2. Metric 1 - Average value 3. Metric 2 - Average reward 4. Gradients of the metrics 5. G 阅读全文
posted @ 2025-04-10 11:08 penuel 阅读(30) 评论(0) 推荐(0)
摘要: 当state space太大的时候,需要用一个函数来对state value 或action value进行近似,方便处理 1. Algorithm for state value estimation 1.1 Objective function 这里\(d_{\pi}\)是权重,可以决定哪个st 阅读全文
posted @ 2025-04-01 11:45 penuel 阅读(51) 评论(0) 推荐(0)
摘要: 1. TD learning of state values 公式1是用来根据\(s_t\)的state value来更新t+1的状态。 公式2是没有被访问的状态,下一刻的state value等于上一刻的。 1.1两个概念:TD target ,TD error TD target: TD err 阅读全文
posted @ 2025-03-19 11:46 penuel 阅读(31) 评论(0) 推荐(0)
摘要: 这个文件主要是对最优问题的构造。 1. setupOptimalConrolProblem void LeggedRobotInterface::setupOptimalConrolProblem(const std::string& taskFile, const std::string& urd 阅读全文
posted @ 2025-01-02 14:13 penuel 阅读(102) 评论(0) 推荐(0)
摘要: 步态文件: 1. 步态类型 list { [0] stance 静止 [1] trot 快走,一种快速、稳定的交替对角步态 [2] standing_trot 在交替的步伐中插入静止阶段,增加稳定性 [3] flying_trot 在交替的步伐中插入腾空阶段,增加速度 [4] pace 同侧步态,左 阅读全文
posted @ 2025-01-02 10:20 penuel 阅读(132) 评论(0) 推荐(0)
摘要: 1. 创建MPC_ROS_Interface接口,以sqpMpc为例 //自定义接口 LeggedRobotInterface interface(taskFile, urdfFile, referenceFile); // 创建同步接口 auto gaitReceiverPtr = std::ma 阅读全文
posted @ 2024-12-30 10:55 penuel 阅读(263) 评论(0) 推荐(0)
摘要: 1. ModelHelperFunctions.cpp 1.1 updateCentroidalDynamics() : 质心动力学更新 template <typename SCALAR_T> void updateCentroidalDynamics(PinocchioInterfaceTpl< 阅读全文
posted @ 2024-12-19 17:22 penuel 阅读(544) 评论(0) 推荐(0)
摘要: 计算特定时间点指定腿的垂直速度约束 \(v_z=trajectory[index].velocity(time)\) scalar_t SwingTrajectoryPlanner::getZvelocityConstraint(size_t leg, scalar_t time) const { 阅读全文
posted @ 2024-12-11 10:59 penuel 阅读(190) 评论(0) 推荐(0)
摘要: 定义: \(g(xee, vee) = Ax * xee + Av * vee + b\) xee:末端位置 vee:线速度 值: vector_t EndEffectorLinearConstraint::getValue(scalar_t time, const vector_t& state, 阅读全文
posted @ 2024-12-10 15:23 penuel 阅读(90) 评论(0) 推荐(0)