元强化学习算法(Meta-RL)—— MAML —— MAML-TRPO算法,实现细节:multi-gradient steps 多步梯度更新应该是在training阶段还是在testing阶段,更或者是同时在training阶段和testing阶段同时进行
    
  Angry_Panda 2025-04-14 14:54
    阅读:43 
    评论:0 
    推荐:0 
    
  
                阅读排行榜
    【转载】深度强化学习试金石:DeepMind和OpenAI攻克蒙特祖玛复仇的真正意义 —— 人工智能 —— 人类的智慧:抽象和归纳 ——(如何学习先验知识,对问题进行抽象,然后根据先验知识和抽象后的问题进行探索并归纳出问题的解决方案)
    
  Angry_Panda 2025-02-24 21:04
    阅读:43 
    评论:0 
    推荐:0 
    
  
                
    首届中国人形机器人产业大会 —— 小型双足机器人亮相
    
  Angry_Panda 2024-05-12 07:26
    阅读:43 
    评论:0 
    推荐:0 
    
  
                
    全地形人形机器人(humanoid)是否只能进行短距视野感知呢 —— 实时地形感知
    
  Angry_Panda 2024-03-22 21:49
    阅读:43 
    评论:0 
    推荐:0 
    
  
                
    git tag的使用
    
  Angry_Panda 2024-01-02 11:00
    阅读:43 
    评论:0 
    推荐:0 
    
  
                 
                    
                     
                    
                 
                    
                 
         
 浙公网安备 33010602011771号
浙公网安备 33010602011771号