摘要:        
1. state:状态,可以是机器人的位置,速度,加速度等 2. action:对于每一个状态,可能的动作 3. state transition:状态转移 3.1 state transition probability: 4. policy:告诉agent在这个状态应该采用哪个action 5.    阅读全文
posted @ 2024-11-05 09:58
penuel
阅读(50)
评论(0)
推荐(0)
        
            
        
        
摘要:        
  
评论(0)
推荐(0)
        
 
                    
                
 浙公网安备 33010602011771号
浙公网安备 33010602011771号