机器学习中的渐进最优化是指什么 —— (强化学习为例)


机器学习理论中的渐进最优化是指无限时间运行下算法最终收敛到最优值,而在强化学习中这个无限时间下的运行是为了保证所有状态空间均可以被访问无限次,从而实现无限次的优化。
    本博客是博主个人学习时的一些记录,不保证是为原创,个别文章加入了转载的源地址,还有个别文章是汇总网上多份资料所成,在这之中也必有疏漏未加标注处,如有侵权请与博主联系。
如果未特殊标注则为原创,遵循 CC 4.0 BY-SA 版权协议。
posted on 2024-12-25 09:25 Angry_Panda 阅读(49) 评论(0) 收藏 举报
 
                     
                    
                 
                    
                 
                
            
         
         
 浙公网安备 33010602011771号
浙公网安备 33010602011771号