摘要:        
TensorFlow与PyTorch比较 一、总结 一句话总结: 谷歌的 Tensorflow(2015) 与 Facebook 的 PyTorch(2017),都是开源的 PyTorch 和 TensorFlow 的关键差异是它们执行代码的方式。这两个框架都基于基础数据类型张量(tensor)而工    阅读全文
posted @ 2020-09-30 06:39
范仁义
阅读(2504)
评论(0)
推荐(0)
        
            
        
        
摘要:        
强化学习 基础 一、总结 一句话总结: 我们选择了动作At后,环境的状态(State)会变,我们会发现环境状态已经变为St+1,同时我们得到了我们采取动作At的延时奖励(Reward)Rt+1。 然后个体可以继续选择下一个合适的动作,然后环境的状态又会变,又有新的奖励值。。。这就是强化学习的思路。     阅读全文
posted @ 2020-09-30 06:29
范仁义
阅读(263)
评论(0)
推荐(0)
        
 
    
 
 
         浙公网安备 33010602011771号
浙公网安备 33010602011771号