摘要:
TensorFlow与PyTorch比较 一、总结 一句话总结: 谷歌的 Tensorflow(2015) 与 Facebook 的 PyTorch(2017),都是开源的 PyTorch 和 TensorFlow 的关键差异是它们执行代码的方式。这两个框架都基于基础数据类型张量(tensor)而工 阅读全文
posted @ 2020-09-30 06:39
范仁义
阅读(2542)
评论(0)
推荐(0)
摘要:
强化学习 基础 一、总结 一句话总结: 我们选择了动作At后,环境的状态(State)会变,我们会发现环境状态已经变为St+1,同时我们得到了我们采取动作At的延时奖励(Reward)Rt+1。 然后个体可以继续选择下一个合适的动作,然后环境的状态又会变,又有新的奖励值。。。这就是强化学习的思路。 阅读全文
posted @ 2020-09-30 06:29
范仁义
阅读(284)
评论(0)
推荐(0)

浙公网安备 33010602011771号