摘要: 1.首先,查看tensorboard的版本 在windows命令窗口敲入命令pip list即可查看安装的tensorboard版本,如下所示: 查看版本号是为了考虑可能版本的更新导致操作命令的更新 2.执行tensorboard语句 使用tensoflow的FileWriter生成对应的神经网络图 阅读全文
posted @ 2020-02-04 17:27 yingfengwu 阅读(822) 评论(0) 推荐(0)
摘要: 强化学习算法类型 策略梯度:可直接区别以上的目标 基于值:估计最优策略(不明确哪个是最优的策略情况下估计)的值函数和Q函数 Actor-critic(演员-评论家):使用当前策略去估计值函数和Q函数来改进策略 基于模型:估计转换模型,接着 1.让该模型去规划不明确的策略 2.让该模型去改进策略 3. 阅读全文
posted @ 2020-02-04 12:09 yingfengwu 阅读(612) 评论(0) 推荐(0)