摘要:
1.首先,查看tensorboard的版本 在windows命令窗口敲入命令pip list即可查看安装的tensorboard版本,如下所示: 查看版本号是为了考虑可能版本的更新导致操作命令的更新 2.执行tensorboard语句 使用tensoflow的FileWriter生成对应的神经网络图 阅读全文
posted @ 2020-02-04 17:27
yingfengwu
阅读(822)
评论(0)
推荐(0)
摘要:
强化学习算法类型 策略梯度:可直接区别以上的目标 基于值:估计最优策略(不明确哪个是最优的策略情况下估计)的值函数和Q函数 Actor-critic(演员-评论家):使用当前策略去估计值函数和Q函数来改进策略 基于模型:估计转换模型,接着 1.让该模型去规划不明确的策略 2.让该模型去改进策略 3. 阅读全文
posted @ 2020-02-04 12:09
yingfengwu
阅读(612)
评论(0)
推荐(0)

浙公网安备 33010602011771号