摘要:
结果: 结果: 结果: Tensor的属性: 几种Tensor: Constant(常量):值不能改变的一种Tensor。tf.constant Placeholder(占位符):先占住一个固定的位置,等着你之后往里面添加值的一种Tensor。tf.placeholder Variable(变量): 阅读全文
posted @ 2019-03-19 22:13
耐烦不急
阅读(236)
评论(0)
推荐(0)
摘要:
TensorFlow 的两个版本 官网安装教程:https://www.tensorflow.org/install 1.windows下Tensorflow的安装 安装一下开发环境,对于一台裸机来说,只能从头开始。 1.1、安装anaconda anaconda想必大家都不陌生,由于网站登不上去, 阅读全文
posted @ 2019-03-19 22:08
耐烦不急
阅读(423)
评论(0)
推荐(0)
摘要:
理想状态指的是有最终的目标,赢了就会有奖励。 可以多次尝试(死了重来、输了重来等) Bellman方程:当前状态的价值和下一步的价值及当前的奖励(Reward)有关;价值函数分解为当前的奖励和下一步的价值两部分。 注意:动作空间A,状态空间S均为有限集合! 举个例子(本例子没加折扣因子,要想加上只需 阅读全文
posted @ 2019-03-19 14:56
耐烦不急
阅读(483)
评论(0)
推荐(0)

浙公网安备 33010602011771号