摘要:
这是github上RL练习的笔记 https://github.com/dennybritz/reinforcement-learning/tree/master/DP Implement Policy Evaluation in Python (Gridworld) 首先观察opai env.P的 阅读全文
posted @ 2018-07-31 12:47
pine73
阅读(214)
评论(0)
推荐(0)
|
摘要:
这是github上RL练习的笔记 https://github.com/dennybritz/reinforcement-learning/tree/master/DP Implement Policy Evaluation in Python (Gridworld) 首先观察opai env.P的 阅读全文
posted @ 2018-07-31 12:47
pine73
阅读(214)
评论(0)
推荐(0)
摘要:
版本:tensorflow 1.9 get_variable的initializer参数只能是Tensor对象,或接收shape及dtype作为参数并返回Tensor的callable 类似tf.truncated_normal_initializer的对象是继承Initializer的类 详见:h 阅读全文
posted @ 2018-07-17 09:55
pine73
阅读(1520)
评论(0)
推荐(0)
摘要:
在tensorflow中通常使用下述方法对模型进行训练 train指向的是tf.Graph中关于训练的节点,其中opt.minimize(loss)相当不直观,它相当于 即建立了求梯度的节点和optimizer根据梯度对变量进行修改的节点 因此,可以通过下述方法对梯度进行修改 举两个例子 阅读全文
posted @ 2018-07-16 18:23
pine73
阅读(1237)
评论(0)
推荐(0)
摘要:
以下运行环境: Ubuntu 18.04 LTS, tensorflow 1.8, python 3.6.5 tensorflow的tf.Graph是静态的图(对比eager execution),它表示模型的骨架,定义图不需要输入数据也不会执行运算 图的创建和使用 一个图对应一个模型,尽量不要出现 阅读全文
posted @ 2018-07-16 16:25
pine73
阅读(2476)
评论(0)
推荐(0)
|