pine73 - 博客园

公告

2018年7月31日

摘要：这是github上RL练习的笔记 https://github.com/dennybritz/reinforcement-learning/tree/master/DP Implement Policy Evaluation in Python (Gridworld) 首先观察opai env.P的阅读全文

posted @ 2018-07-31 12:47 pine73 阅读(225) 评论(0) 推荐(0)

2018年7月17日

关于tensorflow get_variable的initializer参数

摘要：版本：tensorflow 1.9 get_variable的initializer参数只能是Tensor对象，或接收shape及dtype作为参数并返回Tensor的callable 类似tf.truncated_normal_initializer的对象是继承Initializer的类详见：h 阅读全文

posted @ 2018-07-17 09:55 pine73 阅读(1523) 评论(0) 推荐(0)

2018年7月16日

tensorflow Optimizer.minimize()和gradient clipping

摘要：在tensorflow中通常使用下述方法对模型进行训练 train指向的是tf.Graph中关于训练的节点，其中opt.minimize(loss)相当不直观，它相当于即建立了求梯度的节点和optimizer根据梯度对变量进行修改的节点因此，可以通过下述方法对梯度进行修改举两个例子阅读全文

posted @ 2018-07-16 18:23 pine73 阅读(1251) 评论(0) 推荐(0)

tensorflow graph（图）和session（会话）

摘要：以下运行环境: Ubuntu 18.04 LTS, tensorflow 1.8, python 3.6.5 tensorflow的tf.Graph是静态的图（对比eager execution），它表示模型的骨架，定义图不需要输入数据也不会执行运算图的创建和使用一个图对应一个模型，尽量不要出现阅读全文

posted @ 2018-07-16 16:25 pine73 阅读(2477) 评论(0) 推荐(0)