摘要:
问题: https://www.programcreek.com/python/example/90420/tensorflow.map_fn https://stackoverflow.com/questions/34987509/tensorflow-max-of-a-tensor-along- 阅读全文
posted @ 2019-01-14 21:36
乐乐章
阅读(614)
评论(0)
推荐(0)
摘要:
https://github.com/yenchenlin/DeepLearningFlappyBird https://pypi.org/project/gym-tetris/ https://github.com/openai/gym/wiki/Leaderboard#breakout-v0 h 阅读全文
posted @ 2019-01-14 15:48
乐乐章
阅读(861)
评论(1)
推荐(0)
摘要:
Double DQN 算Q值 与选Q值是分开的,2个网络。 Multi-step Dueling DQN 如果更新了,即使有的action没有被采样到,也会更新Q值 Prioritized Reply Noisy Net Epsilon Greedy 存在的问题是在一局游戏中, 即使是同一个agen 阅读全文
posted @ 2019-01-14 15:10
乐乐章
阅读(545)
评论(0)
推荐(0)

浙公网安备 33010602011771号