摘要:
Deep Q-learning Network 参考资料: Q_learning论文 "Playing Atari with Deep Reinforcement Learning" https://arxiv.org/abs/1312.5602 李宏毅"强化学习教程" http://speech. 阅读全文
posted @ 2019-12-26 15:52
苍老的小孩et
阅读(218)
评论(0)
推荐(0)
摘要:
神经元neuron(基本计算单元) xi为输入,wi为各项输入的权重,b为偏差,f为激活函数,h为输出。输入的加权和,经过激活函数映射为输出。 参数的物理意义:权重(各输入的重要程度)偏差(该神经元被激活的难易程度≈阈值) 激活函数:常见有sigmoid函数,tanh(双曲正切)函数,线性整流函数R 阅读全文
posted @ 2019-12-17 21:19
苍老的小孩et
阅读(1650)
评论(0)
推荐(0)
浙公网安备 33010602011771号