苍老的小孩et - 博客园

2019年12月

摘要： Deep Q-learning Network 参考资料： Q_learning论文 "Playing Atari with Deep Reinforcement Learning" https://arxiv.org/abs/1312.5602 李宏毅"强化学习教程" http://speech. 阅读全文

posted @ 2019-12-26 15:52 苍老的小孩et 阅读(233) 评论(0) 推荐(0)

MLP(multi-layer perceptrons)

摘要：神经元neuron（基本计算单元） xi为输入，wi为各项输入的权重，b为偏差，f为激活函数，h为输出。输入的加权和，经过激活函数映射为输出。参数的物理意义：权重（各输入的重要程度）偏差（该神经元被激活的难易程度≈阈值）激活函数：常见有sigmoid函数，tanh(双曲正切)函数，线性整流函数R 阅读全文

posted @ 2019-12-17 21:19 苍老的小孩et 阅读(1667) 评论(0) 推荐(0)

公告