摘要: 一、关于RNN的梯度消失&爆炸问题 1. 关于RNN结构 循环神经网络RNN(Recurrent Neural Network)是用于处理序列数据的一种神经网络,已经在自然语言处理中被广泛应用。下图为经典RNN结构: 2. 关于RNN前向传播 RNN前向传导公式: 其中: St : t 时刻的隐含层 阅读全文
posted @ 2020-04-28 11:38 outthinker 阅读(5889) 评论(0) 推荐(0)
摘要: 这里讲一下RNN(又称“valina RNN”)&GRU&LSTM三者的具体结构以及之间的联系。 1、RNN 在基本的RNN中(valina RNN),输出和隐状态相同; 2、GRU 加入了reset门和update门,前者用于确定前一步的隐状态有多少可以输入当前步,后者用于确定当前步的隐状态有多少 阅读全文
posted @ 2020-04-28 10:48 outthinker 阅读(4208) 评论(0) 推荐(0)