摘要: 花书第10.2.2节的计算循环神经网络的梯度看了好久,总算是把公式的推导给看懂了,记录一下过程。 首先,对于一个普通的RNN来说,其前向传播过程为: $$\textbf{a}^{(t)}=\textbf{b}+\textbf{Wh}^{t-1}+\textbf{Ux}^{(t)}$$ $$\text 阅读全文
posted @ 2020-10-11 14:48 Kayden_Cheung 阅读(437) 评论(0) 推荐(0) 编辑
//目录