摘要: 例如,循环神经网络在实践中一个常见问题是数值不稳定性。 尽管我们已经应用了梯度裁剪等技巧来缓解这个问题, 但是仍需要通过设计更复杂的序列模型来进一步处理它。 具体来说,我们将引入两个广泛使用的网络, 即门控循环单元(gated recurrent units,GRU)和 长短期记忆网络(long s 阅读全文
posted @ 2023-07-30 09:05 浪矢-CL 阅读(71) 评论(0) 推荐(0) 编辑