摘要: RNN结构,双向LSTM,Transformer, BERT对比分析 RNN RNN 按照时间步展开 Bi-RNN 向前和向后的隐含层之间没有信息流。 LSTM 长短期记忆(Long short-term memory, LSTM)是一种特殊的RNN,主要是为了解决长序列训练过程中的梯度消失问题。 阅读全文
posted @ 2021-12-17 18:06 _无支祁 阅读(1993) 评论(0) 推荐(0)
摘要: 一、Normlization 原因和动机 在机器学习和深度学习中,有一个共识:独立同分布的数据可以简化模型的训练以及提升模型的预测能力——这是通过训练数据获得的模型能够在测试集获得好的效果的一个基本保障。也就是说我们在使用机器学习和深度学习的时候,会把数据尽可能的做一个独立同分布的处理,用来加快模型 阅读全文
posted @ 2021-12-17 17:39 _无支祁 阅读(499) 评论(0) 推荐(0)