tensorflow2.0——梯度爆炸处理

原来的参数更新代码:

  

 

 加一个Graddient Clipping后(原理是当梯度高于某个阈值时,自动除以自己的模来达到减小梯度的目的):

比如下图中设置梯度最大值为15

  

 

posted @ 2020-10-16 12:45  山…隹  阅读(333)  评论(0编辑  收藏  举报