摘要: 从图上可以看出来,decode的过程其实都是从encode的最后一个隐层开始的,如果encode输入过长的话,会丢失很多信息,所以设计了attation机制。 attation机制的decode的过程和原来的最大的区别就是,它输出的不只是基于本时刻的h,而是基于本时刻的h和C的concat矩阵。 那 阅读全文
posted @ 2017-05-21 13:16 dmesg 阅读(5388) 评论(0) 推荐(1)