参考了这篇文章:http://nlp.seas.harvard.edu/2018/04/03/attention.html
结合代码和图,能更加清楚的了解transformer中的一些原理(ps,等下次有时间在排下版)
posted on 2019-07-15 16:57 _dshizhh 阅读(686) 评论(0) 收藏 举报