摘要: attention机制将整个句子作为输入,从中抽取有用的信息。 每个输出都跟整个句子优化,输出的值为输入的句子的词向量的一个加权求和值。 “This is what attention does, it extracts information from the whole sequence, a  阅读全文
posted @ 2021-08-16 18:31 xuyv 阅读(88) 评论(0) 推荐(0)