摘要: 论文地址: "Attention is you need" 序列编码 深度学习做NLP的方法,基本都是先将句子分词,然后每个词转化为对应的的词向量序列,每个句子都对应的是一个矩阵$X=(x_1,x_2,...,x_t)$,其中$x_i$都代表着第$i$个词向量,维度为d维,故$x\in R^{n×d 阅读全文
posted @ 2018-10-14 22:14 冬色 阅读(1294) 评论(0) 推荐(0) 编辑