摘要:
参考自李宏毅老师的self-atention的课程 pd下载:self-atention、Transformer 理论说明 在NLP中,常用的计算两个向量之间相关性的方法有以下两种: self-attention中用的就是左侧的类型,将两个向量乘以一个可训练权重,然后将结构进行对应相乘,得到最终的相 阅读全文
posted @ 2021-11-23 18:21
xingye_z
阅读(835)
评论(0)
推荐(0)
浙公网安备 33010602011771号