摘要: 现在attention的热度已经过去了,基本上所有的attention都是transformer的kqv形式的,甚至只要说道attention,默认就是transformer的attention。 为避免遗忘历史,我这里做一个小总结。繁杂的att我就不去了解了,只了解下经典的。 以下以\(h_i\) 阅读全文
posted @ 2023-12-11 14:45 ZephyrYin 阅读(47) 评论(0) 推荐(0)