摘要:
现在attention的热度已经过去了,基本上所有的attention都是transformer的kqv形式的,甚至只要说道attention,默认就是transformer的attention。 为避免遗忘历史,我这里做一个小总结。繁杂的att我就不去了解了,只了解下经典的。 以下以\(h_i\) 阅读全文
posted @ 2023-12-11 14:45
ZephyrYin
阅读(47)
评论(0)
推荐(0)
浙公网安备 33010602011771号