摘要:
这一章我们来唠唠如何优化BERT对文本长度的限制,核心是对Transformer计算效率的优化,我们会分别从片段递归,稀疏注意力机制和矩阵降维几个方向,聊聊更高效的Transformer魔改方案 阅读全文
这一章我们来唠唠如何优化BERT对文本长度的限制,核心是对Transformer计算效率的优化,我们会分别从片段递归,稀疏注意力机制和矩阵降维几个方向,聊聊更高效的Transformer魔改方案 阅读全文
posted @ 2022-10-08 10:36
风雨中的小七
阅读(2213)
评论(0)
推荐(0)

浙公网安备 33010602011771号