摘要: 一、为什么一开始选用Bert模型作为最后意图分类项目模型 Attention is all you need. Bert能很好的学习带有上下文语境的词向量和句子的前后顺序,但也有不足就是不能用来生成句子/词,毕竟其不是一个预测模型。 网络结构:完全双向,层数深,可表征的函数空间足够大,self-at 阅读全文
posted @ 2023-03-26 19:23 哦呦aholic 阅读(97) 评论(0) 推荐(0)