摘要: Bi-LSTM(Attention) @ 1.理论 1.1 文本分类和预测(翻译) 文本分类的输入处理和预测(翻译)不同: 预测(翻译)通常用eye()把每个输入向量转换为one-hot向量, 但文本分类模型通常用Embedding初始化一个嵌入矩阵用来训练,不需要one-hot向量 1.2 注意力 阅读全文
posted @ 2022-09-15 13:01 CJK'sBLOG 阅读(353) 评论(0) 推荐(0)