摘要: 论文地址:https://arxiv.org/pdf/1802.05365.pdf 简介 以往的词向量如word2vec、glove等词向量模型,针对某一个词生成的词向量都是固定的,无法解决一词多义现象,如“苹果”在不同的上下文中有不同的含义,它可表示一种水果、一个公司名称或者手机、电脑、平板电脑等 阅读全文
posted @ 2020-03-11 16:38 justDoIT& 阅读(1849) 评论(1) 推荐(1)
摘要: 简介 LSTM(Long short-term memory,长短期记忆)是一种特殊的RNN,主要是为了解决长序列训练过程中的梯度消失问题。以下先从RNN介绍。 简说RNN RNN(Recurrent Neural Network,循环神经网络)是一种处理序列数据的神经网络。下图是它的结构: 从上图 阅读全文
posted @ 2020-03-11 16:33 justDoIT& 阅读(7337) 评论(0) 推荐(0)