word embeddding和keras中的embedding

Posted on 2018-12-10 11:04 wzd321 阅读(722) 评论(0) 收藏举报

　　训练好的词向量模型被保存下来，该模型的本质就是一个m*n的矩阵，m代表训练语料中词的个数，n代表训练时我们设定的词向量维度。当我们训练好模型后再次调用时，就可以从该模型中直接获取到对应词的词向量。

　　通过上面我们可以拿到每个词的词向量，但是我们任务处理时一般是对句子或文本进行操作。当我们拿到一个词向量后，那么一个句子或一个文本就可以用词表示成矩阵（假设一个句子有5个词，词向量维度是64，那么该矩阵就是5*64）,然后可以用CNN或RNN（LSTM）模型将该矩阵编码成一个一维向量，并保留大多数文本信息。然后将该向量作为深度神经网络分类器的输入，即可得到最终的结果。

转载：

https://www.jianshu.com/p/b2c33d7e56a5

https://kexue.fm/archives/4122

刷新页面返回顶部

wzd321

导航

公告

word embeddding和keras中的embedding