导航

随笔分类 -  文本处理

摘要:训练好的词向量模型被保存下来,该模型的本质就是一个m*n的矩阵,m代表训练语料中词的个数,n代表训练时我们设定的词向量维度。当我们训练好模型后再次调用时,就可以从该模型中直接获取到对应词的词向量。 通过上面我们可以拿到每个词的词向量,但是我们任务处理时一般是对句子或文本进行操作。当我们拿到一个词向量 阅读全文

posted @ 2018-12-10 11:04 wzd321 阅读(721) 评论(0) 推荐(0)

摘要:原文:https://www.cnblogs.com/biyeymyhjob/archive/2012/07/17/2595249.html TF-IDF(term frequency–inverse document frequency)是一种用于资讯检索与资讯探勘的常用加权技术。TF-IDF是一 阅读全文

posted @ 2018-11-05 20:05 wzd321 阅读(431) 评论(0) 推荐(0)