随笔分类 - 文本处理

word embeddding和keras中的embedding

摘要：训练好的词向量模型被保存下来，该模型的本质就是一个m*n的矩阵，m代表训练语料中词的个数，n代表训练时我们设定的词向量维度。当我们训练好模型后再次调用时，就可以从该模型中直接获取到对应词的词向量。通过上面我们可以拿到每个词的词向量，但是我们任务处理时一般是对句子或文本进行操作。当我们拿到一个词向量阅读全文

posted @ 2018-12-10 11:04 wzd321 阅读(722) 评论(0) 推荐(0)

TF-IDF算法原理

摘要：原文：https://www.cnblogs.com/biyeymyhjob/archive/2012/07/17/2595249.html TF-IDF（term frequency–inverse document frequency）是一种用于资讯检索与资讯探勘的常用加权技术。TF-IDF是一阅读全文

posted @ 2018-11-05 20:05 wzd321 阅读(433) 评论(0) 推荐(0)

wzd321

导航

公告

随笔分类 - 文本处理

word embeddding和keras中的embedding

TF-IDF算法原理