基于gensim深入自然语言处理

2018.01.26

一、如何使用gesim

1、几个关键术语

Corpus:语料,包括最原始的文章、词袋、以及词向量,

Vector:向量,包括词袋,tfidf向量、Lsi向量、Lda向量

model:转化器,tfidf、lai、lda将语料从一种向量转化为量外一种向量,目的是为了用更少的空间,更有效的表征文章的含义

一、如何使用gesim

1、几个关键术语

Corpus:语料,包括最原始的文章、词袋、以及词向量,

Vector:向量,包括词袋,tfidf向量、Lsi向量、Lda向量

model:转化器,tfidf、lai、lda将语料从一种向量转化为量外一种向量,目的是为了用更少的空间,更有效的表征文章的含义

 

nlp网站

http://www.hankcs.com/nlp/ 讲解分词、词性标注、

word2vec和fasttext比较

posted @ 2018-01-26 16:48  lxwlxw  阅读(185)  评论(0编辑  收藏  举报