随笔分类 -  自然语言处理

gensim使用-初识gensim安装与TF-IDF使用
摘要:前言 作为自然语言爱好者,那就必不可少的需要认识一下大名鼎鼎的Gensim。 Gensim是一款开源的第三方Python工具包,用于从原始的非结构化的文本中,无监督地学习到文本隐藏层的主题向量表达。 它支持包括TF-IDF,LSA,LDA和word2vec在内的多种主题模型算法。 支持流式训练,并提 阅读全文

posted @ 2020-03-30 23:31 潺潺水声 阅读(832) 评论(0) 推荐(0)

NLPIR使用(1)
摘要:今天研究的是nlpir的语义分词 首先 安装pynlpir库: 下面写一个测试小程序: 运行结果: 下面我们在试一下关键词提取效果: 运行结果: 从这个小程序看,分词和关键词提取效果非常好 在程序segments 加上一个参数segments = pynlpir.segment(s,pos_engl 阅读全文

posted @ 2016-10-20 01:15 潺潺水声 阅读(515) 评论(0) 推荐(0)

导航