随笔分类 -  自然语言处理

上一页 1 2
Python 结巴分词(1)分词
摘要:利用结巴分词来进行词频的统计,并输出到文件中。 结巴分词github地址:结巴分词 结巴分词的特点: 支持三种分词模式: 精确模式,试图将句子最精确地切开,适合文本分析; 全模式,把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧义; 搜索引擎模式,在精确模式的基础上,对长词再次切 阅读全文
posted @ 2016-07-18 13:47 细雨微光 阅读(12521) 评论(0) 推荐(0)

上一页 1 2