随笔分类 -  NLP

摘要:setp1: 安装jieba,pytagcloud pip install jieba apt-get install python-pygame pip install simplejson pip install pytagcloud step2:下载中文字体文件比如simhei.ttf 找到p 阅读全文
posted @ 2016-03-31 11:12 小卒子0624 阅读(428) 评论(0) 推荐(0)
摘要:1分词 jieba.cut 方法接受三个输入参数: 需要分词的字符串;cut_all 参数用来控制是否采用全模式;HMM 参数用来控制是否使用 HMM 模型 jieba.cut_for_search 方法接受两个参数:需要分词的字符串;是否使用 HMM 模型。该方法适合用于搜索引擎构建倒排索引的分词 阅读全文
posted @ 2016-03-30 16:24 小卒子0624 阅读(3590) 评论(0) 推荐(0)