随笔分类 - NLP
摘要:setp1: 安装jieba,pytagcloud pip install jieba apt-get install python-pygame pip install simplejson pip install pytagcloud step2:下载中文字体文件比如simhei.ttf 找到p
阅读全文
摘要:1分词 jieba.cut 方法接受三个输入参数: 需要分词的字符串;cut_all 参数用来控制是否采用全模式;HMM 参数用来控制是否使用 HMM 模型 jieba.cut_for_search 方法接受两个参数:需要分词的字符串;是否使用 HMM 模型。该方法适合用于搜索引擎构建倒排索引的分词
阅读全文
浙公网安备 33010602011771号