摘要: 1. 介绍 "thulac4j" 是THULAC的Java 8工程化实现,具有分词速度快、准、强的特点;支持 自定义词典 繁体转简体 停用词过滤 若想在项目中使用thulac4j,可添加依赖: thulac4j支持中文分词与词性标注,使用示例如下: 模型数据较大,没有放在jar包与源码。训练模型下载 阅读全文
posted @ 2017-03-09 17:04 Treant 阅读(5688) 评论(10) 推荐(0) 编辑