1. 分词Rwordseg介绍:
采用HMM分词,命令segmentCN
自定义词典insertWords(c("我要"))
用于识别人名segment.options(isNameRecognition = TRUE)
方案:Rwordseg分词,DocumentTermMatrix建立文档词频矩阵
posted on 2016-04-21 16:45 sunxs 阅读(200) 评论(0) 收藏 举报