R 文本分析

1. 分词Rwordseg介绍:

采用HMM分词,命令segmentCN

自定义词典insertWords(c("我要"))

用于识别人名segment.options(isNameRecognition = TRUE)

方案:Rwordseg分词,DocumentTermMatrix建立文档词频矩阵

 

posted on 2016-04-21 16:45  sunxs  阅读(200)  评论(0)    收藏  举报

导航