09 2019 档案

摘要:短文本分类,首先对文本做预处理,包括分词,去停顿词,文本向量化 1.分词:使用jieba分词,使用比较简单,jieba分词有三种模式, 精确模式:将句子最精确的分开,适合文本分析 全模式:句子中所有可以成词的词语都扫描出来,速度快,不能解决歧义 搜索引擎模式:在精确的基础上,对长词再次切分,提高召回 阅读全文
posted @ 2019-09-25 23:49 坚持就好了 阅读(1082) 评论(0) 推荐(0)