摘要: 人工智能领域文本分类中最基本的就是分词,分词中最基础的莫过于结巴分词。 分词,顾名思义就是把一句话划分成若干的词语,只不过如今我们是让电脑自动进行分词。 结巴中文分词支持的三种模式分别为:1.全模式:把句子中所有成词的词语都扫描出来,速度非常快,但不能消除歧义。分词结果=jieba.cut(文本名称 阅读全文
posted @ 2019-10-19 16:00 candy0000 阅读(250) 评论(0) 推荐(0)