08 2021 档案

摘要:#jieba库 ##分词原理 Jieba分词依靠的是一个强大的中文库,确定汉字自检的关联概率,概率大的组成词组,形成了分词的结果。除了分词呢,用户还可以添加自定义的词组。 ##Jieba分词的三种模式: 1.精确模式:把文本精确的切分开,不存在冗余单词 2.全模式:把文本中所有可能的词语都扫描出来, 阅读全文
posted @ 2021-08-26 10:14 第欧根尼 阅读(154) 评论(0) 推荐(0)