摘要: 做词云可视化的时候,一般都用一个库叫jieba,它是用来分词的。 Jieba库在安装时,会附带一个词库,这个词库中包含了日常汉语的词语和词性。在分词时,Jieba库会先基于词库对文本进行匹配,生成文本中的汉字最有可能形成的词。然后将这些词组成一个DAG,用动态规划算法来查找最大的概率路径,尽可能不将 阅读全文
posted @ 2021-11-23 15:23 、一叶孤城 阅读(260) 评论(0) 推荐(0)