摘要: #一、github链接 #二、代码原理 (在最开始的时候选择了python自带库中的文本相似度比对函数,后来由于乱序文本的输出未能达到我的预期,就换了其他方法) 1.读入文本并进行文本处理,包括去标点,jieba分词,其中jieba的内容原理是加载字典, 生成trie树,给定待分词的句子, 使用正则 阅读全文
posted @ 2020-09-17 13:33 Jitorun 阅读(191) 评论(0) 推荐(0) 编辑