摘要: github链接 一、计算模块接口的设计与实现过程 思路: 读取两份文件,将两个文件存入字符串中,利用jieba分词,分词编号,根据词袋模型统计形成每个词在文中出现的次数向量,进行余弦相似度计算,得到结果。 流程图: 有关知识的简单记录: 1、运用jieba库分词: jieba分词依靠中文词库,确定 阅读全文
posted @ 2020-09-17 21:56 牛奶倒入锅 阅读(173) 评论(0) 推荐(0)