余弦相似度算法

计算两个文本的相似度

我是 大笨蛋

我是 大聪明

获取分词结果  去掉停用词

大 笨蛋 聪明

[1 1 0]

[1 0 1]

 

1读取文件停用词   很多开源库

 

posted @ 2023-03-20 22:26  郎小乐  阅读(28)  评论(0)    收藏  举报