摘要: 太久不编程,从编程小学生退化回编程婴儿。以前学习到的一些文本挖掘的理论也忘记了。 问题:两边公司名的写法可能不同,直接用相似度计算,也不太行。因为最简单的相似度,是按字母算,不太对,准确度不高。复杂一点的算法,要考虑词频,公司名本身就没有几个单词,计算词频没什么意义。(个人意见) 目前思路:把标点符 阅读全文
posted @ 2020-11-15 00:31 haolemao 阅读(194) 评论(0) 推荐(0) 编辑