摘要: 需求: 两个建筑行业的招标网站发布的招标文档,标题可能不同,正文大部分相同,如何通过程序判断文档是否一致,从而达到去重的目的 现状: 1、没有深度学习的基础,只能回归到常规软件算法 2、范围限定在建筑行业,招标内容,那有限场景下用穷举法是没问题 3、允许一定重复率,后期可以手动或者算法优化去重 分析 阅读全文
posted @ 2019-11-19 19:18 有来有去1980 阅读(509) 评论(0) 推荐(0)