文档的相似度(4)--总结
摘要:经过前三篇博客的介绍,关于文档相似度的分析已经基本结束了,下面做下总结。 此处给出一个完整的相似项发现方法: 首先找出可能的候选对相似文档集合,然后基于该集合发现真正的相似文档。必须强调的是,这种方法可能会产生伪反例,即某些相似文档对由于没有进入候选对所以最终没有被识别出来。...
阅读全文
posted @ 2017-03-19 21:16
posted @ 2017-03-19 21:16
posted @ 2017-03-19 21:02
posted @ 2017-03-18 23:34
posted @ 2017-03-15 21:18