摘要: 1.Shingling+MinHash 2. Learning to Hash 1.Introduction 很多的网页挖掘问题都可以表述为寻找相似集合: 1. 论文查重; 2. 推荐系统; 2.Finding Similar Documents 流程: 2.1 Shingles k shingle 阅读全文
posted @ 2019-03-23 12:13 小雨的编程时光 阅读(313) 评论(0) 推荐(0)