2016年3月14日

使用MinHash算法计算两个集合的相似度

摘要: 集合相似度计算是一个常见的问题。例如,已知看过芈月传的人都有哪些,还知道看过琅琊榜的人都有哪些,那么想知道同时看过两者的人群占至少看过一部的人群的占比,就是求这两个集合的相似度: 集合A = 看过芈月传的人群集合B = 看过琅琊榜的人群相似度 = |A∩B| / |A∪B| = 既看过芈月传又看过琅 阅读全文

posted @ 2016-03-14 17:34 unrealwalker 阅读(6571) 评论(0) 推荐(2)

导航