02 2016 档案

摘要:这篇文章主要讲simHash算法。这是一种LSH(Locality-Sensitive Hashing,局部敏感哈希)的简单实现。它是广泛用于数据去重的算法,可以用于相似网站、图片的检索。而且当两个样本差别并不大时,算法仍能起效。值得一提的是,该算法的时空复杂度不存在与维度有关的项,所以不会遭遇维度 阅读全文
posted @ 2016-02-17 19:53 Darksun2010 阅读(1741) 评论(0) 推荐(0)
摘要:约定:以线性表a表示二叉堆H,a以0标号。 通常,堆的删除发生在堆H顶,即a[0]的位置,但是如果想要删除其他节点呢?在维护堆性质的前提下,很难用常规的方法解决。此时可以使用二叉堆的懒惰标记。 这样操作,总时间复杂度仍与一般二叉堆相同,但是相对不平衡。 UPD 2016/2/2 15:50: 伪代码 阅读全文
posted @ 2016-02-01 12:51 Darksun2010 阅读(358) 评论(0) 推荐(0)