随笔分类 -  算法

Algorithm
摘要:近似近邻检索ANNS Approximate Nearest Neighbor Search (ANNS) 工业界拥有超大规模的数据,往往要求满足低延迟、低成本的向量检索需求,全量计算的精确近邻检索方式难以应用。 近年来各种向量检索算法层出不穷,但是依然面临很多挑战。 检索效果大致对比:HNSW>N 阅读全文
posted @ 2022-08-12 20:34 康行天下 阅读(1958) 评论(0) 推荐(0)
摘要:公式推导系列 "线性回归" : 最小二乘, normal equation "逻辑回归" : 最大似然损失函数 "SVM" : 转换为对偶问题,软间隔,核函数,SMO "EM" : 隐变量的后验概率函数(Q函数,最大化下界)与最大似然估计交替优化 "损失函数" : logistic, softmax 阅读全文
posted @ 2018-07-31 12:19 康行天下 阅读(1551) 评论(0) 推荐(0)
摘要:快排 基本实现: 两侧向中间靠拢的 partition 版本: 优先级队列 基于大顶堆可实现优先级队列. 主要有以下操作: peek: 返回最大元素, 返回堆顶元素即可 poll/extract max: 移除并返回最大元素, 将堆顶元素与末尾元素交换, 重新maxHeapify set/incre 阅读全文
posted @ 2018-07-30 17:32 康行天下 阅读(405) 评论(0) 推荐(0)
摘要:本文介绍了非极大值抑制NMS 在目标检测中的应用,并介绍了NMS的改进算法Soft-NMS. 阅读全文
posted @ 2017-08-26 15:25 康行天下 阅读(211532) 评论(32) 推荐(22)
摘要:使用普通集合来判断一个元素是否已存在于集合中,需要占用比较大的空间。而使用Bloom Filter 可有效节省空间。 Bloom Filter 以较少的内存占用及较小的误判率达到判断元素是否存已经加入集合中的目的。Bloom Filter是一种空间效率很高的随机数据结构,可以被看作是对位图的扩展. 阅读全文
posted @ 2017-06-26 11:17 康行天下 阅读(374) 评论(0) 推荐(0)
摘要:最大流 最大流在货物运输,设施选址问题中可能被用到. G=(V,E)是一个连通的有向图,满足以下限制: 容量限制:每条边(u,v)有容量限制c,且不存在反向平行的边(v,u). 流量守恒:流入一个点的等于流出改点的流量. :给定一个流网络,一个源结点,一个汇点,找出从源结点可以流出的最大的流. 实际 阅读全文
posted @ 2017-04-10 11:09 康行天下 阅读(2199) 评论(0) 推荐(0)