随笔分类 -  AGI

摘要:问题定义 对于一个给定的query,从数据库中召回所有dist<thres的docs。 问题求解 Naive的方法需要O(n)的时间复杂度,LSH只需要O(1)即可实现。 具体来说分为三步: 1)抽取Embedding(LSH中称为Shingling) 2)降维(LSH常用MinHash) 3)LS 阅读全文
posted @ 2022-12-12 20:08 hyserendipity 阅读(134) 评论(0) 推荐(0)