摘要: 向量动态量化 本文介绍向量检索服务DashVector动态量化功能和作用。 背景介绍 量化(Quantization)是向量检索技术中一种常用的优化方法,通过一定程度的精度(召回率)损失,来换取性能的大幅度提升,以及内存占用(索引文件大小)大幅度降低。 向量检索服务DashVector支持向量的动态量化,用户仅需 阅读全文
posted @ 2024-11-14 11:34 DashVector 阅读(55) 评论(0) 推荐(0)
摘要: 分区Partition 理解Partition 向量检索服务DashVector的Collection具有分区(Partition)的能力,同一个Collection下的Doc可通过不同的Partition进行物理和逻辑上的分区。各种Doc操作(如插入Doc、检索Doc等。若指定Partition,则该操作将限定在该指定的 阅读全文
posted @ 2024-11-14 11:32 DashVector 阅读(58) 评论(0) 推荐(0)
摘要: 分区 Partition 理解Partition 向量检索服务DashVector的Collection具有分区(Partition)的能力,同一个Collection下的Doc可通过不同的Partition进行物理和逻辑上的分区。各种Doc操作(如插入Doc、检索Doc等。若指定Partition,则该操作将限定在该指定的 阅读全文
posted @ 2024-11-14 11:30 DashVector 阅读(11) 评论(0) 推荐(0)
摘要: 关键词感知检索 本文主要介绍带关键词感知能力的向量检索服务的优势、应用示例以及Sparse Vector生成工具。 背景介绍 关键词检索及其局限 在信息检索领域,"传统"方式是通过关键词进行信息检索,其大致过程为: 对原始语料(如网页)进行关键词抽取。 建立关键词和原始语料的映射关系,常见的方法有倒排索引、TF-I 阅读全文
posted @ 2024-11-14 11:23 DashVector 阅读(163) 评论(0) 推荐(0)