向量数据库的理解
记录一下从0开始理解的向量数据库的概念。
1、首先是RAG的概念
向量数据库并不是只在RAG中有。但是RAG中的应用场景比较典型,而且AI也比较火,RAG在其中有应用。
RAG,就是检索增强生成。
比如把一个文字,在无数的维度上进行量化。这样就生成了一个向量。
向量之间,可以通过算法,判断它们的距离,距离近的,相关度就是高的。可以提供给大模型进行计算。
2、向量数据库
向量数据库就是干这个用的,用于保存向量,检索的时候,可以根据向量的相关度,或者距离把相关文本,或者材料提供给用户。比如大模型。
3、PG
在PG中使用vector这个类型,来保存向量。也提供了常用的算法,还计算向量的距离。
4、其它数据库
在oracle的最新版本,也提供类似的功能,但是技术系统相关封闭。其它传统数据库不提供相关的功能。mysql/mssql都没有。
另外,市场上是有专门的向量数据库的。PG在这一方面,跟专业的向量数据库的区别在于,可以保存的记录数和性能。
也就是说,PG解决了能不能用的问题,但在极端情况下,需要更专业的数据库。
在预算不足,场景不是很明确的性情下,仍然是个不错的选择,或者说过度选择。
浙公网安备 33010602011771号