南大通用GBase 8c数据库+DeepSeek重新定义本地知识库搭建(之三)

构建RAG实例:实现知识的高效检索与生成

准备语料数据

以 GBase 部分语料数据作为私域知识,部分内容如下:

语料处理、嵌入、导入

执行完成后,GBase 8c数据库中表结构及数据如下:

查询检索

仅使用DeepSeek进行检索:

回答内容如下:

使用GBase 8c V6 + DeepSeek进行检索:

首先将问题转换为向量,然后在GBase 8c向量知识库中进行检索,将检索的结果作为上下文,并为大模型制定PROMPT,最后进行提问:

回答内容如下:

可见,使用 DeepSeek 结合 GBase 8c 搭建的RAG 应用,不仅能借助 DeepSeek 强大的文本生成能力和精准的文本嵌入功能,还能依GBase 8c 出色的向量数据库高效存储和快速检索向量数据,从而显著提升答案的准确性、可靠性,有效避免大语言模型的幻觉问题,为企业提供更优质的本地化知识服务。

总 结

基于ollama,我们成功利用GBase 8c和DeepSeek从零搭建起了简易的 RAG 应用,获取到了所需的知识数据。在这个过程中,我们对 RAG 技术和GBase 8c向量数据库有了更深入的理解,也切实体会到了它们在解决 LLM 实际应用问题上的作用。这个简易应用只是一个开端,读者可以依据自身需求对相关环节进行灵活调整和优化,以更好地满足不同场景的需要。

posted @ 2025-02-17 13:15  GBASE南大通用  阅读(12)  评论(0)    收藏  举报