南大通用GBase 8c数据库+DeepSeek重新定义本地知识库搭建(之三)
构建RAG实例:实现知识的高效检索与生成
准备语料数据
以 GBase 部分语料数据作为私域知识,部分内容如下:

语料处理、嵌入、导入

执行完成后,GBase 8c数据库中表结构及数据如下:


查询检索
仅使用DeepSeek进行检索:

回答内容如下:

使用GBase 8c V6 + DeepSeek进行检索:
首先将问题转换为向量,然后在GBase 8c向量知识库中进行检索,将检索的结果作为上下文,并为大模型制定PROMPT,最后进行提问:

回答内容如下:

可见,使用 DeepSeek 结合 GBase 8c 搭建的RAG 应用,不仅能借助 DeepSeek 强大的文本生成能力和精准的文本嵌入功能,还能依GBase 8c 出色的向量数据库高效存储和快速检索向量数据,从而显著提升答案的准确性、可靠性,有效避免大语言模型的幻觉问题,为企业提供更优质的本地化知识服务。
总 结
基于ollama,我们成功利用GBase 8c和DeepSeek从零搭建起了简易的 RAG 应用,获取到了所需的知识数据。在这个过程中,我们对 RAG 技术和GBase 8c向量数据库有了更深入的理解,也切实体会到了它们在解决 LLM 实际应用问题上的作用。这个简易应用只是一个开端,读者可以依据自身需求对相关环节进行灵活调整和优化,以更好地满足不同场景的需要。
                    
                
                
            
        
浙公网安备 33010602011771号