15天学会AI应用开发(十)把文本嵌入模型换成国产模型
一、all-MiniLM-L6-v2的缺点
虽然all-MiniLM-L6-v2的优点很多,比如下列几点:
1、体积极小:几十 MB,随便本地离线下载
2、速度超快:CPU 就能跑,不用显卡
3、通用好用:英文很强,中文也能用(日常 RAG 足够)
4、适配所有向量库:FAISS、Chroma、Milvus 全都兼容
但是all-MiniLM-L6-v2的缺点也很明显,就是它对中文的理解能力一般,有时会出现一些似是而非的错误。
比如之前的文章《15天学会AI应用开发(八)使用向量数据库实现RAG功能》,运行Python测试代码时,如果输入的问题是“RAG是什么”,输出日志结果如下:
然而原始的知识库是这样的:
可见问题“RAG是什么”的正确答案是第二条知识“RAG代表检索增强生成,通过检索外部知识提升大模型回答准确性。”,但all-MiniLM-L6-v2返回的答案却是最后一条知识“RAG让大模型能引用外部知识,避免胡说八道。”,说明all-MiniLM-L6-v2对中文的支持不够精准。
对于专业中文的RAG来说,更好的办法是换成国产的文本嵌入模型,比如BGE-small、BGE-base、Qwen-Embedding等等。
二、下载中文嵌入模型BGE-small
BGE-small的模型页面为 https://modelscope.cn/models/BAAI/bge-small-zh-v1.5 ,模型文件大小为192.25MB。
在下载离线大模型前,要先在命令行执行下面的pip安装命令:
接着命令行通过cd命令进入Python工程的所在目录,再执行下面的模型下载命令:
上面下载命令的“--model”参数表示离线大模型为“BAAI/bge-small-zh-v1.5”,而“--local_dir”参数表示离线大模型的本地保存目录。
下载完毕,即可在Python工程的目录下方找到bge-small-zh-v1.5文件夹,里面保存的便是BGE-small的具体模型文件。
三、结合BGE-small与FAISS实现RAG
接下来演示如何使用BGE-small与FAISS实现RAG检索功能。在编写Python代码前,要先在命令行执行下面的pip安装命令:
然后编写下面的Python检索测试代码,与之前教程的代码相比,仅仅把all-MiniLM-L6-v2改成了bge-small-zh-v1.5:
运行上面的Python代码,根据提示先输入问题“RAG是什么?”,再输入问题“RAG有哪些作用?”,输出日志结果如下:
可见在回答问题“RAG是什么?”的时候,BGE-small正确返回了第二条知识“RAG代表检索增强生成,通过检索外部知识提升大模型回答准确性。”。
在回答问题“RAG有哪些作用?”的时候,BGE-small也正确返回了最后一条知识“RAG让大模型能引用外部知识,避免胡说八道。”
由此说明,中文嵌入模型确实比国外的all-MiniLM-L6-v2拥有更准确的中文检索结果。
本系列的AI应用开发文章目录为《
浙公网安备 33010602011771号