RAGFlow - 第一个知识库&聊天（一）

一、注册 RAGFlow 账号

如下图点击 “注册” 根据提示注册账号即可。

二、配置模型

在使用知识库之前必须要先配置模型，如下图

1、添加 DeepSeek 模型

按下图添加 DeepSeek api key 即可。

2、添加 Ollama 模型

A）配置允许网络访问

B）添加 Ollama 模型

　　其中：

　　　　模型类型：根据你要添加的模型类型选择 chat、embedding、rerank、image2text

　　　　模型名称: 就是执行 ollama list 命令后显示的第一列的名称

　　　　基础 Url：就是安装 ollama 机器的 ip 地址

3、添加 Ollama Embedding 模型

在添加知识库前需要有 Embedding 模型，用来做文档切分，以便存入向量数据库。

A）bge-m3:latest

RAGFlow 默认模型 bge-m3:latest，参见文档安装 ollama 及安装模型（https://www.cnblogs.com/rslai/p/19045196）

或者执行命令 ollama pull bge-m3:latest 在 ollama 中安装模型

B）bge-large-zh

号称最好用的中文 Embedding 模型（我试用下来跟 bge-m3:latest 没啥区别）。参见文档 ollama 安装 HuggingFace 上的模型（https://www.cnblogs.com/rslai/p/19045841）

4、设置默认模型

如下图可以设置默认模型，这样在后续操作时不用每次都选。

5、模型类型说明

A）Chat模型 (AI的“嘴皮子”)

干啥用的：负责和你聊天对话，生成人类能看懂的回答
经典模型：Llama3、Qwen、GPT、DeepSeek
举个栗子：当你问“如何安装Ollama”，Chat模型就会像话痨同事一样，把安装步骤一条条讲给你听
选型秘诀：
- 需要“话多且准”：选参数大的模型（比如70B）
- 电脑配置低：用7B小模型（虽然可能胡说八道）

B）Embedding模型 (文字“翻译官”)

干啥用的：把文字变成一串数字（向量），方便计算机理解语义
经典模型：BGE、text2vec、OpenAI的text-embedding-3-small
灵魂比喻：相当于给每句话发一个身份证号，说“春天”和“花开”的号码接近，“冰箱”和“宇宙”的号码离得远
选型秘诀：
- 中文优先：选bge-large-zh这类中文专用模型
- 速度优先：用small版（精度会下降）

C）Rerank模型 (结果“质检员”)

干啥用的：对搜索出的100条结果重新打分，把最相关的排到最前面
经典模型：bge-reranker、cohere-rerank
举个栗子：你搜“苹果”，初步结果可能包含水果、手机、电影公司。Rerank模型会说：“根据上下文，用户其实想查iPhone”，然后把手机相关结果置顶
选型秘诀：
- 精准度 vs 速度：大模型准但慢，小模型快但糙
- 可选项少：目前主流就2-3种

D）Image2Text模型 —— 图片的“解码器”

干啥用的：把图片里的文字抠出来（比如扫描版PDF/照片里的文字）
经典模型：PaddleOCR、Donut、EasyOCR
灵魂场景：你上传一张表情包截图，AI能读出上面的字：“一键三连的都是帅哥美女！”
选型秘诀：
- 中文场景：优先选PaddleOCR（国产之光）
- 复杂排版：用Donut（但吃显卡）

三、添加知识库

1、创建知识库

输入名称后即可创建知识库

2、配置切片方法

默认 General，它支持的格式较多但需要通过分段标识来分块。

选 Q&A 按照问答对的方式添加知识库。注意上传 excel 的时候第一列是问题，第二列是回答，不要要写列头。

3、修改 EMBEDDING_BATCH_SIZE

由于我的电脑配置较差，会在知识库解析时报如下图错，你可以先执行步骤4 当报错时在来处理。

进入 docker 目录，打开 .env 文件，将 EMBEDDING_BATCH_SIZE 改为 2或者4（由于我电脑太差只能改为1）

执行如下命令重启 RAGFlow

docker compose -f docker-compose.yml up -d

4、上传知识库文件并解析

刚上传，如下图，点击运行开始解析

上传成功后如下图。

可以点击名称，查看这个文件切分的内容。

也可以在文件管理中，查看那个知识库中上传了哪些文档。

5、检索测试

可以在此测试查询的结果，如下图。

四、创建聊天

知识库：可以选择多个

找回次数可以选成 3

chat 模型可以选择 deepseek

按下图操作即可测试回答效果。

参考文档：

　　https://zhuanlan.zhihu.com/p/1908166815730869455

posted @ 2025-08-19 14:18 rslai 阅读(888) 评论(0) 收藏举报

刷新页面返回顶部

赖荣生

RAGFlow - 第一个知识库&聊天（一）

二、配置模型

1、添加 DeepSeek 模型

2、添加 Ollama 模型