RAGFlow - 模型类型说明 (二)

一、模型类型说明

1、Chat模型 (AI的“嘴皮子”)

  • 干啥用的:负责和你聊天对话,生成人类能看懂的回答
  • 经典模型:Llama3、Qwen、GPT、DeepSeek
  • 举个栗子 : 当你问“如何安装Ollama”,Chat模型就会像话痨同事一样,把安装步骤一条条讲给你听
  • 选型秘诀:
    • 需要“话多且准”:选参数大的模型(比如70B)
    • 电脑配置低:用7B小模型(虽然可能胡说八道)

2、Embedding模型 (文字“翻译官”)

  • 干啥用的:把文字变成一串数字(向量),方便计算机理解语义
  • 经典模型:BGE、text2vec、OpenAI的text-embedding-3-small
  • 灵魂比喻: 相当于给每句话发一个身份证号,说“春天”和“花开”的号码接近,“冰箱”和“宇宙”的号码离得远
  • 选型秘诀:
    • 中文优先:选bge-large-zh这类中文专用模型
    • 速度优先:用small版(精度会下降)

3、Rerank模型 (结果“质检员”)

  • 干啥用的:对搜索出的100条结果重新打分,把最相关的排到最前面
  • 经典模型:bge-reranker、cohere-rerank
  • 举个栗子 : 你搜“苹果”,初步结果可能包含水果、手机、电影公司。Rerank模型会说:“根据上下文,用户其实想查iPhone”,然后把手机相关结果置顶
  • 选型秘诀:
    • 精准度 vs 速度:大模型准但慢,小模型快但糙
    • 可选项少:目前主流就2-3种

4、Image2Text模型 —— 图片的“解码器”

  • 干啥用的:把图片里的文字抠出来(比如扫描版PDF/照片里的文字)
  • 经典模型:PaddleOCR、Donut、EasyOCR
  • 灵魂场景: 你上传一张表情包截图,AI能读出上面的字:“一键三连的都是帅哥美女!”
  • 选型秘诀:
    • 中文场景:优先选PaddleOCR(国产之光)
    • 复杂排版:用Donut(但吃显卡)
posted @ 2025-08-21 10:50  rslai  阅读(92)  评论(0)    收藏  举报