RAG部分的学习,再粗略过一遍

https://www.luochang.ink/dive-into-langgraph/rag/

 

里面提到官方关于RAG架构的介绍,还不错

https://docs.langchain.com/oss/python/langchain/retrieval#rag-architectures

 

https://zhuanlan.zhihu.com/p/642357544

这里讲了一些ReAct,Self-Ask,Plan-and-execute

 

https://cloud.tencent.com/developer/article/2608465

关于React的一些介绍

 

https://www.cnblogs.com/muzinan110/p/18552824

ReAct vs Plan-and-Execute:LLM Agent 模式实战对比

可以试一试在langchain1.0里还能不能跑

 

5. 选型建议与最佳实践

5.1 选择 ReAct 的场景

  1. 简单直接的任务

    • 单一目标明确
    • 步骤较少
    • 需要快速响应
  2. 实时交互场景

    • 客服对话
    • 即时查询
    • 简单计算
  3. 成本敏感场景

    • Token 预算有限
    • 需要控制 API 调用次数

5.2 选择 Plan-and-Execute 的场景

  1. 复杂多步骤任务

    • 需要任务拆分
    • 步骤间有依赖关系
    • 需要中间结果验证
  2. 需要高准确率的场景

    • 金融分析
    • 数据处理
    • 报告生成
  3. 长期规划类任务

    • 项目规划
    • 研究分析
    • 战略决策

5.3 最佳实践建议

  1. 混合使用策略

    • 根据子任务复杂度选择不同模式
    • 可以在同一系统中结合使用两种模式
  2. 性能优化技巧

    • 使用缓存机制
    • 实现并行处理
    • 优化 Prompt 模板
  3. 成本控制方法

    • 设置 Token 限制
    • 实现任务中断机制
    • 使用结果缓存
posted @ 2025-12-30 14:06  blcblc  阅读(12)  评论(0)    收藏  举报