RAG部分的学习,再粗略过一遍
https://www.luochang.ink/dive-into-langgraph/rag/
里面提到官方关于RAG架构的介绍,还不错
https://docs.langchain.com/oss/python/langchain/retrieval#rag-architectures
https://zhuanlan.zhihu.com/p/642357544
这里讲了一些ReAct,Self-Ask,Plan-and-execute
https://cloud.tencent.com/developer/article/2608465
关于React的一些介绍
https://www.cnblogs.com/muzinan110/p/18552824
ReAct vs Plan-and-Execute:LLM Agent 模式实战对比
可以试一试在langchain1.0里还能不能跑
5. 选型建议与最佳实践
5.1 选择 ReAct 的场景
-
简单直接的任务
- 单一目标明确
- 步骤较少
- 需要快速响应
-
实时交互场景
- 客服对话
- 即时查询
- 简单计算
-
成本敏感场景
- Token 预算有限
- 需要控制 API 调用次数
5.2 选择 Plan-and-Execute 的场景
-
复杂多步骤任务
- 需要任务拆分
- 步骤间有依赖关系
- 需要中间结果验证
-
需要高准确率的场景
- 金融分析
- 数据处理
- 报告生成
-
长期规划类任务
- 项目规划
- 研究分析
- 战略决策
5.3 最佳实践建议
-
混合使用策略
- 根据子任务复杂度选择不同模式
- 可以在同一系统中结合使用两种模式
-
性能优化技巧
- 使用缓存机制
- 实现并行处理
- 优化 Prompt 模板
-
成本控制方法
- 设置 Token 限制
- 实现任务中断机制
- 使用结果缓存

浙公网安备 33010602011771号