RAG部分的学习，再粗略过一遍

https://www.luochang.ink/dive-into-langgraph/rag/

里面提到官方关于RAG架构的介绍，还不错

https://docs.langchain.com/oss/python/langchain/retrieval#rag-architectures

https://zhuanlan.zhihu.com/p/642357544

这里讲了一些ReAct,Self-Ask,Plan-and-execute

https://cloud.tencent.com/developer/article/2608465

关于React的一些介绍

https://www.cnblogs.com/muzinan110/p/18552824

ReAct vs Plan-and-Execute：LLM Agent 模式实战对比

可以试一试在langchain1.0里还能不能跑

5. 选型建议与最佳实践

5.1 选择 ReAct 的场景

简单直接的任务
- 单一目标明确
- 步骤较少
- 需要快速响应
实时交互场景
- 客服对话
- 即时查询
- 简单计算
成本敏感场景
- Token 预算有限
- 需要控制 API 调用次数

5.2 选择 Plan-and-Execute 的场景

复杂多步骤任务
- 需要任务拆分
- 步骤间有依赖关系
- 需要中间结果验证
需要高准确率的场景
- 金融分析
- 数据处理
- 报告生成
长期规划类任务
- 项目规划
- 研究分析
- 战略决策

5.3 最佳实践建议

混合使用策略
- 根据子任务复杂度选择不同模式
- 可以在同一系统中结合使用两种模式
性能优化技巧
- 使用缓存机制
- 实现并行处理
- 优化 Prompt 模板
成本控制方法
- 设置 Token 限制
- 实现任务中断机制
- 使用结果缓存

posted @ 2025-12-30 14:06 blcblc 阅读(12) 评论(0) 收藏举报

刷新页面返回顶部