随笔档案「2026年1月26日」：Active Planning 和 Tools 如何对接业务需求 ... - XiaoZhengTou

2026年1月26日

摘要： 🤖 AI Agent 架构实施指南 Agent = LLM + Memory + Active Planning + Tools 重点：Active Planning 和 Tools 如何对接业务需求 📋 目录核心概念四大组件详解 Active Planning 实现 Tools 工具系统阅读全文

posted @ 2026-01-26 17:42 XiaoZhengTou 阅读(2) 评论(0) 推荐(0)

17种经过验证的RAG优化技术，从基础到高级全覆盖

摘要： 🎯 RAG 高级优化策略大全 17种经过验证的RAG优化技术，从基础到高级全覆盖 📋 目录策略分类文档处理优化检索优化生成优化高级技术实施优先级综合方案 🎯 策略分类按优化阶段分类文档处理（6种）检索增强（7种）生成优化（4种） ↓ ↓ ↓ ┌────────────── 阅读全文

posted @ 2026-01-26 16:59 XiaoZhengTou 阅读(71) 评论(0) 推荐(0)

大模型优化技术实施指南

摘要： 🎯 大模型优化技术实施指南 SFT 监督微调 | RLHF 强化学习 | RAG 检索增强生成 📋 目录技术概览 RAG 检索增强生成（最容易，推荐先做） SFT 监督微调（中等难度） RLHF 强化学习（最复杂）综合应用方案 🎯 技术概览三种技术对比技术难度成本效果适用场景阅读全文

posted @ 2026-01-26 16:09 XiaoZhengTou 阅读(6) 评论(0) 推荐(0)

Ollama 多模态模型使用指南

摘要： 🎨 Ollama 多模态模型使用指南使用 Ollama 本地运行多模态模型，实现图像理解、OCR、视觉问答等功能 ✅ 好消息：Ollama 支持多模态！虽然项目文档中提到的多模态方案主要基于云端 API（SiliconFlow、OpenAI），但 Ollama 完全支持多模态模型！ 🎯 Ol 阅读全文

posted @ 2026-01-26 15:55 XiaoZhengTou 阅读(28) 评论(0) 推荐(0)

地模型性能优化指南

摘要： 🚀 本地模型性能优化指南解决 Ollama 响应慢的问题，提升推理速度到接近云端 API 的水平 📊 性能问题分析响应慢的常见原因原因症状影响程度未使用 GPU 首次响应 > 30s ⭐⭐⭐⭐⭐ 模型太大显存不足，使用 CPU ⭐⭐⭐⭐⭐ 首次加载第一次调用慢 ⭐⭐⭐ 上下文太长阅读全文

posted @ 2026-01-26 15:47 XiaoZhengTou 阅读(29) 评论(0) 推荐(0)

企业级私有化部署方案

摘要： 🏢 企业级私有化部署方案将当前基于 Dify 云服务的 AI 应用改造为完全私有化的企业级解决方案 📋 目录现状分析私有化部署架构核心组件私有化方案部署实施步骤成本与资源评估安全与合规监控与运维常见问题 1. 现状分析 1.1 当前架构依赖 ┌───────────────── 阅读全文

posted @ 2026-01-26 15:20 XiaoZhengTou 阅读(24) 评论(0) 推荐(0)

多轮对话上下文管理优化方案

摘要： 🚀 多轮对话上下文管理优化方案完整的上下文管理优化策略，包含 Token 优化、内存管理、性能提升等多个维度 📊 优化维度概览优化维度目标优先级难度 Token 优化降低 API 成本 ⭐⭐⭐⭐⭐ ⭐⭐ 内存管理提升系统性能 ⭐⭐⭐⭐ ⭐⭐ 检索优化提高相关性 ⭐⭐⭐⭐ ⭐⭐⭐ 阅读全文

posted @ 2026-01-26 14:39 XiaoZhengTou 阅读(18) 评论(0) 推荐(0)

前端+AI的结合

公告