摘要: Day 01–05:基础环境 & 简单聊天 LLM 基础概念、OpenAI 注册与首次 API 调用 Node.js 环境、项目结构、npm 使用 Express 后端 + 前端调用,完成最简单聊天接口 SSE 流式响应,实现打字式输出 整合成基础聊天机器人(消息列表 + 输入框) Day 06–1 阅读全文
posted @ 2025-12-17 10:21 XiaoZhengTou 阅读(41) 评论(0) 推荐(0)
摘要: 🤖 AI Agent 架构实施指南 Agent = LLM + Memory + Active Planning + Tools 重点:Active Planning 和 Tools 如何对接业务需求 📋 目录 核心概念 四大组件详解 Active Planning 实现 Tools 工具系统 阅读全文
posted @ 2026-01-26 17:42 XiaoZhengTou 阅读(2) 评论(0) 推荐(0)
摘要: 🎯 RAG 高级优化策略大全 17种经过验证的RAG优化技术,从基础到高级全覆盖 📋 目录 策略分类 文档处理优化 检索优化 生成优化 高级技术 实施优先级 综合方案 🎯 策略分类 按优化阶段分类 文档处理(6种) 检索增强(7种) 生成优化(4种) ↓ ↓ ↓ ┌────────────── 阅读全文
posted @ 2026-01-26 16:59 XiaoZhengTou 阅读(71) 评论(0) 推荐(0)
摘要: 🎯 大模型优化技术实施指南 SFT 监督微调 | RLHF 强化学习 | RAG 检索增强生成 📋 目录 技术概览 RAG 检索增强生成(最容易,推荐先做) SFT 监督微调(中等难度) RLHF 强化学习(最复杂) 综合应用方案 🎯 技术概览 三种技术对比 技术 难度 成本 效果 适用场景 阅读全文
posted @ 2026-01-26 16:09 XiaoZhengTou 阅读(6) 评论(0) 推荐(0)
摘要: 🎨 Ollama 多模态模型使用指南 使用 Ollama 本地运行多模态模型,实现图像理解、OCR、视觉问答等功能 ✅ 好消息:Ollama 支持多模态! 虽然项目文档中提到的多模态方案主要基于云端 API(SiliconFlow、OpenAI),但 Ollama 完全支持多模态模型! 🎯 Ol 阅读全文
posted @ 2026-01-26 15:55 XiaoZhengTou 阅读(28) 评论(0) 推荐(0)
摘要: 🚀 本地模型性能优化指南 解决 Ollama 响应慢的问题,提升推理速度到接近云端 API 的水平 📊 性能问题分析 响应慢的常见原因 原因 症状 影响程度 未使用 GPU 首次响应 > 30s ⭐⭐⭐⭐⭐ 模型太大 显存不足,使用 CPU ⭐⭐⭐⭐⭐ 首次加载 第一次调用慢 ⭐⭐⭐ 上下文太长 阅读全文
posted @ 2026-01-26 15:47 XiaoZhengTou 阅读(28) 评论(0) 推荐(0)
摘要: 🏢 企业级私有化部署方案 将当前基于 Dify 云服务的 AI 应用改造为完全私有化的企业级解决方案 📋 目录 现状分析 私有化部署架构 核心组件私有化方案 部署实施步骤 成本与资源评估 安全与合规 监控与运维 常见问题 1. 现状分析 1.1 当前架构依赖 ┌───────────────── 阅读全文
posted @ 2026-01-26 15:20 XiaoZhengTou 阅读(23) 评论(0) 推荐(0)
摘要: 🚀 多轮对话上下文管理优化方案 完整的上下文管理优化策略,包含 Token 优化、内存管理、性能提升等多个维度 📊 优化维度概览 优化维度 目标 优先级 难度 Token 优化 降低 API 成本 ⭐⭐⭐⭐⭐ ⭐⭐ 内存管理 提升系统性能 ⭐⭐⭐⭐ ⭐⭐ 检索优化 提高相关性 ⭐⭐⭐⭐ ⭐⭐⭐ 阅读全文
posted @ 2026-01-26 14:39 XiaoZhengTou 阅读(18) 评论(0) 推荐(0)
摘要: # ⚡ LangChain 学习路线图 > 🚀 **当前使命 (CURRENT MISSION)**: 从 **零基础或具备一定编程基础** 到 **掌握 LangChain 框架,能够开发基于 LLM 的应用和 Agent**。 ✨ **已为您定制专属学习路径** ## PHASE 01: 入门 阅读全文
posted @ 2026-01-22 18:01 XiaoZhengTou 阅读(30) 评论(0) 推荐(0)
摘要: AI 应用工程师实战指南 排序逻辑: 项目全貌 RAG 检索增强 (核心业务) 前端与性能优化 (核心优势) Agent 智能体架构 (进阶考点) 模型选型与工程化部署 (架构决策) 多模态 SiliconFlow 实战 (亮点) LoRA 微调与训练 (硬核深挖) 质量保障与安全 (上线标准) 一 阅读全文
posted @ 2026-01-21 15:13 XiaoZhengTou 阅读(22) 评论(0) 推荐(0)
摘要: 为了覆盖 AI应用工程师 的核心面试考点,我们将技术栈升级如下: 升级版技术栈 前端: Next.js (React) 或 Streamlit (快速Demo,但代码要写得工程化)。 后端/编排: Python FastAPI (异步高性能) + LangChain (核心逻辑)。 RAG 引擎: 阅读全文
posted @ 2026-01-20 11:19 XiaoZhengTou 阅读(13) 评论(0) 推荐(0)