XiaoZhengTou - 博客园

[置顶] 《60天AI学习计划启动 | 60天学习内容整理》

摘要： Day 01–05：基础环境 & 简单聊天 LLM 基础概念、OpenAI 注册与首次 API 调用 Node.js 环境、项目结构、npm 使用 Express 后端 + 前端调用，完成最简单聊天接口 SSE 流式响应，实现打字式输出整合成基础聊天机器人（消息列表 + 输入框） Day 06–1 阅读全文

posted @ 2025-12-17 10:21 XiaoZhengTou 阅读(46) 评论(0) 推荐(0)

2026年1月26日

Active Planning 和 Tools 如何对接业务需求

摘要： 🤖 AI Agent 架构实施指南 Agent = LLM + Memory + Active Planning + Tools 重点：Active Planning 和 Tools 如何对接业务需求 📋 目录核心概念四大组件详解 Active Planning 实现 Tools 工具系统阅读全文

posted @ 2026-01-26 17:42 XiaoZhengTou 阅读(2) 评论(0) 推荐(0)

17种经过验证的RAG优化技术，从基础到高级全覆盖

摘要： 🎯 RAG 高级优化策略大全 17种经过验证的RAG优化技术，从基础到高级全覆盖 📋 目录策略分类文档处理优化检索优化生成优化高级技术实施优先级综合方案 🎯 策略分类按优化阶段分类文档处理（6种）检索增强（7种）生成优化（4种） ↓ ↓ ↓ ┌────────────── 阅读全文

posted @ 2026-01-26 16:59 XiaoZhengTou 阅读(103) 评论(0) 推荐(0)

大模型优化技术实施指南

摘要： 🎯 大模型优化技术实施指南 SFT 监督微调 | RLHF 强化学习 | RAG 检索增强生成 📋 目录技术概览 RAG 检索增强生成（最容易，推荐先做） SFT 监督微调（中等难度） RLHF 强化学习（最复杂）综合应用方案 🎯 技术概览三种技术对比技术难度成本效果适用场景阅读全文

posted @ 2026-01-26 16:09 XiaoZhengTou 阅读(9) 评论(0) 推荐(0)

Ollama 多模态模型使用指南

摘要： 🎨 Ollama 多模态模型使用指南使用 Ollama 本地运行多模态模型，实现图像理解、OCR、视觉问答等功能 ✅ 好消息：Ollama 支持多模态！虽然项目文档中提到的多模态方案主要基于云端 API（SiliconFlow、OpenAI），但 Ollama 完全支持多模态模型！ 🎯 Ol 阅读全文

posted @ 2026-01-26 15:55 XiaoZhengTou 阅读(41) 评论(0) 推荐(0)

地模型性能优化指南

摘要： 🚀 本地模型性能优化指南解决 Ollama 响应慢的问题，提升推理速度到接近云端 API 的水平 📊 性能问题分析响应慢的常见原因原因症状影响程度未使用 GPU 首次响应 > 30s ⭐⭐⭐⭐⭐ 模型太大显存不足，使用 CPU ⭐⭐⭐⭐⭐ 首次加载第一次调用慢 ⭐⭐⭐ 上下文太长阅读全文

posted @ 2026-01-26 15:47 XiaoZhengTou 阅读(37) 评论(0) 推荐(0)

企业级私有化部署方案

摘要： 🏢 企业级私有化部署方案将当前基于 Dify 云服务的 AI 应用改造为完全私有化的企业级解决方案 📋 目录现状分析私有化部署架构核心组件私有化方案部署实施步骤成本与资源评估安全与合规监控与运维常见问题 1. 现状分析 1.1 当前架构依赖 ┌───────────────── 阅读全文

posted @ 2026-01-26 15:20 XiaoZhengTou 阅读(33) 评论(0) 推荐(0)

多轮对话上下文管理优化方案

摘要： 🚀 多轮对话上下文管理优化方案完整的上下文管理优化策略，包含 Token 优化、内存管理、性能提升等多个维度 📊 优化维度概览优化维度目标优先级难度 Token 优化降低 API 成本 ⭐⭐⭐⭐⭐ ⭐⭐ 内存管理提升系统性能 ⭐⭐⭐⭐ ⭐⭐ 检索优化提高相关性 ⭐⭐⭐⭐ ⭐⭐⭐ 阅读全文

posted @ 2026-01-26 14:39 XiaoZhengTou 阅读(24) 评论(0) 推荐(0)

2026年1月22日

LangChain 学习路线图

摘要： # ⚡ LangChain 学习路线图 > 🚀 **当前使命 (CURRENT MISSION)**: 从 **零基础或具备一定编程基础** 到 **掌握 LangChain 框架，能够开发基于 LLM 的应用和 Agent**。 ✨ **已为您定制专属学习路径** ## PHASE 01: 入门阅读全文

posted @ 2026-01-22 18:01 XiaoZhengTou 阅读(39) 评论(0) 推荐(0)

2026年1月21日

AI 应用工程师避坑指南

摘要： AI 应用工程师实战指南排序逻辑：项目全貌 RAG 检索增强 (核心业务) 前端与性能优化 (核心优势) Agent 智能体架构 (进阶考点) 模型选型与工程化部署 (架构决策) 多模态 SiliconFlow 实战 (亮点) LoRA 微调与训练 (硬核深挖) 质量保障与安全 (上线标准) 一阅读全文

posted @ 2026-01-21 15:13 XiaoZhengTou 阅读(40) 评论(0) 推荐(0)

2026年1月20日

AI应用工程师技术栈升级

摘要：为了覆盖 AI应用工程师的核心面试考点，我们将技术栈升级如下：升级版技术栈前端: Next.js (React) 或 Streamlit (快速Demo，但代码要写得工程化)。后端/编排: Python FastAPI (异步高性能) + LangChain (核心逻辑)。 RAG 引擎: 阅读全文

posted @ 2026-01-20 11:19 XiaoZhengTou 阅读(17) 评论(0) 推荐(0)

前端+AI的结合

公告