大模型 - 随笔分类 - ExplorerMan

大模型RAG实战，从被骂不靠谱到成为部门MVP，这是我的踩坑全记录【转】

摘要：大模型RAG实战，从被骂不靠谱到成为部门MVP，这是我的踩坑全记录 - 张不惑 - 博客园一切的起点是一顿臭骂上个月，我被领导叫进办公室骂了整整二十分钟。起因是这样的——我们部门负责维护一套内部知识库系统，里面沉淀了公司近五年的技术文档、故障处理手册、还有各种规范流程。问题是，这玩意儿除了当摆阅读全文

posted @ 2026-02-11 15:57 ExplorerMan 阅读(7) 评论(0) 推荐(0)

渐进式SFT内化

摘要：想象你在教一个实习生写报告：第1周：你给他看完整模板（标题格式、字体要求、段落结构）+ 10个范文第2周：你问他"记得模板吗？"，只给简化版提示+5个范文第3周：你直接说"写个市场调研报告"，不给模板，让他凭记忆写内化就是让AI的"记忆"（模型参数）记住template，而不是每次都在"便签阅读全文

posted @ 2026-01-27 21:24 ExplorerMan 阅读(5) 评论(0) 推荐(0)

[推荐]双塔模型(介绍)

摘要：个人总结其核心思想是通过两个独立的神经网络（用户塔和物品塔）分别处理用户和物品的特征，最终通过相似度计算实现匹配或召回任务。用户侧和物品侧的特征分别经过各自的深度神经网络（DNN）处理后，得到用户嵌入（user embedding）和物品嵌入（item embedding），然后通过相似度计算（阅读全文

posted @ 2026-01-16 11:43 ExplorerMan 阅读(47) 评论(0) 推荐(0)

Agno - 轻量级Python多智能体系统框架

摘要：项目概述 Agno是一个轻量级Python框架，专为构建多智能体系统(MAS)而设计。它支持开发具有不同能力级别的智能体：基础工具代理知识增强代理记忆与推理代理团队协作代理确定性工作流代理框架提供完整的开发生态，包括知识管理、工具集成、向量数据库支持和可视化Playground。核心特阅读全文

posted @ 2025-10-11 19:45 ExplorerMan 阅读(594) 评论(0) 推荐(0)

Open WebUI：打造友好且强大的自托管 AI 平台

摘要：目录摘要一、引言二、Open WebUI 的概念讲解（一）功能特性（二）技术基础三、Open WebUI 的架构设计（一）系统架构图（二）架构模块介绍四、Open WebUI 的安装与使用（一）安装方法 1. 通过 Python pip 安装 2. 通过 Docker 安装 3. 阅读全文

posted @ 2025-10-11 17:54 ExplorerMan 阅读(503) 评论(0) 推荐(0)

【gradio】使用Gradio快速开发前端界面：基础知识

摘要：使用Gradio快速开发前端界面：基础知识前言一、什么是Gradio？二、安装Gradio三、快速入门：构建一个简单的文本处理界面四、Gradio 的核心组件五、核心组件的演示六、总结前言在机器学习和深度学习项目中，模型的部署和展示往往是一个重要的环节。然而，传统的前端开发流程可能对数据科学家或算法阅读全文

posted @ 2025-10-11 17:51 ExplorerMan 阅读(498) 评论(0) 推荐(0)

文本切割方案进化概览：从“机械切割”到“智能解构”

摘要：文档分块技术已经走过了三个主要时代，目前正迈向第四个： V1.0 机械时代：方法: 固定长度分块、字符/Token分块。缺陷: 完全无视语义和逻辑，粗暴地将文本切开，导致大量上下文丢失和知识破碎。（已被业界淘汰） V2.0 结构化时代：方法: 递归字符分块 (RecursiveCharacte 阅读全文

posted @ 2025-10-11 17:44 ExplorerMan 阅读(24) 评论(0) 推荐(0)

大模型RAG的上下文压缩与过滤

摘要：一、为什么要压缩 & 过滤检索器一次拉回 top-k 篇文档，其中 80% 的 token 与问题无关 → 浪费 LLM 上下文窗口无关内容引入幻觉目标：在“送进 LLM 之前”就把无用段落/句子/ token 丢掉或压成更短的表示。二、整体两阶段流水线query│▼[1. 检索] ─► 原始文阅读全文

posted @ 2025-10-11 17:43 ExplorerMan 阅读(110) 评论(0) 推荐(0)

SemanticChunker 语义相似拆分

摘要：from langchain_experimental.text_splitter import SemanticChunker SemanticChunker 不是 LangChain 的内置组件，而是属于 langchain-experimental 包，这是一个实验性功能的扩展库，包含了一阅读全文

posted @ 2025-10-11 17:43 ExplorerMan 阅读(291) 评论(0) 推荐(0)

基于LangChain 实现 Advanced RAG-后检索优化(上)-Reranker

摘要：摘要 Advanced RAG 的后检索优化，是指在检索环节完成后、最终响应生成前，通过一系列策略与技术对检索结果进行深度处理，旨在显著提升生成内容的相关性与质量。在这些优化手段中，重排序优化（Reranker）作为核心技术之一，凭借其对检索结果的二次筛选与优先级调整能力，成为提升 RAG 系统性能阅读全文

posted @ 2025-10-11 17:28 ExplorerMan 阅读(178) 评论(0) 推荐(0)

基于LangChain 实现 Advanced RAG-后检索优化(下)-上下文压缩与过滤

摘要：摘要 Advanced RAG 的后检索优化，是指在检索环节完成后、最终响应生成前，通过一系列策略与技术对检索结果进行深度处理，旨在显著提升生成内容的相关性与质量。在这些优化手段中，上文压缩与过滤技术是提升检索结果质量的重要手段。它能巧妙筛除冗余、无关信息，萃取关键内容，为后续处理奠定优质基础。本文阅读全文

posted @ 2025-10-11 17:27 ExplorerMan 阅读(103) 评论(0) 推荐(0)

多Agent协作入门：基于A2A协议的Agent通信（中）

摘要：转：多Agent协作入门：基于A2A协议的Agent通信（中） - EdisonZhou - 博客园合集 - Agent Orchestration(7) 1.多Agent协作入门：基于A2A协议的Agent通信（中）10-09 2.多Agent协作入门：基于A2A协议的Agent通信（上）10- 阅读全文

posted @ 2025-10-11 15:28 ExplorerMan 阅读(120) 评论(0) 推荐(0)

ollama部署与open-webui

摘要：1.ollama简介 Ollama 是一款开源工具，允许用户在本地便捷地运行多种大型开源模型，如 DeepSeek、ChatGLM、Llama 等。通过 Docker Compose，我们可以快速部署 Ollama 服务，并结合其他工具（如 Dify 或 Open-WebUI）构建强大的 AI 应用阅读全文

posted @ 2025-10-11 15:27 ExplorerMan 阅读(1107) 评论(0) 推荐(0)

0基础也能看懂！从0到1手把手教你本地部署大模型Ollama

摘要：我都没有Ollama怎么跟着你的文章安装体验DeepSeek，啊哈哈，这篇博客忘记发啦，今天补上！1.ollamaOllama是一个本地运行大型语言模型（LLM）的工具，Ollama是一个开源的 LLM（大型语言模型）服务工具，用于简化在本地运行大语言模型，降低使用大语言模型的门槛，使得大模型的开发阅读全文

posted @ 2025-10-11 15:25 ExplorerMan 阅读(256) 评论(0) 推荐(0)

什么是 AutoModel

摘要：AutoModel 加载模型”是指使用 Hugging Face Transformers 库提供的 AutoModel 系列类，根据模型名称自动识别并加载对应的预训练模型结构和权重，从而无需手动指定具体模型类（如 BertModel、GPT2Model 等）。这一过程简化了模型加载流程，提升了代码阅读全文

posted @ 2025-09-22 17:23 ExplorerMan 阅读(83) 评论(0) 推荐(0)

大模型基础应用框架（ReACT\SFT\RAG）技术创新及零售业务落地应用

摘要：大模型基础应用框架（ReACT\SFT\RAG）技术创新及零售业务落地应用一、前言 2023年，大语言模型以前所未有的速度和能力改变我们对智能系统的认知，成为技术圈最被热议的话题。但“百模大战”终将走向“落地为王”，如何将大语言模型的强大能力融入实际业务、产生业务价值成为致胜关键。在零售场，大模阅读全文

posted @ 2025-07-02 17:10 ExplorerMan 阅读(145) 评论(0) 推荐(0)

多模态Embedding模型：从文本到多模态的全面选型指南！

摘要：通过将原始输入转化为固定维度的高维向量以捕捉语义信息，Embedding（嵌入）模型在构建 RAG、推荐系统，甚至自动驾驶模型训练中都发挥着极为关键的作用。近年来，OpenAI、Meta、Google、阿里、腾讯等科技巨头纷纷加大对 Embedding 模型研发的投入。以 OpenA I为例，其最新阅读全文

posted @ 2025-07-01 22:50 ExplorerMan 阅读(1477) 评论(0) 推荐(0)

rag 查询检索轮换

摘要：“RAG查询轮换”通常指在检索增强生成（Retrieval-Augmented Generation, RAG）系统中，通过动态调整检索和生成阶段的策略或数据源，以优化查询结果质量、多样性或效率的技术。以下是具体解释： 1. RAG的基本原理 RAG结合了信息检索（Retrieval）和文本生成（G 阅读全文

posted @ 2025-07-01 22:01 ExplorerMan 阅读(50) 评论(0) 推荐(0)

多模型专家组合(COE)的关键实现方法，deepseek也在用

摘要：1.概述在当前的人工智能发展中，单一模型的表现往往难以满足复杂任务的需求。为应对这些挑战，多模型协作的方法应运而生，“专家组合”（Mixture of Experts）便是其中一种有效的模型协作方法。专家组合不仅能提升模型的准确性，还能通过合理分工提升效率，提供跨领域的综合解决方案。本文将从多个角阅读全文

posted @ 2025-05-14 20:55 ExplorerMan 阅读(159) 评论(0) 推荐(0)

随笔分类 - 大模型