2026年1月27日

渐进式SFT内化

摘要: 想象你在教一个实习生写报告: 第1周:你给他看完整模板(标题格式、字体要求、段落结构)+ 10个范文 第2周:你问他"记得模板吗?",只给简化版提示+5个范文 第3周:你直接说"写个市场调研报告",不给模板,让他凭记忆写 内化就是让AI的"记忆"(模型参数)记住template,而不是每次都在"便签 阅读全文

posted @ 2026-01-27 21:24 ExplorerMan 阅读(3) 评论(0) 推荐(0)

2026年1月16日

[推荐]双塔模型(介绍)

摘要: 个人总结 其核心思想是通过两个独立的神经网络(用户塔和物品塔)分别处理用户和物品的特征,最终通过相似度计算实现匹配或召回任务。 用户侧和物品侧的特征分别经过各自的深度神经网络(DNN)处理后,得到用户嵌入(user embedding)和物品嵌入(item embedding),然后通过相似度计算( 阅读全文

posted @ 2026-01-16 11:43 ExplorerMan 阅读(16) 评论(0) 推荐(0)

2025年10月11日

Agno - 轻量级Python多智能体系统框架

摘要: 项目概述 Agno是一个轻量级Python框架,专为构建多智能体系统(MAS)而设计。它支持开发具有不同能力级别的智能体: 基础工具代理 知识增强代理 记忆与推理代理 团队协作代理 确定性工作流代理 框架提供完整的开发生态,包括知识管理、工具集成、向量数据库支持和可视化Playground。 核心特 阅读全文

posted @ 2025-10-11 19:45 ExplorerMan 阅读(451) 评论(0) 推荐(0)

Open WebUI:打造友好且强大的自托管 AI 平台

摘要: 目录 摘要 一、引言 二、Open WebUI 的概念讲解 (一)功能特性 (二)技术基础 三、Open WebUI 的架构设计 (一)系统架构图 (二)架构模块介绍 四、Open WebUI 的安装与使用 (一)安装方法 1. 通过 Python pip 安装 2. 通过 Docker 安装 3. 阅读全文

posted @ 2025-10-11 17:54 ExplorerMan 阅读(468) 评论(0) 推荐(0)

【gradio】使用Gradio快速开发前端界面:基础知识

摘要: 使用Gradio快速开发前端界面:基础知识前言一、什么是Gradio?二、安装Gradio三、快速入门:构建一个简单的文本处理界面四、Gradio 的核心组件五、核心组件的演示六、总结前言在机器学习和深度学习项目中,模型的部署和展示往往是一个重要的环节。然而,传统的前端开发流程可能对数据科学家或算法 阅读全文

posted @ 2025-10-11 17:51 ExplorerMan 阅读(380) 评论(0) 推荐(0)

文本切割方案进化概览:从“机械切割”到“智能解构”

摘要: 文档分块技术已经走过了三个主要时代,目前正迈向第四个: V1.0 机械时代: 方法: 固定长度分块、字符/Token分块。 缺陷: 完全无视语义和逻辑,粗暴地将文本切开,导致大量上下文丢失和知识破碎。(已被业界淘汰) V2.0 结构化时代: 方法: 递归字符分块 (RecursiveCharacte 阅读全文

posted @ 2025-10-11 17:44 ExplorerMan 阅读(23) 评论(0) 推荐(0)

大模型RAG的上下文压缩与过滤

摘要: 一、为什么要压缩 & 过滤检索器一次拉回 top-k 篇文档,其中 80% 的 token 与问题无关 → 浪费 LLM 上下文窗口 无关内容引入幻觉目标:在“送进 LLM 之前”就把无用段落/句子/ token 丢掉或压成更短的表示。 二、整体两阶段流水线query│▼[1. 检索] ─► 原始文 阅读全文

posted @ 2025-10-11 17:43 ExplorerMan 阅读(86) 评论(0) 推荐(0)

SemanticChunker 语义相似拆分

摘要: from langchain_experimental.text_splitter import SemanticChunker SemanticChunker 不是 LangChain 的内置组件,而是属于 langchain-experimental 包,这是一个 实验性功能 的扩展库,包含了一 阅读全文

posted @ 2025-10-11 17:43 ExplorerMan 阅读(216) 评论(0) 推荐(0)

基于LangChain 实现 Advanced RAG-后检索优化(上)-Reranker

摘要: 摘要 Advanced RAG 的后检索优化,是指在检索环节完成后、最终响应生成前,通过一系列策略与技术对检索结果进行深度处理,旨在显著提升生成内容的相关性与质量。在这些优化手段中,重排序优化(Reranker)作为核心技术之一,凭借其对检索结果的二次筛选与优先级调整能力,成为提升 RAG 系统性能 阅读全文

posted @ 2025-10-11 17:28 ExplorerMan 阅读(102) 评论(0) 推荐(0)

基于LangChain 实现 Advanced RAG-后检索优化(下)-上下文压缩与过滤

摘要: 摘要 Advanced RAG 的后检索优化,是指在检索环节完成后、最终响应生成前,通过一系列策略与技术对检索结果进行深度处理,旨在显著提升生成内容的相关性与质量。在这些优化手段中,上文压缩与过滤技术是提升检索结果质量的重要手段。它能巧妙筛除冗余、无关信息,萃取关键内容,为后续处理奠定优质基础。本文 阅读全文

posted @ 2025-10-11 17:27 ExplorerMan 阅读(81) 评论(0) 推荐(0)

导航