随笔分类 -  大模型

1 2 3 4 5 ··· 7 下一页

Agno - 轻量级Python多智能体系统框架
摘要:项目概述 Agno是一个轻量级Python框架,专为构建多智能体系统(MAS)而设计。它支持开发具有不同能力级别的智能体: 基础工具代理 知识增强代理 记忆与推理代理 团队协作代理 确定性工作流代理 框架提供完整的开发生态,包括知识管理、工具集成、向量数据库支持和可视化Playground。 核心特 阅读全文

posted @ 2025-10-11 19:45 ExplorerMan 阅读(94) 评论(0) 推荐(0)

Open WebUI:打造友好且强大的自托管 AI 平台
摘要:目录 摘要 一、引言 二、Open WebUI 的概念讲解 (一)功能特性 (二)技术基础 三、Open WebUI 的架构设计 (一)系统架构图 (二)架构模块介绍 四、Open WebUI 的安装与使用 (一)安装方法 1. 通过 Python pip 安装 2. 通过 Docker 安装 3. 阅读全文

posted @ 2025-10-11 17:54 ExplorerMan 阅读(55) 评论(0) 推荐(0)

【gradio】使用Gradio快速开发前端界面:基础知识
摘要:使用Gradio快速开发前端界面:基础知识前言一、什么是Gradio?二、安装Gradio三、快速入门:构建一个简单的文本处理界面四、Gradio 的核心组件五、核心组件的演示六、总结前言在机器学习和深度学习项目中,模型的部署和展示往往是一个重要的环节。然而,传统的前端开发流程可能对数据科学家或算法 阅读全文

posted @ 2025-10-11 17:51 ExplorerMan 阅读(42) 评论(0) 推荐(0)

文本切割方案进化概览:从“机械切割”到“智能解构”
摘要:文档分块技术已经走过了三个主要时代,目前正迈向第四个: V1.0 机械时代: 方法: 固定长度分块、字符/Token分块。 缺陷: 完全无视语义和逻辑,粗暴地将文本切开,导致大量上下文丢失和知识破碎。(已被业界淘汰) V2.0 结构化时代: 方法: 递归字符分块 (RecursiveCharacte 阅读全文

posted @ 2025-10-11 17:44 ExplorerMan 阅读(12) 评论(0) 推荐(0)

大模型RAG的上下文压缩与过滤
摘要:一、为什么要压缩 & 过滤检索器一次拉回 top-k 篇文档,其中 80% 的 token 与问题无关 → 浪费 LLM 上下文窗口 无关内容引入幻觉目标:在“送进 LLM 之前”就把无用段落/句子/ token 丢掉或压成更短的表示。 二、整体两阶段流水线query│▼[1. 检索] ─► 原始文 阅读全文

posted @ 2025-10-11 17:43 ExplorerMan 阅读(26) 评论(0) 推荐(0)

SemanticChunker 语义相似拆分
摘要:from langchain_experimental.text_splitter import SemanticChunker SemanticChunker 不是 LangChain 的内置组件,而是属于 langchain-experimental 包,这是一个 实验性功能 的扩展库,包含了一 阅读全文

posted @ 2025-10-11 17:43 ExplorerMan 阅读(57) 评论(0) 推荐(0)

基于LangChain 实现 Advanced RAG-后检索优化(上)-Reranker
摘要:摘要 Advanced RAG 的后检索优化,是指在检索环节完成后、最终响应生成前,通过一系列策略与技术对检索结果进行深度处理,旨在显著提升生成内容的相关性与质量。在这些优化手段中,重排序优化(Reranker)作为核心技术之一,凭借其对检索结果的二次筛选与优先级调整能力,成为提升 RAG 系统性能 阅读全文

posted @ 2025-10-11 17:28 ExplorerMan 阅读(37) 评论(0) 推荐(0)

基于LangChain 实现 Advanced RAG-后检索优化(下)-上下文压缩与过滤
摘要:摘要 Advanced RAG 的后检索优化,是指在检索环节完成后、最终响应生成前,通过一系列策略与技术对检索结果进行深度处理,旨在显著提升生成内容的相关性与质量。在这些优化手段中,上文压缩与过滤技术是提升检索结果质量的重要手段。它能巧妙筛除冗余、无关信息,萃取关键内容,为后续处理奠定优质基础。本文 阅读全文

posted @ 2025-10-11 17:27 ExplorerMan 阅读(28) 评论(0) 推荐(0)

多Agent协作入门:基于A2A协议的Agent通信(中)
摘要:转:多Agent协作入门:基于A2A协议的Agent通信(中) - EdisonZhou - 博客园 合集 - Agent Orchestration(7) 1.多Agent协作入门:基于A2A协议的Agent通信(中)10-09 2.多Agent协作入门:基于A2A协议的Agent通信(上)10- 阅读全文

posted @ 2025-10-11 15:28 ExplorerMan 阅读(26) 评论(0) 推荐(0)

ollama部署与open-webui
摘要:1.ollama简介 Ollama 是一款开源工具,允许用户在本地便捷地运行多种大型开源模型,如 DeepSeek、ChatGLM、Llama 等。通过 Docker Compose,我们可以快速部署 Ollama 服务,并结合其他工具(如 Dify 或 Open-WebUI)构建强大的 AI 应用 阅读全文

posted @ 2025-10-11 15:27 ExplorerMan 阅读(154) 评论(0) 推荐(0)

0基础也能看懂!从0到1手把手教你本地部署大模型Ollama
摘要:我都没有Ollama怎么跟着你的文章安装体验DeepSeek,啊哈哈,这篇博客忘记发啦,今天补上!1.ollamaOllama是一个本地运行大型语言模型(LLM)的工具,Ollama是一个开源的 LLM(大型语言模型)服务工具,用于简化在本地运行大语言模型,降低使用大语言模型的门槛,使得大模型的开发 阅读全文

posted @ 2025-10-11 15:25 ExplorerMan 阅读(109) 评论(0) 推荐(0)

什么是 AutoModel
摘要:AutoModel 加载模型”是指使用 Hugging Face Transformers 库提供的 AutoModel 系列类,根据模型名称自动识别并加载对应的预训练模型结构和权重,从而无需手动指定具体模型类(如 BertModel、GPT2Model 等)。这一过程简化了模型加载流程,提升了代码 阅读全文

posted @ 2025-09-22 17:23 ExplorerMan 阅读(40) 评论(0) 推荐(0)

大模型基础应用框架(ReACT\SFT\RAG)技术创新及零售业务落地应用
摘要:大模型基础应用框架(ReACT\SFT\RAG)技术创新及零售业务落地应用 一、前言 2023年,大语言模型以前所未有的速度和能力改变我们对智能系统的认知,成为技术圈最被热议的话题。但“百模大战”终将走向“落地为王”,如何将大语言模型的强大能力融入实际业务、产生业务价值成为致胜关键。 在零售场,大模 阅读全文

posted @ 2025-07-02 17:10 ExplorerMan 阅读(88) 评论(0) 推荐(0)

多模态Embedding模型:从文本到多模态的全面选型指南!
摘要:通过将原始输入转化为固定维度的高维向量以捕捉语义信息,Embedding(嵌入)模型在构建 RAG、推荐系统,甚至自动驾驶模型训练中都发挥着极为关键的作用。近年来,OpenAI、Meta、Google、阿里、腾讯等科技巨头纷纷加大对 Embedding 模型研发的投入。以 OpenA I为例,其最新 阅读全文

posted @ 2025-07-01 22:50 ExplorerMan 阅读(819) 评论(0) 推荐(0)

rag 查询检索轮换
摘要:“RAG查询轮换”通常指在检索增强生成(Retrieval-Augmented Generation, RAG)系统中,通过动态调整检索和生成阶段的策略或数据源,以优化查询结果质量、多样性或效率的技术。以下是具体解释: 1. RAG的基本原理 RAG结合了信息检索(Retrieval)和文本生成(G 阅读全文

posted @ 2025-07-01 22:01 ExplorerMan 阅读(33) 评论(0) 推荐(0)

多模型专家组合(COE)的关键实现方法,deepseek也在用
摘要:1.概述 在当前的人工智能发展中,单一模型的表现往往难以满足复杂任务的需求。为应对这些挑战,多模型协作的方法应运而生,“专家组合”(Mixture of Experts)便是其中一种有效的模型协作方法。专家组合不仅能提升模型的准确性,还能通过合理分工提升效率,提供跨领域的综合解决方案。本文将从多个角 阅读全文

posted @ 2025-05-14 20:55 ExplorerMan 阅读(128) 评论(0) 推荐(0)

超越传统标注方法:doccano平台提供智能化数据标注解决方案
摘要:目录前言一、doccano的介绍、安装1-1、doccano的介绍1-2、doccano的安装、初始化配置二、序列标注任务2-1、登录2-2、创建任务2-3、数据上传2-4、添加标签2-5、任务标注2-6、数据导出总结前言Doccano是一种用于文本标注的开源工具,旨在简化和加速标注任务的进行。它提 阅读全文

posted @ 2025-04-27 17:23 ExplorerMan 阅读(364) 评论(0) 推荐(0)

mcp server Prompts client 具体怎么使用呢
摘要:在MCP(Model Context Protocol)架构中,Prompts(提示)是通过MCP Client与MCP Server交互来使用的。Prompts主要用于引导LLM(大型语言模型)生成特定类型的内容或回答。以下是具体使用Prompts的步骤和流程: 1. 配置MCP Client 安 阅读全文

posted @ 2025-04-24 18:10 ExplorerMan 阅读(1247) 评论(0) 推荐(0)

一文弄懂用Go实现MCP服务
摘要:最近这段时间,AI领域里有一个非常热门的概念——MCP(模型上下文协议)。Anthropic推出的这一开放标准旨在为大型语言模型和AI助手提供统一的接口,使其能够轻松操作外部工具并完成更复杂的任务。 本文将带你速览MCP的核心概念,并以Go语言为例,介绍如何开发MCP服务端和客户端。 为什么MCP如 阅读全文

posted @ 2025-04-22 16:41 ExplorerMan 阅读(391) 评论(0) 推荐(0)

如何用golang实现一个MCP Server
摘要:什么是MCP?MCP(Model Communication Protocol)是一种用于大语言模型(LLM)与外部工具进行交互的协议。它允许大语言模型在处理用户请求时,调用外部工具(如计算器、API、数据库等)来完成特定任务。通过 MCP,大语言模型可以扩展其功能,而无需自己实现所有逻辑。MCP 阅读全文

posted @ 2025-04-22 16:40 ExplorerMan 阅读(438) 评论(0) 推荐(0)

1 2 3 4 5 ··· 7 下一页

导航