上一页 1 2 3 4 5 6 ··· 234 下一页

2025年10月11日

基于LangChain 实现 Advanced RAG-后检索优化(下)-上下文压缩与过滤

摘要: 摘要 Advanced RAG 的后检索优化,是指在检索环节完成后、最终响应生成前,通过一系列策略与技术对检索结果进行深度处理,旨在显著提升生成内容的相关性与质量。在这些优化手段中,上文压缩与过滤技术是提升检索结果质量的重要手段。它能巧妙筛除冗余、无关信息,萃取关键内容,为后续处理奠定优质基础。本文 阅读全文

posted @ 2025-10-11 17:27 ExplorerMan 阅读(81) 评论(0) 推荐(0)

多Agent协作入门:基于A2A协议的Agent通信(中)

摘要: 转:多Agent协作入门:基于A2A协议的Agent通信(中) - EdisonZhou - 博客园 合集 - Agent Orchestration(7) 1.多Agent协作入门:基于A2A协议的Agent通信(中)10-09 2.多Agent协作入门:基于A2A协议的Agent通信(上)10- 阅读全文

posted @ 2025-10-11 15:28 ExplorerMan 阅读(111) 评论(0) 推荐(0)

ollama部署与open-webui

摘要: 1.ollama简介 Ollama 是一款开源工具,允许用户在本地便捷地运行多种大型开源模型,如 DeepSeek、ChatGLM、Llama 等。通过 Docker Compose,我们可以快速部署 Ollama 服务,并结合其他工具(如 Dify 或 Open-WebUI)构建强大的 AI 应用 阅读全文

posted @ 2025-10-11 15:27 ExplorerMan 阅读(877) 评论(0) 推荐(0)

0基础也能看懂!从0到1手把手教你本地部署大模型Ollama

摘要: 我都没有Ollama怎么跟着你的文章安装体验DeepSeek,啊哈哈,这篇博客忘记发啦,今天补上!1.ollamaOllama是一个本地运行大型语言模型(LLM)的工具,Ollama是一个开源的 LLM(大型语言模型)服务工具,用于简化在本地运行大语言模型,降低使用大语言模型的门槛,使得大模型的开发 阅读全文

posted @ 2025-10-11 15:25 ExplorerMan 阅读(227) 评论(0) 推荐(0)

2025年9月22日

什么是 AutoModel

摘要: AutoModel 加载模型”是指使用 Hugging Face Transformers 库提供的 AutoModel 系列类,根据模型名称自动识别并加载对应的预训练模型结构和权重,从而无需手动指定具体模型类(如 BertModel、GPT2Model 等)。这一过程简化了模型加载流程,提升了代码 阅读全文

posted @ 2025-09-22 17:23 ExplorerMan 阅读(78) 评论(0) 推荐(0)

2025年7月2日

大模型基础应用框架(ReACT\SFT\RAG)技术创新及零售业务落地应用

摘要: 大模型基础应用框架(ReACT\SFT\RAG)技术创新及零售业务落地应用 一、前言 2023年,大语言模型以前所未有的速度和能力改变我们对智能系统的认知,成为技术圈最被热议的话题。但“百模大战”终将走向“落地为王”,如何将大语言模型的强大能力融入实际业务、产生业务价值成为致胜关键。 在零售场,大模 阅读全文

posted @ 2025-07-02 17:10 ExplorerMan 阅读(137) 评论(0) 推荐(0)

2025年7月1日

多模态Embedding模型:从文本到多模态的全面选型指南!

摘要: 通过将原始输入转化为固定维度的高维向量以捕捉语义信息,Embedding(嵌入)模型在构建 RAG、推荐系统,甚至自动驾驶模型训练中都发挥着极为关键的作用。近年来,OpenAI、Meta、Google、阿里、腾讯等科技巨头纷纷加大对 Embedding 模型研发的投入。以 OpenA I为例,其最新 阅读全文

posted @ 2025-07-01 22:50 ExplorerMan 阅读(1401) 评论(0) 推荐(0)

rag 查询检索轮换

摘要: “RAG查询轮换”通常指在检索增强生成(Retrieval-Augmented Generation, RAG)系统中,通过动态调整检索和生成阶段的策略或数据源,以优化查询结果质量、多样性或效率的技术。以下是具体解释: 1. RAG的基本原理 RAG结合了信息检索(Retrieval)和文本生成(G 阅读全文

posted @ 2025-07-01 22:01 ExplorerMan 阅读(43) 评论(0) 推荐(0)

2025年5月14日

多模型专家组合(COE)的关键实现方法,deepseek也在用

摘要: 1.概述 在当前的人工智能发展中,单一模型的表现往往难以满足复杂任务的需求。为应对这些挑战,多模型协作的方法应运而生,“专家组合”(Mixture of Experts)便是其中一种有效的模型协作方法。专家组合不仅能提升模型的准确性,还能通过合理分工提升效率,提供跨领域的综合解决方案。本文将从多个角 阅读全文

posted @ 2025-05-14 20:55 ExplorerMan 阅读(156) 评论(0) 推荐(0)

大模型解决幻觉方法BSChecker

摘要: BSChecker 是一种用于检测和缓解大模型幻觉问题的工具,以下是其具体的落地细节: 技术原理 细粒度检测:BSChecker 将大模型的输出文本分解成知识三元组(主语、谓词、宾语),这种细粒度的检测方式不仅能验证单个知识的真实性,还为进一步的精确分析提供了可能。 三元标签模式:与传统幻觉检测方法 阅读全文

posted @ 2025-05-14 20:31 ExplorerMan 阅读(168) 评论(0) 推荐(0)

上一页 1 2 3 4 5 6 ··· 234 下一页

导航