会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
沐子馨
博客园
首页
新随笔
联系
管理
订阅
2026年5月22日
深入理解 RAG 中的混合搜索策略
摘要: 混合检索(Hybrid Search)是一种结合了 稀疏向量(Sparse Vectors) 和 密集向量(Dense Vectors) 优势的先进搜索技术。旨在同时利用稀疏向量的关键词精确匹配能力和密集向量的语义理解能力,以克服单一向量检索的局限性,从而在各种搜索场景下提供更准确、更鲁棒的检索结果
阅读全文
posted @ 2026-05-22 14:42 沐子馨
阅读(2)
评论(0)
推荐(0)
2026年5月21日
告别基础检索:掌握 RAG 中的句子窗口与递归路由策略
摘要: 一、上下文扩展 在RAG系统中,常常面临一个权衡问题:使用小块文本进行检索可以获得更高的精确度,但小块文本缺乏足够的上下文,可能导致大语言模型(LLM)无法生成高质量的答案;而使用大块文本虽然上下文丰富,却容易引入噪音,降低检索的相关性。为了解决这一矛盾,LlamaIndex 提出了一种实用的索引策
阅读全文
posted @ 2026-05-21 11:59 沐子馨
阅读(9)
评论(0)
推荐(0)
2026年5月18日
构建多模态检索系统:Milvus 部署、Schema 设计与混合检索实践
摘要: 一、简介 Milvus 是一个开源的、专为大规模向量相似性搜索和分析而设计的向量数据库。它诞生于 Zilliz 公司,并已成为 LF AI & Data 基金会的顶级项目,在AI领域拥有广泛的应用。 与 FAISS、ChromaDB 等轻量级本地存储方案不同,Milvus 从设计之初就瞄准了生产环境
阅读全文
posted @ 2026-05-18 16:15 沐子馨
阅读(16)
评论(0)
推荐(0)
2026年5月17日
向量数据库原理与实战:从核心机制到 FAISS 应用
摘要: 一、向量数据库的作用 在前面我们学习了如何使用嵌入模型将文本、图像等非结构化数据转换为高维向量。这些向量是 RAG 系统能够进行语义理解的基础。然而,当向量数量从几百个增长到数百万甚至数十亿时,一个核心问题随之而来:如何快速、准确地从海量向量中找到与用户查询最相似的那几个? 1.1 向量数据库主要功
阅读全文
posted @ 2026-05-17 12:38 沐子馨
阅读(27)
评论(0)
推荐(0)
2026年5月16日
多模态向量嵌入:从文本到图像的语义统一与 RAG 应用
摘要: 现代 AI 的一项重要突破,是将简单的词向量发展成了能统一理解图文、音视频的复杂系统。这一发展建立在注意力机制、Transformer 架构和对比学习等关键技术之上,它们解决了在共享向量空间中对齐不同数据模态的核心挑战。其发展环环相扣:Word2Vec 为 BERT 的上下文理解铺路,而 BERT
阅读全文
posted @ 2026-05-16 22:01 沐子馨
阅读(16)
评论(0)
推荐(0)
2026年5月15日
构建高效 RAG 的基石:深度解析 Embedding 模型原理与优化
摘要: 一、向量嵌入基础 1.1 基础概念 1.1.1 什么是 Embedding 向量嵌入(Embedding)是一种将真实世界中复杂、高维的数据对象(如文本、图像、音频、视频等)转换为数学上易于处理的、低维、稠密的连续数值向量的技术。 想象一下,我们将每一个词、每一段话、每一张图片都放在一个巨大的多维空
阅读全文
posted @ 2026-05-15 15:02 沐子馨
阅读(7)
评论(0)
推荐(0)
2026年5月14日
All-in-RAG:解锁大模型“开卷考试”的终极能力
摘要: 一、什么是 RAG? 1.1 核心定义 从本质上讲,RAG(Retrieval-Augmented Generation)是一种旨在解决大语言模型(LLM)“知其然不知其所以然”问题的技术范式。它的核心是将模型内部学到的“参数化知识”(模型权重中固化的、模糊的“记忆”),与来自外部知识库的“非参数化
阅读全文
posted @ 2026-05-14 18:09 沐子馨
阅读(11)
评论(0)
推荐(0)
2026年5月13日
AI Agent 是如何思考的?一文读懂推理与决策引擎
摘要: 智能体的出现标志着人工智能领域的重大转折。这些系统专门用于规划、制定策略和执行复杂任务,而每个智能体的认知核心都是一个大语言模型(LLM)。这个 LLM 不仅仅是一个复杂的文本生成器;它充当着基础推理引擎的角色,是赋予智能体决策能力、制定计划并与环境交互能力的中央「心智」。 因此,理解这些模型的内部
阅读全文
posted @ 2026-05-13 16:45 沐子馨
阅读(13)
评论(0)
推荐(0)
2026年5月12日
终端革命:AI Agent 正在重新定义命令行
摘要: 引言 开发者的命令行界面,长期以来都是精确命令式指令的堡垒,如今正经历着深刻的变革。它正在从一个简单的 Shell 演变为由一类新型工具驱动的智能协作工作空间:AI 智能体命令行界面(CLI)。这些智能体不仅仅是执行命令;它们理解自然语言,维护整个代码库的上下文,并能执行复杂的多步骤任务,自动化开发
阅读全文
posted @ 2026-05-12 11:53 沐子馨
阅读(17)
评论(0)
推荐(0)
2026年5月11日
给企业装上“AI 大脑”:AgentSpace 如何从“手动检索”跨越到“智能决策”?
摘要: 概述 AgentSpace 是一个旨在通过将人工智能融入日常工作流程来推动”智能体驱动型企业”发展的平台。其核心能力在于为组织的整个数字资产(包括文档、电子邮件和数据库)提供统一的搜索功能。该系统利用先进的 AI 模型(如 Google 的 Gemini)来理解并整合来自这些多样化来源的信息。 该平
阅读全文
posted @ 2026-05-11 10:55 沐子馨
阅读(9)
评论(0)
推荐(0)
下一页
公告