ExplorerMan - 博客园

RAG系列07：当RAG遇上PDF表格，如何构建索引并使用大模型进行QA

摘要：有效解析和理解非结构化文档中的表格时，设计 RAG 方案仍然是一大挑战。以图片格式存在的表格情况下，这更困难，如扫描文件中的表格。这些挑战至少包含以下几个方面：扫描文档或图像文档的复杂性，如多样化的结构、包含非文本元素以及手写和打印内容的结合，为自动准确提取表格信息带来了挑战。不准确的解析可能会阅读全文

posted @ 2025-03-11 16:26 ExplorerMan 阅读(696) 评论(0) 推荐(0)

探索检索增强生成（RAG）技术的无限可能：Vector+KG RAG、Self-RAG、多向量检索器多模态RAG集成

摘要：探索检索增强生成（RAG）技术的无限可能：Vector+KG RAG、Self-RAG、多向量检索器多模态RAG集成由于 RAG 的整体思路是首先将文本切分成不同的组块，然后存储到向量数据库中。在实际使用时，将计算用户的问题和文本块的相似度，并召回 top k 的组块，然后将 top k 的组块和阅读全文

posted @ 2025-03-11 16:08 ExplorerMan 阅读(313) 评论(0) 推荐(0)

基于llava-v1.5-7b大模型的图片理解实战

摘要：多模态模型：llava-v1.5-7b，主要用于图片理解，本文的使用场景为获取图片标题和图片内容描述。 1、查看服务器配置 nvidia-smi CUDA版本= 12.2,8张24g RTX 3090显卡。 2、环境配置 2.1、克隆此存储库并导航到 LLaVA 文件夹 git clone http 阅读全文

posted @ 2025-03-11 16:03 ExplorerMan 阅读(449) 评论(0) 推荐(0)

稠密向量+稀疏向量+全文搜索+张量重排=最佳检索RAG?

摘要： RAG中的混合检索如下图：为什么要混合搜索(multi-way recall)? 越来越多的人认为，仅仅依靠向量搜索，通常是密集向量，可能并不总是产生令人满意的结果。当用户的特定查询关键字与存储的数据不精确匹配时，这种限制就会变得明显。这是因为向量本身不能表示精确的语义信息:向量可以表示一个词、一阅读全文

posted @ 2025-03-10 16:07 ExplorerMan 阅读(482) 评论(0) 推荐(0)

BM25 和向量检索的区别

摘要： BM25和向量检索是两种不同的信息检索方法，它们在原理、效率、语义理解能力等方面存在显著区别，适用于不同的应用场景。以下是两者的详细对比：方面BM25向量检索原理基于词频（TF）和逆文档频率（IDF）的统计方法，通过计算查询词与文档的相关性得分。使用深度学习技术将文本转换为高维向量，通过向量阅读全文

posted @ 2025-03-10 16:03 ExplorerMan 阅读(322) 评论(0) 推荐(0)

RAG 再添新利器！智源开源最强检索排序模型 BGE Re-Ranker v2.0

摘要： BGE（BAAI General Embedding）是智源研究院打造的通用语义向量模型。自2023年8月发布以来，智源团队陆续发布了中英文模型BGE v1.0、v1.5以及多语言模型 BGE-M3，截至目前，BGE 系列模型全球下载量超过 1500万，位居国内开源AI模型首位。BGE-M3模型一度阅读全文

posted @ 2025-03-10 11:43 ExplorerMan 阅读(1485) 评论(0) 推荐(0)

稠密向量检索、稀疏向量检索、BM25检索三者对比

摘要：在当今的信息检索领域，随着人工智能和自然语言处理技术的发展，稠密向量检索和稀疏向量检索成为了两种主要的研究方向。稠密向量检索依托于高维空间中的向量表示，能够捕捉文档的深层语义信息，而稀疏向量检索则侧重于关键词的匹配，依赖于文档中词条的存在与否。此外，BM25算法作为一种经典的信息检索模型，以其高效处阅读全文

posted @ 2025-03-10 11:41 ExplorerMan 阅读(1349) 评论(0) 推荐(0)

一文读懂「RLHF」：基于人类反馈的强化学习

摘要： RLHF（Reinforcement Learning fromHuman Feedback，人类反馈强化学习）引言在人工智能领域，尤其是自然语言处理（NLP）技术迅猛发展的今天，如何让机器更好地理解和满足人类的需求成为了一个关键问题。传统的训练方法依赖于大规模的语料库和基于规则的损失函数，但在阅读全文

posted @ 2025-03-06 16:08 ExplorerMan 阅读(1724) 评论(0) 推荐(1)

LMdeploy 执行效率高于VLLM探究

摘要： VLLM和LMdeploy 各有优劣 VLLM功能多，开发者多，代码比较容易懂也比较容易修改，能适配不同的平台 LMdeploy执行效率高，开发者少，文档几乎没有，只支持NVidia 公司实际上线，肯定要博采众长，既要有LMdeploy的执行效率，也要参考VLLM的各种功能实现。 LMdelpoy 阅读全文

posted @ 2025-03-04 14:35 ExplorerMan 阅读(768) 评论(0) 推荐(0)

LMDeploy量化部署LLM&VLM

摘要： LMDeploy简介LMDeploy 由 MMDeploy 和 MMRazor 团队联合开发，是涵盖了 LLM 任务的全套轻量化、部署和服务解决方案，提供以下核心功能：高效的推理：LMDeploy 开发了 Persistent Batch(即 Continuous Batch)，Blocked K 阅读全文

posted @ 2025-03-04 14:33 ExplorerMan 阅读(804) 评论(0) 推荐(0)

导航

公告