JadePeng - 博客园

2024年4月22日

摘要：前面我们通过两篇文章: [BGE M3-Embedding 模型介绍](https://www.cnblogs.com/xiaoqi/p/18143552/bge-m3) 和 [Sparse稀疏检索介绍与实践](https://www.cnblogs.com/xiaoqi/p/18135929/sparse_retrieval) 介绍了sparse 稀疏检索，今天我们来看看如何建立一个工程化的系统来实现sparse vec的检索。阅读全文

posted @ 2024-04-22 14:52 JadePeng 阅读(82) 评论(0) 推荐(0) 编辑

2024年4月18日

BGE M3-Embedding 模型介绍

摘要： BGE M3-Embedding是BAAI开源的embedding模型，支持多语言，多粒度，多功能检索，本文介绍模型的相关信息阅读全文

posted @ 2024-04-18 15:05 JadePeng 阅读(388) 评论(0) 推荐(0) 编辑

2024年4月15日

Sparse稀疏检索介绍与实践

摘要：在处理大规模文本数据时，我们经常会遇到一些挑战，比如如何有效地表示和检索文档，当前主要有两个主要方法，传统的文本BM25检索，以及将文档映射到向量空间的向量检索。 BM25效果是有上限的，但是文本检索在一些场景仍具备较好的鲁棒性和可解释性，因此不可或缺，那么在NN模型一统天下的今天，是否能用NN模型来增强文本检索呢，答案是有的，也就是我们今天要说的sparse 稀疏检索。传统的BM25文本检索其实就是典型的sparse稀疏检索，在BM25检索算法中，向量维度为整个词表，但是其中大部分为0，只有出现的关键词或子词（tokens）有值，其余的值都设为零。这种表示方法不仅节省了存储空间，而且提高了检索效率。阅读全文

posted @ 2024-04-15 14:40 JadePeng 阅读(170) 评论(0) 推荐(1) 编辑

2024年4月11日

知识图谱增强的KG-RAG框架

摘要： KG-RAG框架通过结合生物医学知识图谱和LLM，为生物医学领域的问题提供了通用的解决方案。不仅提高了模型的性能，而且简化了流程，使其更具成本效益和时间效率。阅读全文

posted @ 2024-04-11 13:42 JadePeng 阅读(349) 评论(0) 推荐(2) 编辑

2024年4月10日

知识图谱在RAG中的应用探讨

摘要：在这篇文章中，我们来详细探讨知识图谱（KG）在RAG流程中的具体应用场景。阅读全文

posted @ 2024-04-10 17:52 JadePeng 阅读(204) 评论(2) 推荐(1) 编辑

2024年4月9日

深度解读RAGFlow的深度文档理解DeepDoc

摘要： 4 月 1 日，Infinity宣布端到端 RAG 解决方案 RAGFlow 开源，仅一天收获上千颗星，到底有何魅力？我们来安装体验并从代码层面来分析看看。阅读全文

posted @ 2024-04-09 14:20 JadePeng 阅读(1217) 评论(0) 推荐(0) 编辑

2024年3月15日

RAG 范式、技术和趋势

摘要：这里分享同济大学 `Haofen Wang`的关于检索增强生成的报告：《Retrieval-Augmented Generation (RAG): Paradigms, Technologies, and Trends》，全面了解RAG 范式、技术和趋势。阅读全文

posted @ 2024-03-15 18:09 JadePeng 阅读(745) 评论(2) 推荐(1) 编辑

2024年3月14日

In-batch negatives Embedding模型介绍与实践

摘要：语义索引（可通俗理解为向量索引）技术是搜索引擎、推荐系统、广告系统在召回阶段的核心技术之一。本文介绍In-batch negatives方法训练embedding模型，以及通过mteb测试模型recall效果。阅读全文

posted @ 2024-03-14 12:58 JadePeng 阅读(233) 评论(0) 推荐(0) 编辑

2024年3月13日

ReACT介绍与llama_index ReActAgent实践

摘要： Agent是大模型的重要应用方向，而ReACT是学术界提出的重要方法，本文介绍ReACT论文，然后通过llama_index ReActAgent来分析ReACT的执行过程阅读全文

posted @ 2024-03-13 14:09 JadePeng 阅读(301) 评论(0) 推荐(0) 编辑

2024年3月12日

LLM 推理和应用开源框架梳理

摘要：我们从模型量化，模型推理，以及开发平台等三个层面来梳理分析LLM的推理和应用阅读全文

posted @ 2024-03-12 10:55 JadePeng 阅读(958) 评论(0) 推荐(1) 编辑

jqpeng的技术记事本

新的一年，虎虎生威，

公告