摘要: 这里分享同济大学 `Haofen Wang`的关于检索增强生成的报告:《Retrieval-Augmented Generation (RAG): Paradigms, Technologies, and Trends》,全面了解RAG 范式、技术和趋势。 阅读全文
posted @ 2024-03-15 18:09 JadePeng 阅读(119) 评论(0) 推荐(1) 编辑
摘要: 语义索引(可通俗理解为向量索引)技术是搜索引擎、推荐系统、广告系统在召回阶段的核心技术之一。本文介绍In-batch negatives方法训练embedding模型,以及通过mteb测试模型recall效果。 阅读全文
posted @ 2024-03-14 12:58 JadePeng 阅读(64) 评论(0) 推荐(0) 编辑
摘要: Agent是大模型的重要应用方向,而ReACT是学术界提出的重要方法,本文介绍ReACT论文,然后通过llama_index ReActAgent来分析ReACT的执行过程 阅读全文
posted @ 2024-03-13 14:09 JadePeng 阅读(113) 评论(0) 推荐(0) 编辑
摘要: 我们从模型量化,模型推理,以及开发平台等三个层面来梳理分析LLM的推理和应用 阅读全文
posted @ 2024-03-12 10:55 JadePeng 阅读(243) 评论(0) 推荐(1) 编辑
摘要: RAG 是当前使用LLM的标准方法,大多数现有方法仅从检索语料库中检索短的连续块,限制了对整个文档上下文的整体理解。 最近,一种名为 RAPTOR (Recursive Abstractive Processing for Tree-Organized Retrieval)方法提出来, 可以让RAG的准确率提高 20% 阅读全文
posted @ 2024-03-08 09:09 JadePeng 阅读(133) 评论(0) 推荐(1) 编辑
摘要: LangChain 是一个利用LLM开发应用程序的框架, 文本介绍LangChain的入门使用 阅读全文
posted @ 2024-02-29 21:41 JadePeng 阅读(297) 评论(0) 推荐(2) 编辑
摘要: MTEB 是一个包含广泛文本嵌入(Text Embedding)的基准测试,它提供了多种语言的数十个数据集,用于各种 NLP 任务,例如文本分类、聚类、检索和文本相似性。本文介绍MTEB,以及如何自定义模型和评测任务。 阅读全文
posted @ 2024-02-26 15:32 JadePeng 阅读(248) 评论(0) 推荐(0) 编辑
摘要: 在文本索引构建这种需要大量占用磁盘IO的任务,如果正巧你的内存还有点余粮,是否可以先索引存储到内存,然后再顺序写入到磁盘呢?,需要大量占用磁盘IO,如果正巧你的内存还有点余粮,是否可以先索引存储到内存,然后再顺序写入到磁盘呢? 阅读全文
posted @ 2024-02-06 12:18 JadePeng 阅读(259) 评论(0) 推荐(3) 编辑
摘要: 我们从搜索引擎召回时,肯定希望召回相关性高的数据,那么如何来量化相关度呢。本文从TF-IDF开始,介绍BM25,BM25+,以及使用bert模型训练term weighting模型 阅读全文
posted @ 2024-02-02 15:30 JadePeng 阅读(280) 评论(0) 推荐(1) 编辑
摘要: 假设,你有一个C/C++库,需要提供给python和golang、java等调用,你或许会想,是不是要先学习下python扩展如何写 ?NO! 你只需要SWIG就行 阅读全文
posted @ 2024-01-18 20:09 JadePeng 阅读(75) 评论(0) 推荐(0) 编辑