摘要: 基础RAG实现,最佳入门选择(八) RAG重排序 RAG重排序技术以提高RAG系统中的检索质量。重新排序充当初始检索后的第二个过滤步骤,以确保最相关的内容用于响应生成。 重排序的关键概念 1.初始检索:使用基本相似度搜索的第一遍(准确度较低但速度更快) 2.文档评分:评估每个检索到的文档与查询的相关性 3.重新排序:按相关性分数对文档 阅读全文
posted @ 2025-06-21 17:34 舒一笑不秃头 阅读(13) 评论(0) 推荐(0)
摘要: 基础RAG实现,最佳入门选择(七) 本文介绍了一种增强型RAG系统,采用三种查询转换技术提升检索性能:1)查询重写技术使查询更加具体详细;2)退步提示生成更宽泛的背景性问题;3)子查询分解将复杂问题拆解为简单子问题。文章详细展示了各技术的Python实现代码,包括查询重写函数rewrite_query、退步提示函数generate_step_back_query和子查询分解函数decompose_query。同时介绍了PDF文本处理流程,包括文本提取函数extract_text_from_pdf和分块函数chunk_text,最后通过create_embeddings函数生成文本向量。这些方法无需依赖LangChain等专门库即可实现检索性能提升。 阅读全文
posted @ 2025-06-21 17:09 舒一笑不秃头 阅读(42) 评论(0) 推荐(0)