Fork me on GitHub
摘要: https://arxiv.org/abs/2212.08410 思维链提示在基础层面上是如此成功,以至于它产生了一些被称为 x 链现象的东西。谷歌研究院探索了如何使用 llm 为现有数据集生成 CoT 数据本体,然后如何在 CoT 上微调较小的语言模型。 介绍 众所周知,思维链提示提高了大型语言模 阅读全文
posted @ 2024-09-16 22:08 石头木 阅读(6) 评论(0) 推荐(0) 编辑
摘要: 引入语义标签过滤:利用标签相似度 增强检索 传统的标签搜索缺乏灵活性。如果我们要过滤恰好包含给定标签的样本,可能会出现这样的情况,特别是对于只包含几千个样本的数据库, 可能没有任何(或只有少数)与我们的查询匹配的样本。 两种搜索的不同之处在于搜索结果的稀缺性 传统的标签搜索是如何工作的? 传统系统采 阅读全文
posted @ 2024-09-15 23:09 石头木 阅读(3) 评论(0) 推荐(0) 编辑
摘要: RAG 幻觉检测方法 未经检查的幻觉在今天的检索增强生成应用中仍然是一个大问题。本研究评估了 4 个公共 RAG 数据集中流行的幻觉检测器。使用 AUROC 和精度/召回率,我们报告了 G-eval、Ragas 和可信语言模型等方法如何能够自动标记不正确的 LLM 响应。 利用各种幻觉检测方法识别 阅读全文
posted @ 2024-09-13 21:37 石头木 阅读(16) 评论(0) 推荐(0) 编辑
摘要: 在https://www.arxiv.org/abs/2408.04259中,作者介绍了一种高效的多跳问答检索器效率 EfficientRAG。EfficientRAG 迭代地生成新的查询,而不需要在每次迭代中调用 LLM,并过滤掉不相关的信息 方法 EfficientRAG框架概述 作者介绍了Ef 阅读全文
posted @ 2024-09-12 22:19 石头木 阅读(23) 评论(0) 推荐(0) 编辑
摘要: 项目简介 本项目开源了基于儿科医疗指令微调的问诊模型:pediatrics_llm_qa(GitHub - jiangnanboy/pediatrics_llm_qa),目前模型的主要功能如下: 智能问诊:问诊后给出诊断结果和建议。 更新 [2024/09/11] 开源了基于Qwen2-1.5B-i 阅读全文
posted @ 2024-09-12 21:42 石头木 阅读(3) 评论(0) 推荐(0) 编辑
摘要: 介绍 检索增强生成(RAG)已成为语言模型中生成更准确和上下文相关输出的流行方法。 通常,RAG 中的检索步骤依赖于余弦相似度来识别 top-n 相关文档。然而,这种方法的一个缺点是它可以返回高度相似的文档,从而导致冗余和较少的响应多样 性。 这里提出了一种通过迭代调整所选文档向量来增强文档检索多样 阅读全文
posted @ 2024-09-10 21:28 石头木 阅读(7) 评论(0) 推荐(0) 编辑
摘要: 项目地址:https://github.com/jiangnanboy/llm_security 利用分类法和敏感词检测法对生成式大模型的输入和输出内容进行安全检测,尽早识别风险内容。 使用【ServiceApplication.java】 相关模型下载:https://github.com/jia 阅读全文
posted @ 2024-09-10 20:50 石头木 阅读(3) 评论(0) 推荐(0) 编辑
摘要: 添加图片注释,不超过 140 字(可选) 阅读全文
posted @ 2024-09-05 21:24 石头木 阅读(3) 评论(0) 推荐(0) 编辑
摘要: RAG 系统及其挑战 检索增强生成的流行是有充分理由的。它允许 AI 系统通过结合信息检索和语言生成来回答问题。标准的 RAG 管道通过摄取数据、检索相关信息并使用它来生成响应来实现这一点。 然而,随着数据变得越来越复杂,查询也越来越复杂,传统的 RAG 系统可能会 面临限制。这就是语义分块发挥作用 阅读全文
posted @ 2024-09-05 20:47 石头木 阅读(10) 评论(0) 推荐(0) 编辑
摘要: https://arxiv.org/abs/2408.14484 Agentic Retrieval-Augmented Generation for Time Series Analysis 该方法引入了一种利用多智能体 RAG 系统进行时间序列分析的新框架。该框架 解决了时间序列数据中复杂的时空 阅读全文
posted @ 2024-09-04 21:46 石头木 阅读(9) 评论(0) 推荐(0) 编辑