石头木

2024年9月16日

摘要： https://arxiv.org/abs/2212.08410 思维链提示在基础层面上是如此成功，以至于它产生了一些被称为 x 链现象的东西。谷歌研究院探索了如何使用 llm 为现有数据集生成 CoT 数据本体，然后如何在 CoT 上微调较小的语言模型。介绍众所周知，思维链提示提高了大型语言模阅读全文

posted @ 2024-09-16 22:08 石头木阅读(6) 评论(0) 推荐(0) 编辑

2024年9月15日

引入语义标签过滤:利用标签相似度增强检索

摘要：引入语义标签过滤:利用标签相似度增强检索传统的标签搜索缺乏灵活性。如果我们要过滤恰好包含给定标签的样本，可能会出现这样的情况，特别是对于只包含几千个样本的数据库，可能没有任何(或只有少数)与我们的查询匹配的样本。两种搜索的不同之处在于搜索结果的稀缺性传统的标签搜索是如何工作的? 传统系统采阅读全文

posted @ 2024-09-15 23:09 石头木阅读(3) 评论(0) 推荐(0) 编辑

2024年9月13日

RAG 幻觉检测方法

摘要： RAG 幻觉检测方法未经检查的幻觉在今天的检索增强生成应用中仍然是一个大问题。本研究评估了 4 个公共 RAG 数据集中流行的幻觉检测器。使用 AUROC 和精度/召回率，我们报告了 G-eval、Ragas 和可信语言模型等方法如何能够自动标记不正确的 LLM 响应。利用各种幻觉检测方法识别阅读全文

posted @ 2024-09-13 21:37 石头木阅读(16) 评论(0) 推荐(0) 编辑

2024年9月12日

EfficientRAG:多跳问题回答的高效检索器

摘要：在https://www.arxiv.org/abs/2408.04259中，作者介绍了一种高效的多跳问答检索器效率 EfficientRAG。EfficientRAG 迭代地生成新的查询，而不需要在每次迭代中调用 LLM，并过滤掉不相关的信息方法 EfficientRAG框架概述作者介绍了Ef 阅读全文

posted @ 2024-09-12 22:19 石头木阅读(23) 评论(0) 推荐(0) 编辑

pediatrics_llm_qa：儿科问诊小模型

摘要：项目简介本项目开源了基于儿科医疗指令微调的问诊模型：pediatrics_llm_qa(GitHub - jiangnanboy/pediatrics_llm_qa)，目前模型的主要功能如下：智能问诊：问诊后给出诊断结果和建议。更新 [2024/09/11] 开源了基于Qwen2-1.5B-i 阅读全文

posted @ 2024-09-12 21:42 石头木阅读(3) 评论(0) 推荐(0) 编辑

2024年9月10日

利用投影技术增强RAG文档检索的多样性

摘要：介绍检索增强生成(RAG)已成为语言模型中生成更准确和上下文相关输出的流行方法。通常，RAG 中的检索步骤依赖于余弦相似度来识别 top-n 相关文档。然而，这种方法的一个缺点是它可以返回高度相似的文档，从而导致冗余和较少的响应多样性。这里提出了一种通过迭代调整所选文档向量来增强文档检索多样阅读全文

posted @ 2024-09-10 21:28 石头木阅读(7) 评论(0) 推荐(0) 编辑

llm_security(大模型内容安全)

摘要：项目地址：https://github.com/jiangnanboy/llm_security 利用分类法和敏感词检测法对生成式大模型的输入和输出内容进行安全检测，尽早识别风险内容。使用【ServiceApplication.java】相关模型下载：https://github.com/jia 阅读全文

posted @ 2024-09-10 20:50 石头木阅读(3) 评论(0) 推荐(0) 编辑

2024年9月5日

生成式AI小抄

摘要：添加图片注释，不超过 140 字（可选）阅读全文

posted @ 2024-09-05 21:24 石头木阅读(3) 评论(0) 推荐(0) 编辑

语义分块:改进 AI 信息检索

摘要： RAG 系统及其挑战检索增强生成的流行是有充分理由的。它允许 AI 系统通过结合信息检索和语言生成来回答问题。标准的 RAG 管道通过摄取数据、检索相关信息并使用它来生成响应来实现这一点。然而，随着数据变得越来越复杂，查询也越来越复杂，传统的 RAG 系统可能会面临限制。这就是语义分块发挥作用阅读全文

posted @ 2024-09-05 20:47 石头木阅读(10) 评论(0) 推荐(0) 编辑

2024年9月4日

时间序列分析的代理检索-增强生成

摘要： https://arxiv.org/abs/2408.14484 Agentic Retrieval-Augmented Generation for Time Series Analysis 该方法引入了一种利用多智能体 RAG 系统进行时间序列分析的新框架。该框架解决了时间序列数据中复杂的时空阅读全文

posted @ 2024-09-04 21:46 石头木阅读(9) 评论(0) 推荐(0) 编辑

https://jiangnanboy.github.io

公告