大模型 - 随笔分类(第3页) - ExplorerMan

LLM 幻觉检测技术简介

摘要：在LLMs中，幻觉出现在模型生成的文本偏离其训练集中实际数据的情况下。相反，它制造出看似可信但缺乏事实或背景证据支持的信息。这些幻觉可能导致生成不准确或误导性信息，对于精度和可靠性至关重要的应用而言，这是一个重大问题。幻觉对于广泛实际应用LLMs构成了重大障碍。认识到这一挑战强调了开发自动化方法以识阅读全文

posted @ 2025-03-18 23:08 ExplorerMan 阅读(204) 评论(0) 推荐(0)

有什么有效的方法检测大模型输出幻觉问题

摘要：以下是几种有效的大语言模型（LLM）输出幻觉检测方法： 1. 基于采样一致性的检测方法 SelfCheckGPT：通过多次采样生成多个回答，然后评估这些回答之间的一致性。如果回答相互矛盾，则可能包含幻觉。具体方法包括： BERTScore：比较句子与样本中最相似句子的相似度。 MQAG：通过生成多项阅读全文

posted @ 2025-03-18 22:50 ExplorerMan 阅读(353) 评论(0) 推荐(0)

牛津大学开发新方法，检测大语言模型幻觉

摘要：牛津大学开发新方法，检测大语言模型幻觉🚀 标题: Detecting Hallucinations in Large Language Models Using Semantic Entropy🏫 团队: 牛津大学🌐 来源: Nature, 2405.19648🛎️ 文章简介🔺背景: 大语阅读全文

posted @ 2025-03-18 22:34 ExplorerMan 阅读(168) 评论(0) 推荐(0)

从大数据到大模型：搜索推荐技术的前沿探索

摘要：导读大家好，我是施兴（花名叔宝），来自阿里云机器学习平台 PAI，主要负责产品架构。我们团队主要负责：①搜索推荐，这是我们较为成熟的一个领域；②涉及图像和视频多模态处理，如图像视频打标和 Stable Diffusion 文生图，文生视频等相关工作；③在大模型场景下，阿里有通义系列大模型，我们负责阅读全文

posted @ 2025-03-18 20:31 ExplorerMan 阅读(268) 评论(0) 推荐(0)

一文解析大语言模型LLM的幻觉问题：消除错觉、提高认知

摘要：文章目录前言一、幻觉介绍二、幻觉产生的原因三、幻觉的现象四、幻觉的分类五、幻觉解决方案六、幻觉待解决问题后记前言在人类的感知和认知过程中，幻觉一直是一个被广泛讨论和研究的问题。幻觉指的是一种虚假的感知或认知经验，使我们看到、听到或感受到不存在的事物或事件。无论是在科学领域还是日常生活中，幻觉都引发阅读全文

posted @ 2025-03-18 20:21 ExplorerMan 阅读(636) 评论(0) 推荐(0)

Dify开源工作流推荐！文章仿写、小红书、教程编写啥都有！

摘要：我曾多次给我的小伙伴安利Dify。它是一个高效的工作流平台，支持各种常见任务的自动化操作和协作，适合自媒体人、开发者和运营人员等。 Dify不仅支持多种模型调用，还可以通过开源的工作流来大大提高工作效率。 Dify现在的用户量其实很多，只不过它没Coze那么多创作者，所以大家都是闭门造车。但是Di 阅读全文

posted @ 2025-03-18 19:50 ExplorerMan 阅读(1952) 评论(0) 推荐(0)

大模型无法稳定输出 JSON？几个小技巧解决！

摘要：引子在几乎除了聊天以外所有的程序调用场景中，我们都希望 LLM 通过某种结构化的方式来输出，便于后续程序处理。在本文中，我们采用一个推书的例子，通过几种方式由简单到复杂地让 LLM 结构化地输出结果。我采用的方法尽量不依赖某个平台或模型的特有功能，而是一些通用的方式来实现。这个例子很简单，向 LL 阅读全文

posted @ 2025-03-18 15:53 ExplorerMan 阅读(833) 评论(0) 推荐(0)

文心一言大模型-function Calling的应用

摘要："大模型的函数调用"（Large Model Function Calling）有两种含义：内部函数调用：这指的是大型模型在其内部运行时执行的函数调用。这些函数调用是模型的一部分，用于处理输入，执行复杂的计算，生成预测等。这些内部函数是模型架构的一部分，对于最终用户通常是不可见的。外部API调阅读全文

posted @ 2025-03-18 15:48 ExplorerMan 阅读(83) 评论(0) 推荐(0)

conductor workflow

摘要：用于开发创建、管理和执行工作流以及运行工作器的 Go 应用程序的 SDK。 Conductor是领先的开源编排平台，允许开发人员构建高度可扩展的分布式应用程序。要了解有关 Conductor 的更多信息，请查看我们的开发人员指南，并给它一个 ⭐ 以使其出名！内容安装你好世界！步骤 1：通过阅读全文

posted @ 2025-03-13 17:39 ExplorerMan 阅读(82) 评论(0) 推荐(0)

GoFlow

摘要：GoFlow 是一个高性能、可扩展且分布式的 Workflow 框架，允许以有向无环图（DAG）的形式编程定义分布式工作流。它支持将任务分配到多个工作节点上，并通过 Redis 进行负载均衡。GoFlow 提供了丰富的功能，包括工作流的定义、任务的并行执行、监控以及可视化仪表板。特点：支持单节点阅读全文

posted @ 2025-03-13 17:21 ExplorerMan 阅读(256) 评论(0) 推荐(0)

推荐一款好用的golang修复无效json的库：JSONRepair

摘要：简单来说，就是可以将错误格式（非标准）的json修正，如下图所示：我的json明显不是标准的json格式，是不能被解析的：但是JSONRepair库也能修复。 github地址：https://github.com/kaptinlin/jsonrepair 使用也非常简单： 1、安装： 1 go 阅读全文

posted @ 2025-03-11 17:37 ExplorerMan 阅读(276) 评论(0) 推荐(0)

探索大型语言模型LLM推理全阶段的JSON格式输出限制方法

摘要：1. 引言 1.1 JSON结构化输出的意义对于基于大型语言模型（LLMs）的应用而言，确保输出能直接以结构化的JSON格式呈现，对于提升数据处理的自动化程度、增强系统的互操作性具有重要意义。例如，客户需要对LLM的输出进行信息提取时，若输出是一个JSON格式则会大大方便工程链路上的后处理；例如，阅读全文

posted @ 2025-03-11 17:36 ExplorerMan 阅读(433) 评论(0) 推荐(0)

如何让大语言模型输出JSON格式？

摘要：作者：HowardZhangdqs链接：https://www.zhihu.com/question/656512469/answer/3515553778来源：知乎著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。回答结果是format好的，看起来格式有问题是因为网页把输出当M 阅读全文

posted @ 2025-03-11 17:28 ExplorerMan 阅读(320) 评论(0) 推荐(0)

RAG系列07：当RAG遇上PDF表格，如何构建索引并使用大模型进行QA

摘要：有效解析和理解非结构化文档中的表格时，设计 RAG 方案仍然是一大挑战。以图片格式存在的表格情况下，这更困难，如扫描文件中的表格。这些挑战至少包含以下几个方面：扫描文档或图像文档的复杂性，如多样化的结构、包含非文本元素以及手写和打印内容的结合，为自动准确提取表格信息带来了挑战。不准确的解析可能会阅读全文

posted @ 2025-03-11 16:26 ExplorerMan 阅读(567) 评论(0) 推荐(0)

探索检索增强生成（RAG）技术的无限可能：Vector+KG RAG、Self-RAG、多向量检索器多模态RAG集成

摘要：探索检索增强生成（RAG）技术的无限可能：Vector+KG RAG、Self-RAG、多向量检索器多模态RAG集成由于 RAG 的整体思路是首先将文本切分成不同的组块，然后存储到向量数据库中。在实际使用时，将计算用户的问题和文本块的相似度，并召回 top k 的组块，然后将 top k 的组块和阅读全文

posted @ 2025-03-11 16:08 ExplorerMan 阅读(285) 评论(0) 推荐(0)

基于llava-v1.5-7b大模型的图片理解实战

摘要：多模态模型：llava-v1.5-7b，主要用于图片理解，本文的使用场景为获取图片标题和图片内容描述。 1、查看服务器配置 nvidia-smi CUDA版本= 12.2,8张24g RTX 3090显卡。 2、环境配置 2.1、克隆此存储库并导航到 LLaVA 文件夹 git clone http 阅读全文

posted @ 2025-03-11 16:03 ExplorerMan 阅读(393) 评论(0) 推荐(0)

稠密向量+稀疏向量+全文搜索+张量重排=最佳检索RAG?

摘要：RAG中的混合检索如下图：为什么要混合搜索(multi-way recall)? 越来越多的人认为，仅仅依靠向量搜索，通常是密集向量，可能并不总是产生令人满意的结果。当用户的特定查询关键字与存储的数据不精确匹配时，这种限制就会变得明显。这是因为向量本身不能表示精确的语义信息:向量可以表示一个词、一阅读全文

posted @ 2025-03-10 16:07 ExplorerMan 阅读(394) 评论(0) 推荐(0)

BM25 和向量检索的区别

摘要：BM25和向量检索是两种不同的信息检索方法，它们在原理、效率、语义理解能力等方面存在显著区别，适用于不同的应用场景。以下是两者的详细对比：方面BM25向量检索原理基于词频（TF）和逆文档频率（IDF）的统计方法，通过计算查询词与文档的相关性得分。使用深度学习技术将文本转换为高维向量，通过向量阅读全文

posted @ 2025-03-10 16:03 ExplorerMan 阅读(273) 评论(0) 推荐(0)

RAG 再添新利器！智源开源最强检索排序模型 BGE Re-Ranker v2.0

摘要：BGE（BAAI General Embedding）是智源研究院打造的通用语义向量模型。自2023年8月发布以来，智源团队陆续发布了中英文模型BGE v1.0、v1.5以及多语言模型 BGE-M3，截至目前，BGE 系列模型全球下载量超过 1500万，位居国内开源AI模型首位。BGE-M3模型一度阅读全文

posted @ 2025-03-10 11:43 ExplorerMan 阅读(1416) 评论(0) 推荐(0)

稠密向量检索、稀疏向量检索、BM25检索三者对比

摘要：在当今的信息检索领域，随着人工智能和自然语言处理技术的发展，稠密向量检索和稀疏向量检索成为了两种主要的研究方向。稠密向量检索依托于高维空间中的向量表示，能够捕捉文档的深层语义信息，而稀疏向量检索则侧重于关键词的匹配，依赖于文档中词条的存在与否。此外，BM25算法作为一种经典的信息检索模型，以其高效处阅读全文

posted @ 2025-03-10 11:41 ExplorerMan 阅读(1192) 评论(0) 推荐(0)

ExplorerMan

随笔分类 - 大模型