上一页 1 ··· 3 4 5 6 7 8 9 10 11 ··· 234 下一页

2025年3月13日

GoFlow

摘要: GoFlow 是一个高性能、可扩展且分布式的 Workflow 框架,允许以有向无环图(DAG)的形式编程定义分布式工作流。它支持将任务分配到多个工作节点上,并通过 Redis 进行负载均衡。GoFlow 提供了丰富的功能,包括工作流的定义、任务的并行执行、监控以及可视化仪表板。 特点: 支持单节点 阅读全文

posted @ 2025-03-13 17:21 ExplorerMan 阅读(355) 评论(0) 推荐(0)

2025年3月11日

推荐一款好用的golang修复无效json的库:JSONRepair

摘要: 简单来说,就是可以将错误格式(非标准)的json修正,如下图所示: 我的json明显不是标准的json格式,是不能被解析的: 但是JSONRepair库也能修复。 github地址:https://github.com/kaptinlin/jsonrepair 使用也非常简单: 1、安装: 1 go 阅读全文

posted @ 2025-03-11 17:37 ExplorerMan 阅读(362) 评论(0) 推荐(0)

探索大型语言模型LLM推理全阶段的JSON格式输出限制方法

摘要: 1. 引言 1.1 JSON结构化输出的意义 对于基于大型语言模型(LLMs)的应用而言,确保输出能直接以结构化的JSON格式呈现,对于提升数据处理的自动化程度、增强系统的互操作性具有重要意义。例如,客户需要对LLM的输出进行信息提取时,若输出是一个JSON格式则会大大方便工程链路上的后处理;例如, 阅读全文

posted @ 2025-03-11 17:36 ExplorerMan 阅读(559) 评论(0) 推荐(0)

如何让大语言模型输出JSON格式?

摘要: 作者:HowardZhangdqs链接:https://www.zhihu.com/question/656512469/answer/3515553778来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 回答结果是format好的,看起来格式有问题是因为网页把输出当M 阅读全文

posted @ 2025-03-11 17:28 ExplorerMan 阅读(378) 评论(0) 推荐(0)

RAG系列07:当RAG遇上PDF表格,如何构建索引并使用大模型进行QA

摘要: 有效解析和理解非结构化文档中的表格时,设计 RAG 方案仍然是一大挑战。 以图片格式存在的表格情况下,这更困难,如扫描文件中的表格。这些挑战至少包含以下几个方面: 扫描文档或图像文档的复杂性,如多样化的结构、包含非文本元素以及手写和打印内容的结合,为自动准确提取表格信息带来了挑战。不准确的解析可能会 阅读全文

posted @ 2025-03-11 16:26 ExplorerMan 阅读(823) 评论(0) 推荐(0)

探索检索增强生成(RAG)技术的无限可能:Vector+KG RAG、Self-RAG、多向量检索器多模态RAG集成

摘要: 探索检索增强生成(RAG)技术的无限可能:Vector+KG RAG、Self-RAG、多向量检索器多模态RAG集成 由于 RAG 的整体思路是首先将文本切分成不同的组块,然后存储到向量数据库中。在实际使用时,将计算用户的问题和文本块的相似度,并召回 top k 的组块,然后将 top k 的组块和 阅读全文

posted @ 2025-03-11 16:08 ExplorerMan 阅读(342) 评论(0) 推荐(0)

基于llava-v1.5-7b大模型的图片理解实战

摘要: 多模态模型:llava-v1.5-7b,主要用于图片理解,本文的使用场景为获取图片标题和图片内容描述。 1、查看服务器配置 nvidia-smi CUDA版本= 12.2,8张24g RTX 3090显卡。 2、环境配置 2.1、克隆此存储库并导航到 LLaVA 文件夹 git clone http 阅读全文

posted @ 2025-03-11 16:03 ExplorerMan 阅读(529) 评论(0) 推荐(0)

2025年3月10日

稠密向量+稀疏向量+全文搜索+张量重排=最佳检索RAG?

摘要: RAG中的混合检索如下图: 为什么要混合搜索(multi-way recall)? 越来越多的人认为,仅仅依靠向量搜索,通常是密集向量,可能并不总是产生令人满意的结果。当用户的特定查询关键字与存储的数据不精确匹配时,这种限制就会变得明显。这是因为向量本身不能表示精确的语义信息:向量可以表示一个词、一 阅读全文

posted @ 2025-03-10 16:07 ExplorerMan 阅读(545) 评论(0) 推荐(0)

BM25 和向量检索的区别

摘要: BM25和向量检索是两种不同的信息检索方法,它们在原理、效率、语义理解能力等方面存在显著区别,适用于不同的应用场景。以下是两者的详细对比: 方面BM25向量检索 原理 基于词频(TF)和逆文档频率(IDF)的统计方法,通过计算查询词与文档的相关性得分。 使用深度学习技术将文本转换为高维向量,通过向量 阅读全文

posted @ 2025-03-10 16:03 ExplorerMan 阅读(405) 评论(0) 推荐(0)

RAG 再添新利器!智源开源最强检索排序模型 BGE Re-Ranker v2.0

摘要: BGE(BAAI General Embedding)是智源研究院打造的通用语义向量模型。自2023年8月发布以来,智源团队陆续发布了中英文模型BGE v1.0、v1.5以及多语言模型 BGE-M3,截至目前,BGE 系列模型全球下载量超过 1500万,位居国内开源AI模型首位。BGE-M3模型一度 阅读全文

posted @ 2025-03-10 11:43 ExplorerMan 阅读(1679) 评论(0) 推荐(0)

上一页 1 ··· 3 4 5 6 7 8 9 10 11 ··· 234 下一页

导航