真正贴近人类的智能体,关键在于拥有 “记忆能力”。就像人与人相处时,我们会记住对方的喜好、过往的交流细节,并以此调整后续的沟通方式;具备记忆的智能体,同样能在与用户的互动中,主动留存对话信息、记录关键需求,甚至沉淀用户偏好,进而在未来的交互中给出更精准、更贴心的响应。 本篇实践指南,就将聚焦如何基于 ...
本文聚焦多模态大语言模型(MLLMs)在文档问答(DocQA)任务中的性能提升,提出无需改动模型架构或额外训练的结构化输入方法,通过保留文档层次结构与空间关系(如标题、表格、图像位置)优化理解能力。研究发现,传统无结构OCR输入导致注意力分散,性能下降,而 LaTeX 范式结构化输入显著提升表现。注... ...
7. LangChain4j + 记忆缓存详细说明 @目录7. LangChain4j + 记忆缓存详细说明LangChain4j + 记忆缓存实战操作最后: https://docs.langchain4j.dev/tutorials/chat-memory/ 记忆缓存是聊天系统中的一个重要组件, ...
ZeroGPU 让任何人都能在 Hugging Face Spaces 中使用强大的 Nvidia H200 硬件,而不需要因为空闲流量而长期占用 GPU。 它高效、灵活,非常适合演示,不过需要注意的是,ZeroGPU 并不能在所有场景下完全发挥 GPU 与 CUDA 栈的全部潜能,比如生成图像或视 ...
背景 过去笔者曾写过文章《AI辅助需求规格描述评审》,我们今天简单测试需求拆分任务,为什么需要markdown格式,因为MD格式1)容易通过GIT版本控制管理 2)LLM最擅长处理是MD文档 3)需求描述MD是代码逻辑生成基础。初始化我们把需求文档放入到文件夹后/INIT生成CLAUDE.md原始需 ...
介绍 (1) 发表:Arxiv 09.03 (2) 背景 查明对长执行跟踪链路中错误负责的特定代理或步骤被定义为代理系统故障归因的任务。然而,当前最新的推理 LLMS 仍不为此挑战而明显不足,精度通常低于10% 尽管现有工作已经作出了初步尝试,但他们仍然存在实质性的研究差距:① 培训资源(涉及大规模 ...
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...
背景 美团开源的 LongCat-Flash-Chat,核心卖点是“5600 亿总参数、仅激活 27 B 左右、推理 100 tokens/s、百万 token 输出成本约 5 元”。在公开基准上,它在指令遵循(IFEval 89.65)、智能体工具调用(τ²-Bench 67.7、VitaBenc ...
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...
在 AI 技术日新月异的今天,Deepseek 引领的 AI 技术革命正席卷而来,彻底改变着各行各业的工作形态。尤其是软件研发领域,AI 已成为提升开发效率的关键利器,不懂利用 AI 的研发人员,似乎正逐渐被时代的浪潮所抛下。 今天,我就来分享近两年在 AI 学习与探索之路上的点点滴滴,希望能与感兴 ...
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...
"我们的ChatBI上线半个月,准确率不到50%,老板问我们是不是在做假demo..." 如果你在做ChatBI,或正在评估要不要上ChatBI,相信你遇到过类似问题。 很多团队以为"ChatBI就是用大模型做自然语言到SQL的转换"。 有时还会被领导质疑:"找个开源项目3天就能搞定,你们怎么用了这 ...
近日,由天翼云公有云事业部联合基础架构事业部所撰写的论文《CTCCL: Cost-Efficient Joint Device-Network Load Balancing for LLM Training in RoCE-based Intelligent Computing Network》被第 ...
LangChain4j + 多模态视觉理解详细说明 @目录LangChain4j + 多模态视觉理解详细说明LangChain4j进行图像理解LangChain4j 多模态实战结合LangChain4j进行图像理解,其支持视觉-语言的多模态任务结合阿里巴巴通义万相进行图像生成(文本生成图像)最后: ...
Agentic Design Patterns A Hands-On Guide to Building Intelligent Systems[1], Antonio GulliTable of Contents - total 424 pages = 1+2+1+1+4+9+103+61+34+ ...
以下是LLaMA-Factory官方推荐的依赖组件及其版本,如果在linux上安装建议使用表格中的推荐版本,但是在windows上安装时,由于各组件提供的windows版本没有linux版本完备,为了兼容性考虑可节省时间(使用发布的wheel包而不是本地编译),这里并没有完全采用官方推荐的版本。 以 ...
参考文献:> https://www.kaggle.com/whitepaper-agents > 1.什么是Agent? Baseline:生成式AI模型 Training Aim:访问外部工具、自主规划和执行任务 What we get:具备推理、逻辑和访问外部信息的生成式AI(extended ...
背景 之前写过文章Claude Code下Kimi-k2模型初试,随着模型发展,我们今天来看看如何免费用Claude code。我们再回顾下他的特性:智能上下文管理ClaudeCode 的持久记忆机制(CLAUDE.md 文件存储项目历史)与 OpenRouter 的多模型调度深度融合,形成「记忆 ...
1. 基本信息 大语言模型 特伦斯•谢诺沃斯基 著 中信出版社,2025年07月出版 1.1. 读薄率 书籍总字数13.7万字,笔记总字数42724字。 读薄率42724÷137000≈31.19% 1.2. 读厚方向 千脑智能 脑机穿越 未来呼啸而来 虚拟人 AI3.0 新机器人 人工不智能:计算 ...