刷新
如何通过LangChain实现记忆功能的总结

博主头像 真正贴近人类的智能体,关键在于拥有 “记忆能力”。就像人与人相处时,我们会记住对方的喜好、过往的交流细节,并以此调整后续的沟通方式;具备记忆的智能体,同样能在与用户的互动中,主动留存对话信息、记录关键需求,甚至沉淀用户偏好,进而在未来的交互中给出更精准、更贴心的响应。 本篇实践指南,就将聚焦如何基于 ...

聚焦结构化注意力,探索提升多模态大模型文档问答性能

博主头像 本文聚焦多模态大语言模型(MLLMs)在文档问答(DocQA)任务中的性能提升,提出无需改动模型架构或额外训练的结构化输入方法,通过保留文档层次结构与空间关系(如标题、表格、图像位置)优化理解能力。研究发现,传统无结构OCR输入导致注意力分散,性能下降,而 LaTeX 范式结构化输入显著提升表现。注... ...

7. LangChain4j + 记忆缓存详细说明

博主头像 7. LangChain4j + 记忆缓存详细说明 @目录7. LangChain4j + 记忆缓存详细说明LangChain4j + 记忆缓存实战操作最后: https://docs.langchain4j.dev/tutorials/chat-memory/ 记忆缓存是聊天系统中的一个重要组件, ...

ZeroGPU Spaces 加速实践:PyTorch 提前编译全解析

博主头像 ZeroGPU 让任何人都能在 Hugging Face Spaces 中使用强大的 Nvidia H200 硬件,而不需要因为空闲流量而长期占用 GPU。 它高效、灵活,非常适合演示,不过需要注意的是,ZeroGPU 并不能在所有场景下完全发挥 GPU 与 CUDA 栈的全部潜能,比如生成图像或视 ...

ClaudeCode实现简单需求文档分析与拆分

博主头像 背景 过去笔者曾写过文章《AI辅助需求规格描述评审》,我们今天简单测试需求拆分任务,为什么需要markdown格式,因为MD格式1)容易通过GIT版本控制管理 2)LLM最擅长处理是MD文档 3)需求描述MD是代码逻辑生成基础。初始化我们把需求文档放入到文件夹后/INIT生成CLAUDE.md原始需 ...

"AgenTracer: Who Is Inducing Failure in the LLM Agentic Systems?" 论文笔记

博主头像 介绍 (1) 发表:Arxiv 09.03 (2) 背景 查明对长执行跟踪链路中错误负责的特定代理或步骤被定义为代理系统故障归因的任务。然而,当前最新的推理 LLMS 仍不为此挑战而明显不足,精度通常低于10% 尽管现有工作已经作出了初步尝试,但他们仍然存在实质性的研究差距:① 培训资源(涉及大规模 ...

ClaudeCode搭配美团LongCat模型

博主头像 背景 美团开源的 LongCat-Flash-Chat,核心卖点是“5600 亿总参数、仅激活 27 B 左右、推理 100 tokens/s、百万 token 输出成本约 5 元”。在公开基准上,它在指令遵循(IFEval 89.65)、智能体工具调用(τ²-Bench 67.7、VitaBenc ...

基于LangChain的Ai应用开发平台

博主头像 在 AI 技术日新月异的今天,Deepseek 引领的 AI 技术革命正席卷而来,彻底改变着各行各业的工作形态。尤其是软件研发领域,AI 已成为提升开发效率的关键利器,不懂利用 AI 的研发人员,似乎正逐渐被时代的浪潮所抛下。 今天,我就来分享近两年在 AI 学习与探索之路上的点点滴滴,希望能与感兴 ...

Spring Boot如何启动嵌入式Tomcat?

博主头像 本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...

6. LangChain4j + 多模态视觉理解详细说明

博主头像 LangChain4j + 多模态视觉理解详细说明 @目录LangChain4j + 多模态视觉理解详细说明LangChain4j进行图像理解LangChain4j 多模态实战结合LangChain4j进行图像理解,其支持视觉-语言的多模态任务结合阿里巴巴通义万相进行图像生成(文本生成图像)最后: ...

Windows本地安装LLaMA-Factory

以下是LLaMA-Factory官方推荐的依赖组件及其版本,如果在linux上安装建议使用表格中的推荐版本,但是在windows上安装时,由于各组件提供的windows版本没有linux版本完备,为了兼容性考虑可节省时间(使用发布的wheel包而不是本地编译),这里并没有完全采用官方推荐的版本。 以 ...

Agent大调查

参考文献:> https://www.kaggle.com/whitepaper-agents > 1.什么是Agent? Baseline:生成式AI模型 Training Aim:访问外部工具、自主规划和执行任务 What we get:具备推理、逻辑和访问外部信息的生成式AI(extended ...

Claude Code免费编程使用指南

博主头像 背景 之前写过文章Claude Code下Kimi-k2模型初试,随着模型发展,我们今天来看看如何免费用Claude code。我们再回顾下他的特性:智能上下文管理ClaudeCode 的持久记忆机制(CLAUDE.md 文件存储项目历史)与 OpenRouter 的多模型调度深度融合,形成「记忆 ...

读大语言模型12读后总结与感想兼导读

博主头像 1. 基本信息 大语言模型 特伦斯•谢诺沃斯基 著 中信出版社,2025年07月出版 1.1. 读薄率 书籍总字数13.7万字,笔记总字数42724字。 读薄率42724÷137000≈31.19% 1.2. 读厚方向 千脑智能 脑机穿越 未来呼啸而来 虚拟人 AI3.0 新机器人 人工不智能:计算 ...

<1···121314···27>