大模型 - 第24页 - 网站分类

9. LangChain4j + 整合 Spring Boot

9. LangChain4j + 整合 Spring Boot @目录9. LangChain4j + 整合 Spring BootLangChain4j + 整合 Spring Boot 实操最后： LangChain4j 整合 SpringBoot 官方文档：https://docs.langc ...

如何通过LangChain实现记忆功能的总结

真正贴近人类的智能体，关键在于拥有 “记忆能力”。就像人与人相处时，我们会记住对方的喜好、过往的交流细节，并以此调整后续的沟通方式；具备记忆的智能体，同样能在与用户的互动中，主动留存对话信息、记录关键需求，甚至沉淀用户偏好，进而在未来的交互中给出更精准、更贴心的响应。本篇实践指南，就将聚焦如何基于 ...

聚焦结构化注意力，探索提升多模态大模型文档问答性能

本文聚焦多模态大语言模型（MLLMs）在文档问答（DocQA）任务中的性能提升，提出无需改动模型架构或额外训练的结构化输入方法，通过保留文档层次结构与空间关系（如标题、表格、图像位置）优化理解能力。研究发现，传统无结构OCR输入导致注意力分散，性能下降，而 LaTeX 范式结构化输入显著提升表现。注... ...

7. LangChain4j + 记忆缓存详细说明

7. LangChain4j + 记忆缓存详细说明 @目录7. LangChain4j + 记忆缓存详细说明LangChain4j + 记忆缓存实战操作最后： https://docs.langchain4j.dev/tutorials/chat-memory/ 记忆缓存是聊天系统中的一个重要组件， ...

ZeroGPU Spaces 加速实践：PyTorch 提前编译全解析

ZeroGPU 让任何人都能在 Hugging Face Spaces 中使用强大的 Nvidia H200 硬件，而不需要因为空闲流量而长期占用 GPU。它高效、灵活，非常适合演示，不过需要注意的是，ZeroGPU 并不能在所有场景下完全发挥 GPU 与 CUDA 栈的全部潜能，比如生成图像或视 ...

ClaudeCode实现简单需求文档分析与拆分

背景过去笔者曾写过文章《AI辅助需求规格描述评审》，我们今天简单测试需求拆分任务，为什么需要markdown格式，因为MD格式1）容易通过GIT版本控制管理 2）LLM最擅长处理是MD文档 3）需求描述MD是代码逻辑生成基础。初始化我们把需求文档放入到文件夹后/INIT生成CLAUDE.md原始需 ...

"AgenTracer: Who Is Inducing Failure in the LLM Agentic Systems?" 论文笔记

介绍 (1) 发表：Arxiv 09.03 (2) 背景查明对长执行跟踪链路中错误负责的特定代理或步骤被定义为代理系统故障归因的任务。然而，当前最新的推理 LLMS 仍不为此挑战而明显不足，精度通常低于10％尽管现有工作已经作出了初步尝试，但他们仍然存在实质性的研究差距：① 培训资源（涉及大规模 ...

掌控AI编程全链路：Cline让你随意选模型、透明成本、零信任安全

本文已收录在Github，关注我，紧跟本系列专栏文章，咱们下篇再续！魔都架构师 | 全网30W技术追随者大厂分布式系统/数据中台实战专家主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者以技术驱动创新，我们的征途是改变世 ...

ClaudeCode搭配美团LongCat模型

背景美团开源的 LongCat-Flash-Chat，核心卖点是“5600 亿总参数、仅激活 27 B 左右、推理 100 tokens/s、百万 token 输出成本约 5 元”。在公开基准上，它在指令遵循（IFEval 89.65）、智能体工具调用（τ²-Bench 67.7、VitaBenc ...

告别文档搜索与同事打扰：Augment AI 聊天 + 200K 上下文全方位助力开发

本文已收录在Github，关注我，紧跟本系列专栏文章，咱们下篇再续！魔都架构师 | 全网30W技术追随者大厂分布式系统/数据中台实战专家主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者以技术驱动创新，我们的征途是改变世 ...

RooCode实用指南：从coser到人工中继的全能AI代码助手

本文已收录在Github，关注我，紧跟本系列专栏文章，咱们下篇再续！魔都架构师 | 全网30W技术追随者大厂分布式系统/数据中台实战专家主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者以技术驱动创新，我们的征途是改变世 ...

基于LangChain的Ai应用开发平台

在 AI 技术日新月异的今天，Deepseek 引领的 AI 技术革命正席卷而来，彻底改变着各行各业的工作形态。尤其是软件研发领域，AI 已成为提升开发效率的关键利器，不懂利用 AI 的研发人员，似乎正逐渐被时代的浪潮所抛下。今天，我就来分享近两年在 AI 学习与探索之路上的点点滴滴，希望能与感兴 ...

Spring Boot如何启动嵌入式Tomcat？

本文已收录在Github，关注我，紧跟本系列专栏文章，咱们下篇再续！魔都架构师 | 全网30W技术追随者大厂分布式系统/数据中台实战专家主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者以技术驱动创新，我们的征途是改变世 ...

你的ChatBI(问数)准确率不到50%？带你深度拆解90%准确率的高德ChatBI案例

"我们的ChatBI上线半个月，准确率不到50%，老板问我们是不是在做假demo..." 如果你在做ChatBI，或正在评估要不要上ChatBI，相信你遇到过类似问题。很多团队以为"ChatBI就是用大模型做自然语言到SQL的转换"。有时还会被领导质疑："找个开源项目3天就能搞定，你们怎么用了这 ...

攻克大模型训练网络瓶颈，天翼云论文获ACM ICS顶会收录！

近日，由天翼云公有云事业部联合基础架构事业部所撰写的论文《CTCCL: Cost-Efficient Joint Device-Network Load Balancing for LLM Training in RoCE-based Intelligent Computing Network》被第 ...

6. LangChain4j + 多模态视觉理解详细说明

LangChain4j + 多模态视觉理解详细说明 @目录LangChain4j + 多模态视觉理解详细说明LangChain4j进行图像理解LangChain4j 多模态实战结合LangChain4j进行图像理解，其支持视觉-语言的多模态任务结合阿里巴巴通义万相进行图像生成(文本生成图像)最后： ...

《Agentic Design Patterns》分享

Agentic Design Patterns A Hands-On Guide to Building Intelligent Systems[1], Antonio GulliTable of Contents - total 424 pages = 1+2+1+1+4+9+103+61+34+ ...

Windows本地安装LLaMA-Factory

以下是LLaMA-Factory官方推荐的依赖组件及其版本，如果在linux上安装建议使用表格中的推荐版本，但是在windows上安装时，由于各组件提供的windows版本没有linux版本完备，为了兼容性考虑可节省时间（使用发布的wheel包而不是本地编译），这里并没有完全采用官方推荐的版本。以 ...

Claude Code免费编程使用指南

背景之前写过文章Claude Code下Kimi-k2模型初试，随着模型发展，我们今天来看看如何免费用Claude code。我们再回顾下他的特性：智能上下文管理ClaudeCode 的持久记忆机制（CLAUDE.md 文件存储项目历史）与 OpenRouter 的多模型调度深度融合，形成「记忆 ...

读大语言模型12读后总结与感想兼导读

1. 基本信息大语言模型特伦斯•谢诺沃斯基著中信出版社,2025年07月出版 1.1. 读薄率书籍总字数13.7万字，笔记总字数42724字。读薄率42724÷137000≈31.19% 1.2. 读厚方向千脑智能脑机穿越未来呼啸而来虚拟人 AI3.0 新机器人人工不智能：计算 ...