会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
deephub
overfit深度学习
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
21
22
23
24
25
26
27
28
29
···
155
下一页
2025年8月11日
提升LangChain开发效率:10个被忽视的高效组件,让AI应用性能翻倍
摘要: 在当前的AI应用开发生态中,LangChain已成为构建大型语言模型应用的主流框架。但是大多数开发者在实际项目中仅使用其基础功能,如简单的链式调用和提示工程,而对其高级组件的潜力挖掘不足。这种使用模式导致了显著的性能损失和功能局限性。 本文将系统分析LangChain框架中十个具有重要价值但使用率相
阅读全文
posted @ 2025-08-11 21:22 deephub
阅读(19)
评论(0)
推荐(0)
2025年8月10日
大型动作模型LAM:让企业重复任务实现80%效率提升的AI技术架构与实现方案
摘要: 现代企业运营中,重复性任务的自动化处理已成为提升组织效率的核心需求。从基础数据录入到复杂工作流管理,企业持续寻求技术创新来降低人工成本、减少操作错误,并将人力资源重新配置到更具价值的战略性工作中。大型动作模型(Large Action Models, LAMs)作为人工智能领域的新兴技术架构,通过融
阅读全文
posted @ 2025-08-10 20:24 deephub
阅读(15)
评论(0)
推荐(0)
2025年8月9日
使用LangGraph从零构建多智能体AI系统:实现智能协作的完整指南
摘要: 想象一下:只需四小时,一位初级开发者就能构建出同时处理事实核查、摘要生成、情感分析和多数据源交叉引用的AI研究助手。这在六个月前需要高级工程师团队数周的开发时间,如今借助LangGraph多智能体框架已经成为现实。 传统AI应用依赖单一大型模型处理所有任务,就像让一个人同时担任研究员、作家、事实核查
阅读全文
posted @ 2025-08-09 18:47 deephub
阅读(131)
评论(0)
推荐(0)
2025年8月8日
PCA多变量离群点检测:Hotelling's T2与SPE方法原理及应用指南
摘要: 主成分分析(Principal Component Analysis, PCA)作为一种经典的无监督降维技术,在保留数据主要信息的同时能够有效压缩数据维度。由于PCA对数据变异性的高度敏感性,该方法在多变量异常值检测领域展现出独特的优势。 当分析任务需要建立早期预警系统以识别异常状态,并且要求结果具
阅读全文
posted @ 2025-08-08 20:21 deephub
阅读(37)
评论(0)
推荐(0)
2025年8月7日
论文解读:单个标点符号如何欺骗LLM,攻破AI评判系统
摘要: 可验证奖励强化学习(Reinforcement Learning with Verifiable Rewards, RLVR)是一种基于参考标准的训练范式,其核心在于通过基于规则的函数或生成式LLM评判器来提供奖励信号。在RLVR训练过程中,奖励模型接收问题q、策略模型生成的响应r以及参考答案a∗作
阅读全文
posted @ 2025-08-07 20:47 deephub
阅读(29)
评论(0)
推荐(0)
2025年8月5日
使用 BAML 模糊解析改进 LangChain 知识图谱提取:成功率从25%提升到99%
摘要: 在构建基于知识图谱的检索增强生成(RAG)系统或智能代理时,从非结构化数据中准确提取节点和关系是一项核心挑战。特别是在使用经过量化处理的小型本地大语言模型(LLM)时,这一问题尤为突出,往往导致整体系统性能显著下降。LangChain 提取框架的主要限制在于其对严格 JSON 解析的依赖,即使采用大
阅读全文
posted @ 2025-08-05 19:46 deephub
阅读(31)
评论(0)
推荐(0)
2025年8月4日
TorchDynamo源码解析:从字节码拦截到性能优化的设计与实践
摘要: 本文深入解析PyTorch中TorchDynamo的核心架构和实现机制,通过PyTorch源码分析和关键文件导览,为开发者提供在Dynamo基础上设计扩展功能或新特性的技术指南。 TorchDynamo是PyTorch生态系统中的Python级即时编译器(JIT Compiler),其核心功能是通过
阅读全文
posted @ 2025-08-04 19:40 deephub
阅读(29)
评论(0)
推荐(0)
2025年8月3日
NSA稀疏注意力深度解析:DeepSeek如何将Transformer复杂度从O(N²)降至线性,实现9倍训练加速
摘要: 当前人工智能模型在处理长序列任务时面临着根本性的计算瓶颈。无论是分析完整的法律文档、处理大型代码仓库,还是进行长篇对话,现有模型都受到Transformer架构中注意力机制的限制——其计算复杂度随序列长度呈二次增长( O(N²) ),导致计算和内存需求超出可承受范围。 简单的O(N²)注意力机制,为
阅读全文
posted @ 2025-08-03 19:39 deephub
阅读(38)
评论(0)
推荐(0)
2025年8月2日
从零开始构建AI Agent评估体系:12种LangSmith评估方法详解
摘要: AI Agent 的评估需要全面考虑其完整的生命周期,从开发阶段到生产部署。评估过程应当涵盖多个关键维度:最终输出的事实准确性和实用价值、推理过程中工具选择的合理性和路径效率、结构化响应生成能力(如 JSON 格式)、多轮对话的上下文维持能力,以及在真实用户流量下的持续性能表现和错误监控能力。 为了
阅读全文
posted @ 2025-08-02 20:10 deephub
阅读(61)
评论(0)
推荐(0)
2025年8月1日
GSPO:Qwen让大模型强化学习训练告别崩溃,解决序列级强化学习中的稳定性问题
摘要: 这是7月份的一篇论文,Qwen团队提出的群组序列策略优化算法及其在大规模语言模型强化学习训练中的技术突破 大规模强化学习的稳定性挑战 强化学习(Reinforcement Learning, RL)已成为构建先进大语言模型(Large Language Models, LLMs)的核心技术环节。通过
阅读全文
posted @ 2025-08-01 18:37 deephub
阅读(126)
评论(0)
推荐(0)
上一页
1
···
21
22
23
24
25
26
27
28
29
···
155
下一页
公告