deephub

2026年2月11日

Agent Lightning：微软开源的框架无关 Agent 训练方案，LangChain/AutoGen 都能用

摘要： Agent 搭建起来之后怎么让它真正变得越来越好？搭建完成后的优化就很少有人认真说过。Agent Lightning 号称能把任何 AI Agent 变成"可优化的猛兽"，而且几乎不用改代码。那问题来了，市面上 Agent 框架满天飞这个凭什么就不一样呢？ https://avoid.overfit 阅读全文

posted @ 2026-02-11 21:46 deephub 阅读(13) 评论(0) 推荐(0)

2026年2月10日

软件工程原则在多智能体系统中的应用：分层与解耦

摘要： ChatGPT 发布之后，AI 智能体的概念就一直牵动着整个行业的想象力。它描绘的场景很诱人：给 AI 系统一个目标，让它自行拆解问题、调用工具、收集信息，最终综合出结果。围绕这个概念的框架生态已经相当拥挤了：LangChain、CrewAI、AutoGen、Semantic Kernel、Age 阅读全文

posted @ 2026-02-10 21:46 deephub 阅读(9) 评论(0) 推荐(0)

2026年2月9日

一分钟训练搞懂 DPPO：把扩散过程建模为 MDP 的强化学习方法

摘要：机器人领域的专家轨迹、互联网上的文本图像视频，这些数据让生成模型在机器人操控、语言生成与规划、视觉理解等任务上取得了惊人效果。但问题来了：换到具体任务上这些模型往往不太行。这是因为LLM 需要微调才能遵守安全约束或符合人类偏好，机器人策略也得继续训练才能弥补演示数据的不足。扩散模型和流模型已经成为阅读全文

posted @ 2026-02-09 20:45 deephub 阅读(10) 评论(0) 推荐(0)

2026年2月8日

从零开始用自定义 Triton 内核编写 FlashAttention-2

摘要：本文实现 FlashAttention-2 的前向传播，具体包括：为 Q、K、V 设计分块策略；流式处理 K 和 V 块而非物化完整注意力矩阵；实现在线 softmax 算法保证数值稳定性；支持因果和非因果两种注意力模式；用 Triton autotuner 自动调优内核配置；最后用 PyTorch 阅读全文

posted @ 2026-02-08 21:13 deephub 阅读(2) 评论(0) 推荐(0)

2026年2月7日

机器学习特征工程：分类变量的数值化处理方法

摘要：编码是机器学习流程里最容易被低估的环节之一，模型没办法直接处理文本形式的分类数据，尺寸（Small/Medium/Large）、颜色（Red/Blue/Green）、城市、支付方式等都是典型的分类特征，必须转成数值才能输入到模型中。那么问题来了：为什么不直接把 Red 编成 1，Blue 编成 2 阅读全文

posted @ 2026-02-07 21:35 deephub 阅读(4) 评论(0) 推荐(0)

2026年2月6日

LLM推理时计算技术详解：四种提升大模型推理能力的方法

摘要： 2025年LLM领域有个有意思的趋势：与其继续卷模型训练，不如在推理阶段多花点功夫。这就是所谓的推理时计算（Test-Time / Inference-Time Compute）：在推理阶段投入更多计算资源，包括更多Token、更多尝试、更深入的搜索，但不会改动模型权重。 ARC-AGI基准测试就是阅读全文

posted @ 2026-02-06 21:00 deephub 阅读(15) 评论(0) 推荐(0)

2026年2月5日

分类数据 EDA 实战：如何发现隐藏的层次结构

摘要：探索性数据分析（EDA）的本质不是画图和算统计量，而是不被自己的数据欺骗。分类列是最容易出问题的地方。 city 、 category 、 product 、 department 、 role 、 customer_type ——这些列看起来很简单，跑个 value_counts() 画个柱状图阅读全文

posted @ 2026-02-05 22:57 deephub 阅读(6) 评论(0) 推荐(0)

2026年2月4日

Daggr：介于 Gradio 和 ComfyUI 之间的 AI 工作流可视化方案

摘要： Daggr 是一个代码优先的 Python 库，可将 AI 工作流转换为可视化图，支持对 Gradio 管道进行检查、重跑和调试。单模型、单 prompt 的简单 demo 通常不会有什么问题。但当工作流扩展到多个步骤，比如加入后处理函数、背景移除、转录摘要、检索重排等等时情况就开始失控了。状态阅读全文

posted @ 2026-02-04 20:52 deephub 阅读(7) 评论(0) 推荐(0)

2026年2月3日

torch.compile 加速原理：kernel 融合与缓冲区复用

摘要： PyTorch 的即时执行模式在原型开发阶段很方便，但在推理性能上存在明显短板。每个张量操作独立启动 kernel、独立访问显存，导致内存带宽成为瓶颈GPU 算力无法充分利用。 torch.compile 通过提前构建计算图来解决这个问题。它的核心策略是操作融合和缓冲区复用：第一次调用需要编译而之后阅读全文

posted @ 2026-02-03 22:22 deephub 阅读(6) 评论(0) 推荐(0)

2026年2月2日

LangGraph 入门：用图结构构建你的第一个多智能体工作流

摘要： LangGraph 设计的一个核心是：多智能体工作流本质上是图结构，而非线性链。早期 LLM 应用普遍采用"提示 → LLM → 响应"的线性模式，但这种架构难以应对真实智能体系统的复杂性。比如生产环境中的多智能体协作需要分支（基于数据选择不同执行路径）、循环（支持重试与迭代优化）、汇合（多个智能体阅读全文

posted @ 2026-02-02 21:10 deephub 阅读(13) 评论(0) 推荐(0)

overfit深度学习

公告