deephub

2026年7月7日

OpenSpec 三阶段工作流实操：从 Propose 到 Archive让代码返工率降到三分之一以下

摘要： SDD（规范驱动开发）和传统的前期文档区别不在于写什而在于谁来读它。传统文档写给人看的，而SDD 规范写给 AI agent 看，其结构让模型能够在生成过程中引用它、对照它检查输出、在一个 session 结束、新 session 开始时借此恢复上下文。为什么选 OpenSpec 我评估过两个主要阅读全文

posted @ 2026-07-07 19:53 deephub 阅读(0) 评论(0) 推荐(0)

2026年7月6日

Agent Harness 到底是什么：模型之外的那层控制系统

摘要：有人搭出一个很唬人的 AI 智能体（Agent）演示：调用工具、搜索信息、写文件、总结文档，或者生成代码，看的很厉害，但是用着用着真正的问题就出现了：这个智能体能访问哪些工具？谁批准了这个操作？记忆存在哪里？运行过程能不能看到？模型做出错误的工具调用怎么办？如何防止它把Token配配额花光？跑到一半阅读全文

posted @ 2026-07-06 20:39 deephub 阅读(2) 评论(0) 推荐(0)

2026年7月3日

十个 AI Agent 工作流模板，照着搭就能用

摘要： AI agent 比聊天机器人更有用的地方是聊天机器人只负责回答；而agent 会完成一整条工作流：读取信息、核对、比较、决策、起草、更新，风险太高时才停下来请人拍板。下面是十个我自己会用来处理重复性工作的 AI agent 工作流模板，用来解决团队每天在复制信息、重写消息、看仪表盘、把杂乱输入整阅读全文

posted @ 2026-07-03 21:14 deephub 阅读(3) 评论(0) 推荐(0)

2026年7月2日

白得 2 到 3 倍加速的投机采样机制解析：草稿模型和目标模型是怎么配合的

摘要： LLM 解码很慢，因为生成一个 token 需要每次都从 GPU 内存中加载全部模型权重。700 亿参数的模型意味着 140GB 权重，每一个 token 都要重新加载一遍。 LLM 解码本质上是顺序的，称之为自回归生成（autoregressive generation）。每个 token 都依赖阅读全文

posted @ 2026-07-02 21:15 deephub 阅读(4) 评论(0) 推荐(0)

2026年7月1日

Harness Engineering 实践案例：如何Agent 写一份行为规范

摘要： OpenAI 的 Ryan Lopopolo 那发布了一篇关于Harness 的官方文章，我们来用手头的一个任务来测试下效果怎么样。这是一个内部RAG（Retrieval-Augmented Generation）和 fine-tuning 系统，同事直接提问，系统基于 OEM 合作伙伴提供的官方白阅读全文

posted @ 2026-07-01 19:54 deephub 阅读(2) 评论(0) 推荐(0)

2026年6月30日

注意力架构变迁总结：稀疏、线性、SSM、混合架构如何摆脱 O(L²) 的代价

摘要：自注意力（Self-attention）支撑了 Transformer 近十年，每个 Token 都要关注序列中的每一个其他 Token让这些模型能够推理的机制，而且恰恰也是成本飙升的根源：上下文翻倍，计算量大致翻四倍。这个 O(L²) 的惩罚项年复一年地限制着提示词（Prompt）能写多长、一个阅读全文

posted @ 2026-06-30 21:37 deephub 阅读(7) 评论(0) 推荐(0)

2026年6月29日

Polars vs Pandas 在生产 Pipeline 中的对比

摘要：大多数 Python 数据工程师最早学的是 pandas。因为它是行业标准，能用而且一直够用，所以一般也没人质疑过它。 Pandas 设计于 2008 年，面向的是那个时代的数据问题：假设每个操作都要立即返回结果，假设单个 CPU 核心足够，假设数据能放进内存。这些假设成立了很多年。随着 Pipel 阅读全文

posted @ 2026-06-29 21:12 deephub 阅读(6) 评论(0) 推荐(0)

2026年6月28日

UV vs pip vs Conda:Python环境管理应该怎么选

摘要：写 Python 够久的话，肯定遇到过一个问题clone 一个仓库，pip install -r requirements.txt却特别慢其实Python 打包生态已经经发了了很大的便哈， 2025 年有三款截然不同的工具。pip 是老兵，Conda 是数据科学家的主力，uv 则是彻底改写规则的挑阅读全文

posted @ 2026-06-28 20:45 deephub 阅读(6) 评论(0) 推荐(0)

2026年6月25日

用 LangGraph 改造单一 RAG 架构：让 Agent 决定调用向量、图遍历还是网络搜索

摘要：向量搜索、图遍历还是网络搜索 -- 本文介绍如何用 LangGraph 让智能体为每个问题选择合适的工具。语义搜索、向量数据库迁移、Graph RAG。这些系统有一个共同缺陷——都是 Pipeline，固定执行序列，问题进、答案出，不论输入是什么。真实问题并不符合这个假设。 "我们的退款政策是什阅读全文

posted @ 2026-06-25 22:01 deephub 阅读(6) 评论(0) 推荐(0)

2026年6月24日

为什么Kriging 与高斯过程回归出自同一数学框架，但实际效果却差很远

摘要：做过地质统计学、储层建模或空间机器学习的人，大概都面对过这个选择：Kriging（经典地质统计学的主力工具），还是高斯过程回归（Gaussian Process Regression，GPR，其机器学习更加接近）。两者在数学上是相通的——都是基于协方差/核函数构建的"最佳线性无偏预测器"——但实际使阅读全文

posted @ 2026-06-24 21:59 deephub 阅读(8) 评论(0) 推荐(0)

overfit深度学习

公告