deephub

2026年7月15日

摘要：传统的机器学习（Machine Learning）pipeline 在处理文本分类等预测任务时，通常依赖从原始文本中提取结构化的数值特征——例如 TF-IDF 频率或 token embedding——再输入逻辑回归、集成方法或支持向量机等经典模型。大语言模型的兴起改变了这套流程：现在可以在机器学阅读全文

posted @ 2026-07-15 21:18 deephub 阅读(5) 评论(0) 推荐(0)

2026年7月8日

4D Gaussian Splatting 是怎么工作的：从规范 Gaussian 到形变场的原理拆解

摘要：实时渲染静态 3D 场景是很麻烦的，因为现实世界并不是静止的：人在移动，液体在流动，物体在变形。把 3D-GS 扩展到动态场景（4D）听起来只需要一步，随时间跟踪每个点，但是实际操作起来却很麻烦，因为显存瓶颈非常棘手。 4D Gaussian Splatting（4D-GS）的架构的方法相当巧妙，所阅读全文

posted @ 2026-07-08 21:09 deephub 阅读(5) 评论(0) 推荐(0)

2026年7月7日

OpenSpec 三阶段工作流实操：从 Propose 到 Archive让代码返工率降到三分之一以下

摘要： SDD（规范驱动开发）和传统的前期文档区别不在于写什而在于谁来读它。传统文档写给人看的，而SDD 规范写给 AI agent 看，其结构让模型能够在生成过程中引用它、对照它检查输出、在一个 session 结束、新 session 开始时借此恢复上下文。为什么选 OpenSpec 我评估过两个主要阅读全文

posted @ 2026-07-07 19:53 deephub 阅读(6) 评论(0) 推荐(0)

2026年7月6日

Agent Harness 到底是什么：模型之外的那层控制系统

摘要：有人搭出一个很唬人的 AI 智能体（Agent）演示：调用工具、搜索信息、写文件、总结文档，或者生成代码，看的很厉害，但是用着用着真正的问题就出现了：这个智能体能访问哪些工具？谁批准了这个操作？记忆存在哪里？运行过程能不能看到？模型做出错误的工具调用怎么办？如何防止它把Token配配额花光？跑到一半阅读全文

posted @ 2026-07-06 20:39 deephub 阅读(6) 评论(0) 推荐(0)

2026年7月3日

十个 AI Agent 工作流模板，照着搭就能用

摘要： AI agent 比聊天机器人更有用的地方是聊天机器人只负责回答；而agent 会完成一整条工作流：读取信息、核对、比较、决策、起草、更新，风险太高时才停下来请人拍板。下面是十个我自己会用来处理重复性工作的 AI agent 工作流模板，用来解决团队每天在复制信息、重写消息、看仪表盘、把杂乱输入整阅读全文

posted @ 2026-07-03 21:14 deephub 阅读(9) 评论(0) 推荐(0)

2026年7月2日

白得 2 到 3 倍加速的投机采样机制解析：草稿模型和目标模型是怎么配合的

摘要： LLM 解码很慢，因为生成一个 token 需要每次都从 GPU 内存中加载全部模型权重。700 亿参数的模型意味着 140GB 权重，每一个 token 都要重新加载一遍。 LLM 解码本质上是顺序的，称之为自回归生成（autoregressive generation）。每个 token 都依赖阅读全文

posted @ 2026-07-02 21:15 deephub 阅读(9) 评论(0) 推荐(0)

2026年7月1日

Harness Engineering 实践案例：如何Agent 写一份行为规范

摘要： OpenAI 的 Ryan Lopopolo 那发布了一篇关于Harness 的官方文章，我们来用手头的一个任务来测试下效果怎么样。这是一个内部RAG（Retrieval-Augmented Generation）和 fine-tuning 系统，同事直接提问，系统基于 OEM 合作伙伴提供的官方白阅读全文

posted @ 2026-07-01 19:54 deephub 阅读(8) 评论(0) 推荐(0)

2026年6月30日

注意力架构变迁总结：稀疏、线性、SSM、混合架构如何摆脱 O(L²) 的代价

摘要：自注意力（Self-attention）支撑了 Transformer 近十年，每个 Token 都要关注序列中的每一个其他 Token让这些模型能够推理的机制，而且恰恰也是成本飙升的根源：上下文翻倍，计算量大致翻四倍。这个 O(L²) 的惩罚项年复一年地限制着提示词（Prompt）能写多长、一个阅读全文

posted @ 2026-06-30 21:37 deephub 阅读(11) 评论(0) 推荐(0)

2026年6月29日

Polars vs Pandas 在生产 Pipeline 中的对比

摘要：大多数 Python 数据工程师最早学的是 pandas。因为它是行业标准，能用而且一直够用，所以一般也没人质疑过它。 Pandas 设计于 2008 年，面向的是那个时代的数据问题：假设每个操作都要立即返回结果，假设单个 CPU 核心足够，假设数据能放进内存。这些假设成立了很多年。随着 Pipel 阅读全文

posted @ 2026-06-29 21:12 deephub 阅读(9) 评论(0) 推荐(0)

2026年6月28日

UV vs pip vs Conda:Python环境管理应该怎么选

摘要：写 Python 够久的话，肯定遇到过一个问题clone 一个仓库，pip install -r requirements.txt却特别慢其实Python 打包生态已经经发了了很大的便哈， 2025 年有三款截然不同的工具。pip 是老兵，Conda 是数据科学家的主力，uv 则是彻底改写规则的挑阅读全文

posted @ 2026-06-28 20:45 deephub 阅读(9) 评论(0) 推荐(0)

overfit深度学习

公告