deephub

2025年12月26日

摘要：大语言模型的文本生成方式一直都是以自回归为主：一个token接一个token,从左往右,生成完就定了。但现在有个不太一样的思路开始在研究圈里流行起来，那就是扩散语言模型(Diffusion LMs)。扩散模型在图像生成领域已经证明了自己的可行性,但是问题是把这套东西用到文本上一直很麻烦——训练难、阅读全文

posted @ 2025-12-26 20:06 deephub 阅读(8) 评论(0) 推荐(0)

2025年12月25日

机器学习时间特征处理：循环编码（Cyclical Encoding）与其在预测模型中的应用

摘要：做过电力负荷预测或者交通预测朋友，大概率都处理过时间特征。这里最直接的做法通常是把时间（比如分钟或小时）直接扔进模型里。这看起来逻辑自洽，但存在这一个大坑，就是“午夜悖论”。比如说你的模型面对两个时间点：23:59（一天的第1439分钟）和 00:01（一天的第1分钟）。在我们的认知里，这俩只差阅读全文

posted @ 2025-12-25 21:30 deephub 阅读(12) 评论(0) 推荐(0)

2025年12月24日

Anthropic 开源 Bloom：基于 LLM 的自动化行为评估框架

摘要： Anthropic 最近放出了一个叫 Bloom 的开源框架，专门用来测试大语言模型会不会出现某些特定行为。比如模型是不是会阿谀奉承用户、有没有政治倾向、会不会为了自保撒谎或者试图绕过监督机制这类问题。这个框架跟常规的评估基准不太一样。传统基准都是固定的测试集而 Bloom 会根据你的配置“长”出阅读全文

posted @ 2025-12-24 22:33 deephub 阅读(8) 评论(0) 推荐(0)

2025年12月23日

Pydantic-DeepAgents：基于 Pydantic-AI 的轻量级生产级 Agent 框架

摘要： DeepAgents的灵感源自 LangChain deepagents，但在设计上更做减法，它强调类型安全且内置了 Docker 沙箱 2025 年的Autonomous AI Agents早就不是实验室里的花架子了。在现实世界的自动化流程、代码生成工具、数据管道以及各类智能助手中都能看到它们的身阅读全文

posted @ 2025-12-23 19:25 deephub 阅读(27) 评论(0) 推荐(0)

2025年12月22日

别再浪费内存了：Python __slots__ 机制深入解析

摘要： Python 对象的灵活性大家都知道，可以随时给对象添加属性： class User: pass u = User() u.name = "Alice" u.age = 30 但这种灵活性的代价也很大，每个普通 Python 对象都有个 __dict__ 字典来存储属性，对象一多内存开销就上来了，这阅读全文

posted @ 2025-12-22 22:22 deephub 阅读(4) 评论(0) 推荐(0)

2025年12月21日

Scikit-image 实战指南：10 个让 CV 模型更稳健的预处理技巧

摘要：在计算机视觉工程落地中我们常遇到一种现象：模型在验证集上表现完美，但是一旦部署到生产环境准确率却莫名下跌。这种“性能衰退”往往不源于模型架构本身而是归咎于预处理管道的脆弱性。数据类型的隐式转换、缩放算法的细微差异、或是未被矫正的几何形变，这些看似微不足道的工程细节往往是系统失效的根源。相比于盲目调阅读全文

posted @ 2025-12-21 20:43 deephub 阅读(8) 评论(0) 推荐(0)

2025年12月20日

1小时微调 Gemma 3 270M 端侧模型与部署全流程

摘要： Gemma 3 270M是 Google 推出的一款虽小但能力惊人的开放模型。它属于 Gemma 家族，本质上是将 Gemini 模型中使用的相同技术带入了轻量级、可定制的形式中。你可以在不到一小时内完成微调，并将其大小压缩到 300MB 以下，让他直接在你的浏览器中运行。在这篇文章中，我将展阅读全文

posted @ 2025-12-20 22:50 deephub 阅读(16) 评论(0) 推荐(0)

2025年12月19日

ONNX Runtime Python 推理性能优化：8 个低延迟工程实践

摘要：在深度学习落地过程中，有一个常见的误区：一旦推理速度不达标，大家的第一反应往往是拿着模型开到，比如：做剪枝、搞蒸馏、甚至牺牲精度换小模型。实际上生产环境中的 Python 推理链路隐藏着巨大的“工程红利”。很多时候你的模型本身并不慢，慢的是低效的数据搬运、混乱的线程争用以及不合理的 Runtime 阅读全文

posted @ 2025-12-19 19:17 deephub 阅读(18) 评论(0) 推荐(0)

2025年12月18日

Scikit-Learn 1.8引入 Array API，支持 PyTorch 与 CuPy 张量的原生 GPU 加速

摘要： Scikit-Learn 1.8.0 更新引入了实验性的 Array API 支持。这意味着 CuPy 数组或 PyTorch 张量现在可以直接在 Scikit-Learn 的部分组件中直接使用了，且计算过程能保留在 GPU 上。 https://avoid.overfit.cn/post/ab7e 阅读全文

posted @ 2025-12-18 21:28 deephub 阅读(12) 评论(0) 推荐(0)

2025年12月17日

llama.cpp Server 引入路由模式：多模型热切换与进程隔离机制详解

摘要： llama.cpp server在 2025年12月11日发布的版本中正式引入了 router mode（路由模式），如果你习惯了 Ollama 那种处理多模型的方式，那这次 llama.cpp 的更新基本就是对标这个功能去的，而且它在架构上更进了一步。 https://avoid.overfit. 阅读全文

posted @ 2025-12-17 21:46 deephub 阅读(18) 评论(0) 推荐(0)

overfit深度学习

公告