deephub

2025年12月22日

摘要： Python 对象的灵活性大家都知道，可以随时给对象添加属性： class User: pass u = User() u.name = "Alice" u.age = 30 但这种灵活性的代价也很大，每个普通 Python 对象都有个 __dict__ 字典来存储属性，对象一多内存开销就上来了，这阅读全文

posted @ 2025-12-22 22:22 deephub 阅读(1) 评论(0) 推荐(0)

2025年12月21日

Scikit-image 实战指南：10 个让 CV 模型更稳健的预处理技巧

摘要：在计算机视觉工程落地中我们常遇到一种现象：模型在验证集上表现完美，但是一旦部署到生产环境准确率却莫名下跌。这种“性能衰退”往往不源于模型架构本身而是归咎于预处理管道的脆弱性。数据类型的隐式转换、缩放算法的细微差异、或是未被矫正的几何形变，这些看似微不足道的工程细节往往是系统失效的根源。相比于盲目调阅读全文

posted @ 2025-12-21 20:43 deephub 阅读(4) 评论(0) 推荐(0)

2025年12月20日

1小时微调 Gemma 3 270M 端侧模型与部署全流程

摘要： Gemma 3 270M是 Google 推出的一款虽小但能力惊人的开放模型。它属于 Gemma 家族，本质上是将 Gemini 模型中使用的相同技术带入了轻量级、可定制的形式中。你可以在不到一小时内完成微调，并将其大小压缩到 300MB 以下，让他直接在你的浏览器中运行。在这篇文章中，我将展阅读全文

posted @ 2025-12-20 22:50 deephub 阅读(8) 评论(0) 推荐(0)

2025年12月19日

ONNX Runtime Python 推理性能优化：8 个低延迟工程实践

摘要：在深度学习落地过程中，有一个常见的误区：一旦推理速度不达标，大家的第一反应往往是拿着模型开到，比如：做剪枝、搞蒸馏、甚至牺牲精度换小模型。实际上生产环境中的 Python 推理链路隐藏着巨大的“工程红利”。很多时候你的模型本身并不慢，慢的是低效的数据搬运、混乱的线程争用以及不合理的 Runtime 阅读全文

posted @ 2025-12-19 19:17 deephub 阅读(8) 评论(0) 推荐(0)

2025年12月18日

Scikit-Learn 1.8引入 Array API，支持 PyTorch 与 CuPy 张量的原生 GPU 加速

摘要： Scikit-Learn 1.8.0 更新引入了实验性的 Array API 支持。这意味着 CuPy 数组或 PyTorch 张量现在可以直接在 Scikit-Learn 的部分组件中直接使用了，且计算过程能保留在 GPU 上。 https://avoid.overfit.cn/post/ab7e 阅读全文

posted @ 2025-12-18 21:28 deephub 阅读(7) 评论(0) 推荐(0)

2025年12月17日

llama.cpp Server 引入路由模式：多模型热切换与进程隔离机制详解

摘要： llama.cpp server在 2025年12月11日发布的版本中正式引入了 router mode（路由模式），如果你习惯了 Ollama 那种处理多模型的方式，那这次 llama.cpp 的更新基本就是对标这个功能去的，而且它在架构上更进了一步。 https://avoid.overfit. 阅读全文

posted @ 2025-12-17 21:46 deephub 阅读(8) 评论(0) 推荐(0)

2025年12月16日

不仅仅是 Try/Except：资深 Python 工程师的错误处理工程化实践

摘要：开发过程中，这种报错堆栈大家应该都不陌生： Traceback (most recent call last): File "app.py", line 10, in <module\> ZeroDivisionError: division by zero 程序崩溃，服务中断，用户体验归零。但阅读全文

posted @ 2025-12-16 22:28 deephub 阅读(4) 评论(0) 推荐(0)

2025年12月15日

深度解析 Google JAX 全栈：带你上手开发，从零构建神经网络

摘要：目前来看Google 是唯一一家在 AI 价值链上实现端到端垂直整合的公司。从基础模型 (Gemini)、应用层 (ImageFX, Search with Gemini, NotebookLM)，到云架构 (Google Cloud, Vertex AI) 以及硬件 (TPUs)，几乎全都有所布局阅读全文

posted @ 2025-12-15 22:06 deephub 阅读(7) 评论(0) 推荐(0)

2025年12月14日

基于强化学习的量化交易框架 TensorTrade

摘要：打开交易图表，堆上十个技术指标，然后对着屏幕发呆不知道下一步怎么操作——这场景对交易员来说太熟悉了。如果把历史数据丢给计算机，告诉它“去试错”。赚了有奖励，亏了有惩罚。让它在不断的尝试和失败中学习，最终迭代出一个不说完美、但至少能逻辑自洽的交易策略。这就是 TensorTrade 的核心逻辑。 T 阅读全文

posted @ 2025-12-14 19:24 deephub 阅读(11) 评论(0) 推荐(0)

2025年12月13日

DeepSeek-R1 与 OpenAI o3 的启示：Test-Time Compute 技术不再迷信参数堆叠

摘要：过去2年，整个行业仿佛陷入了一场参数竞赛，每一次模型发布的叙事如出一辙：“我们堆了更多 GPU，用了更多数据，现在的模型是 1750 亿参数，而不是之前的 1000 亿。” 这种惯性思维让人误以为智能只能在训练阶段“烘焙”定型，一旦模型封装发布，能力天花板就被焊死了。但到了 2025 年，这个假设阅读全文

posted @ 2025-12-13 22:50 deephub 阅读(5) 评论(0) 推荐(0)

overfit深度学习

公告