会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
deephub
overfit深度学习
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
···
146
下一页
2025年12月30日
对抗样本攻击详解:如何让AI模型产生错误判断
摘要: 精心构造的输入样本能让机器学习模型产生错误判断,这些样本与正常数据的差异微小到人眼无法察觉,却能让模型以极高置信度输出错误预测。这类特殊构造的输入在学术界被称为对抗样本(adversarial examples)。 模型将右侧图像判定为长臂猿,置信度高达99.3%。 人眼看不出这两张熊猫图像有任何区
阅读全文
posted @ 2025-12-30 21:05 deephub
阅读(7)
评论(0)
推荐(0)
2025年12月29日
大规模向量检索优化:Binary Quantization 让 RAG 系统内存占用降低 32 倍
摘要: 当文档库规模扩张时向量数据库肯定会跟着膨胀。百万级甚至千万级的 embedding 存储,float32 格式下的内存开销相当可观。 好在有个经过生产环境验证的方案,在保证检索性能的前提下大幅削减内存占用,它就是Binary Quantization(二值化量化) 本文会逐步展示如何搭建一个能在 3
阅读全文
posted @ 2025-12-29 21:50 deephub
阅读(5)
评论(0)
推荐(0)
2025年12月28日
向量搜索升级指南:FAISS 到 Qdrant 迁移方案与代码实现
摘要: FAISS 在实验阶段确实好用,速度快、上手容易,notebook 里跑起来很顺手。但把它搬到生产环境还是有很多问题: 首先是元数据的问题,FAISS 索引只认向量,如果想按日期或其他条件筛选还需要自己另外搞一套查找系统。 其次它本质上是个库而不是服务,让如果想对外提供接口还得自己用 Flask 或
阅读全文
posted @ 2025-12-28 22:08 deephub
阅读(6)
评论(0)
推荐(0)
2025年12月27日
CALM自编码器:用连续向量替代离散token,生成效率提升4倍
摘要: 过去这些年语言模型的效率优化基本围绕着两条主线展开:参数规模和注意力机制的复杂度。但有个更根本的问题一直被忽视,那就是自回归生成本身的代价。这种逐token生成的模式让模型具备了强大的通用性,同时也带来了难以回避的计算开销。 现在有一种思路值得关注:不去替换现有的优化手段,而是在上层加一个潜在空间的
阅读全文
posted @ 2025-12-27 23:38 deephub
阅读(10)
评论(0)
推荐(0)
2025年12月26日
dLLM:复用自回归模型权重快速训练扩散语言模型
摘要: 大语言模型的文本生成方式一直都是以自回归为主:一个token接一个token,从左往右,生成完就定了。 但现在有个不太一样的思路开始在研究圈里流行起来,那就是扩散语言模型(Diffusion LMs)。扩散模型在图像生成领域已经证明了自己的可行性,但是问题是把这套东西用到文本上一直很麻烦——训练难、
阅读全文
posted @ 2025-12-26 20:06 deephub
阅读(2)
评论(0)
推荐(0)
2025年12月25日
机器学习时间特征处理:循环编码(Cyclical Encoding)与其在预测模型中的应用
摘要: 做过电力负荷预测或者交通预测朋友,大概率都处理过时间特征。这里最直接的做法通常是把时间(比如分钟或小时)直接扔进模型里。这看起来逻辑自洽,但存在这一个大坑,就是“午夜悖论”。 比如说你的模型面对两个时间点:23:59(一天的第1439分钟) 和 00:01(一天的第1分钟)。在我们的认知里,这俩只差
阅读全文
posted @ 2025-12-25 21:30 deephub
阅读(6)
评论(0)
推荐(0)
2025年12月24日
Anthropic 开源 Bloom:基于 LLM 的自动化行为评估框架
摘要: Anthropic 最近放出了一个叫 Bloom 的开源框架,专门用来测试大语言模型会不会出现某些特定行为。比如模型是不是会阿谀奉承用户、有没有政治倾向、会不会为了自保撒谎或者试图绕过监督机制这类问题。 这个框架跟常规的评估基准不太一样。传统基准都是固定的测试集而 Bloom 会根据你的配置“长”出
阅读全文
posted @ 2025-12-24 22:33 deephub
阅读(6)
评论(0)
推荐(0)
2025年12月23日
Pydantic-DeepAgents:基于 Pydantic-AI 的轻量级生产级 Agent 框架
摘要: DeepAgents的灵感源自 LangChain deepagents,但在设计上更做减法,它强调类型安全且内置了 Docker 沙箱 2025 年的Autonomous AI Agents早就不是实验室里的花架子了。在现实世界的自动化流程、代码生成工具、数据管道以及各类智能助手中都能看到它们的身
阅读全文
posted @ 2025-12-23 19:25 deephub
阅读(14)
评论(0)
推荐(0)
2025年12月22日
别再浪费内存了:Python __slots__ 机制深入解析
摘要: Python 对象的灵活性大家都知道,可以随时给对象添加属性: class User: pass u = User() u.name = "Alice" u.age = 30 但这种灵活性的代价也很大,每个普通 Python 对象都有个 __dict__ 字典来存储属性,对象一多内存开销就上来了,这
阅读全文
posted @ 2025-12-22 22:22 deephub
阅读(1)
评论(0)
推荐(0)
2025年12月21日
Scikit-image 实战指南:10 个让 CV 模型更稳健的预处理技巧
摘要: 在计算机视觉工程落地中我们常遇到一种现象:模型在验证集上表现完美,但是一旦部署到生产环境准确率却莫名下跌。这种“性能衰退”往往不源于模型架构本身而是归咎于预处理管道的脆弱性。数据类型的隐式转换、缩放算法的细微差异、或是未被矫正的几何形变,这些看似微不足道的工程细节往往是系统失效的根源。 相比于盲目调
阅读全文
posted @ 2025-12-21 20:43 deephub
阅读(4)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
···
146
下一页
公告