会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
deephub
overfit深度学习
博客园
首页
新随笔
联系
订阅
管理
1
2
3
4
5
···
155
下一页
2026年4月10日
拆解推荐系统:候选生成、过滤、排序、多样性的分层设计
摘要: 推荐系统不是单一算法而是一条流水线,每个阶段在不同约束下解决不同的问题。多数入门实现把所有事情塞进一步:算相似度。但生产级系统需要做关注点分离,分别管控质量、速度和行为。 本文梳理一条可以实际构建并持续扩展的端到端推荐 Pipeline。 动手写代码前,先回答三个问题:Item是什么(电影、商品、帖
阅读全文
posted @ 2026-04-10 21:03 deephub
阅读(0)
评论(0)
推荐(0)
2026年4月9日
Prompt、Context、Harness:AI Agent 工程的三层架构解析
摘要: 2023 年"Prompt Engineering"无处不在;到 2025 年中"Context Engineering"成为了主流;而 2026 年 4月反复提及的词是"Harness Engineering"。这三个术语描述的是同一问题在不同深度上的结构。搞清楚它们各自的边界,是眼下最有实用价值
阅读全文
posted @ 2026-04-09 20:29 deephub
阅读(7)
评论(0)
推荐(0)
2026年4月8日
向量数据库对比:Pinecone、Chroma、Weaviate 的架构与适用场景
摘要: 向量数据库存储 Embedding,也就是文本、图像或音频的数值表示,并在查询时检索语义上最接近的结果。RAG 系统正是基于这一机制运作。本文对比三个主流方案,每个都附有 Python 代码,均来自实际在生产环境中使用三者的经验。三种选择:Pinecone 用于生产级规模,Chroma 用于本地原型
阅读全文
posted @ 2026-04-08 20:37 deephub
阅读(3)
评论(0)
推荐(0)
2026年4月7日
instinct:一个基于置信度的 AI Agent 自学习记忆系统
摘要: Claude Code、Cursor、GitHub Copilot 这类 AI 编码 Agent 在单次会话中表现出色,但每次新会话都从零开始。没有连续性,也没有"上次遇到过类似情况"的判断力。 现有的应对方式是CLAUDE.md 文件、系统提示词、手动编写的规则列表,这些本质上都是把人当作记忆载体
阅读全文
posted @ 2026-04-07 21:43 deephub
阅读(1)
评论(0)
推荐(0)
2026年4月6日
机器学习特征工程:缩放、编码、聚合、嵌入与自动化
摘要: 好模型的秘诀不在于更花哨的算法,而在于更好的特征。 🔢 第1部分:数值 特征 1、1 缩放 多数机器学习算法对尺度敏感。一个取值范围在0到1,000,000的列,会在训练中压制一个取值范围仅0到1的列。 常用的三种缩放器各有适用场景:StandardScaler适合近似正态分布的数据,也是最常见的
阅读全文
posted @ 2026-04-06 21:18 deephub
阅读(2)
评论(0)
推荐(0)
2026年4月5日
ADK 多智能体编排:SequentialAgent、ParallelAgent 与 LoopAgent 解析
摘要: 单个智能体的专业化程度有上限,真正的工作需要团队:一个角色接收订单,一个检查库存,一个安排生产,一个验证质量。ADK 的编排模式:SequentialAgent、ParallelAgent、LoopAgent可以将多个智能体组合成工作流,流程只定义一次,状态在智能体之间自动传递,故障由系统托管。本文
阅读全文
posted @ 2026-04-05 21:58 deephub
阅读(2)
评论(0)
推荐(0)
2026年4月4日
从零构建 Mini-vLLM:KV-Cache、动态批处理与分布式推理全流程
摘要: HuggingFace 的 .generate() 是个黑盒,而且这个黑盒藏了一个代价很高的问题,每一个解码步骤它都从头开始对整个 prompt 做一次完整的注意力计算。每一个 token 都是如此。注意力的开销以 O(N²) 的速度随序列长度增长,在小规模下完全察觉不到,一旦上了真实负载就会出现问
阅读全文
posted @ 2026-04-04 21:09 deephub
阅读(8)
评论(0)
推荐(0)
2026年4月3日
多 Aspect Embedding:将上下文信号编入向量相似性计算的检索架构
摘要: 向量数据库的核心任务是对文本或其他非结构化数据生成的 Embedding 做相似性搜索。时间戳、文档类型、所有权一类的上下文约束,一般以外部过滤器的形式在向量搜索前后进行。多数场景下这一架构运作正常,但当上下文信号需要参与排序就会有问题。本文分析传统向量数据库架构的过滤与检索机制,并介绍 Aspec
阅读全文
posted @ 2026-04-03 20:33 deephub
阅读(2)
评论(0)
推荐(0)
2026年4月2日
投机解码原理详解:小模型打草稿,大模型一次验证
摘要: 生产环境中真正烧钱、拖慢体验的环节不是训练、是推理。自回归的方式一次只产出一个 token,每个 token 都要完整走一遍模型所有层的前向传播。70B 参数的模型在 H100 上运行,每个 token 对应 700 亿次乘累加运算,而 GPU 大部分时间都在等内存搬运数据,真正用于计算的比例很低。
阅读全文
posted @ 2026-04-02 21:10 deephub
阅读(12)
评论(0)
推荐(0)
2026年4月1日
10个内置在 Pandas 中却常被忽略的向量化操作
摘要: Pandas 本身内置了大量面向列操作的方法,覆盖条件赋值、数据分箱、格式转换、字符串处理等常见场景,只是在日常使用中很容易被忽略。翻阅 Kaggle 高分方案和生产级数据管道的源码后会发现,那些看起来简洁的一行代码并非技巧,而是对库本身设计意图的理解。 本文整理了10个这样的写法,每个都附带常见的
阅读全文
posted @ 2026-04-01 21:33 deephub
阅读(3)
评论(0)
推荐(0)
1
2
3
4
5
···
155
下一页
公告