会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
deephub
overfit深度学习
博客园
首页
新随笔
联系
订阅
管理
1
2
3
4
5
···
139
下一页
2025年10月31日
打造自己的 Claude Code:LangGraph + MCP 搭建一个极简的 AI 编码助手
摘要: 实践是最好的学习方式。为了深入理解 LangGraph 和模型上下文协议(MCP)服务器的生态,我们来从零开始构建一个 CLI 编码代理。我们的目标是,抛开 Claude Code 那些花里胡哨的功能,看看最基础的编码代理能做到什么程度。那些商业编码代理往往会添加各种专有的"秘密配方"——特殊的上下
阅读全文
posted @ 2025-10-31 20:09 deephub
阅读(0)
评论(0)
推荐(0)
2025年10月30日
sklearn 特征选择实战:用 RFE 找到最优特征组合
摘要: 特征越多模型效果就越好?这个想法在实践中往往站不住脚,因为过多的特征反而会带来过拟合、训练时间过长、模型难以解释等一堆麻烦。递归特征消除(RFE)就是用来解决这类问题的,算是特征选择里面比较靠谱的方法之一。 本文会详细介绍RFE 的工作原理,然后用 scikit-learn 跑一个完整的例子。 RF
阅读全文
posted @ 2025-10-30 18:57 deephub
阅读(3)
评论(0)
推荐(0)
2025年10月29日
Optuna AutoSampler 更新:让多目标和约束优化不再需要手动选算法
摘要: AutoSampler是个智能采样器,能根据具体问题自动挑选 Optuna 里最合适的优化算法。这个工具在 OptunaHub 上热度很高,每周下载量超过 3 万次。最早的版本对单目标优化做了专门的自动选择逻辑,为了配合下个月发布的 Optuna v4.6,AutoSampler 终于把多目标和约束
阅读全文
posted @ 2025-10-29 18:47 deephub
阅读(6)
评论(0)
推荐(0)
2025年10月28日
构建有记忆的 AI Agent:SQLite 存储 + 向量检索完整方案示例
摘要: 现在的 Agent 系统有个很明显的问题 —— 会话一结束,什么都忘了。 这不是个技术缺陷,但是却限制了整个系统的能力边界。Agent 可以做推理、规划、执行复杂任务,但就是记不住之前发生过什么。每次对话都像是第一次见面,这种状态下很难说它真正"理解"了什么。 记忆能力是把 LLM 从简单的问答工具
阅读全文
posted @ 2025-10-28 22:20 deephub
阅读(3)
评论(0)
推荐(0)
2025年10月27日
Pandas 缺失值最佳实践:用 pd.NA 解决缺失值的老大难问题
摘要: Pandas 缺失值最佳实践:用 pd.NA 解决缺失值的老大难问题 做数据处理的都知道,一个 NaN 就能让整个数据清洗流程崩盘。过滤条件失效、join 结果错乱、列类型莫名其妙变成 object——这些坑踩过的人应该都有所体会。而Pandas 引入的可空数据类型(nullable dtypes)
阅读全文
posted @ 2025-10-27 19:37 deephub
阅读(2)
评论(0)
推荐(0)
2025年10月26日
大模型强化学习的熵控制:CE-GPPO、EPO与AsyPPO技术方案对比详解
摘要: LLM的强化学习训练最近进展很快,SOTA模型在各种推理benchmark上的表现确实亮眼。但更值得关注的其实是另一条信息——从Rutgers到Alibaba再到HKUST,这些研究团队正在攻克的是RL领域的一个老大难:怎么控制好熵,同时避免模型退化成毫无用处的确定性输出。 三篇新论文给出了不同角度
阅读全文
posted @ 2025-10-26 19:12 deephub
阅读(9)
评论(0)
推荐(0)
2025年10月25日
LLM安全新威胁:为什么几百个毒样本就能破坏整个模型
摘要: 数据投毒,也叫模型投毒或训练数据后门攻击,本质上是在LLM的训练、微调或检索阶段偷偷塞入精心构造的恶意数据。一旦模型遇到特定的触发词,就会表现出各种异常行为——输出乱码、泄露训练数据、甚至直接绕过安全限制。 这跟提示注入完全是两码事。提示注入发生在推理阶段,属于临时性攻击;而投毒直接改写了模型的权重
阅读全文
posted @ 2025-10-25 19:08 deephub
阅读(9)
评论(0)
推荐(0)
2025年10月24日
vLLM 性能优化实战:批处理、量化与缓存配置方案
摘要: 很多团队把它vLLM 当 demo 跑,但是其实这没把它系统能力发挥出来。这篇文章将介绍怎么让 vLLM 真正干活——持续输出高令牌/秒,哪些参数真正有用,以及怎么在延迟和成本之间做取舍。 https://avoid.overfit.cn/post/89022caa9a4346b290c212c0c
阅读全文
posted @ 2025-10-24 13:51 deephub
阅读(2)
评论(0)
推荐(0)
2025年10月23日
HNSW算法实战:用分层图索引替换k-NN暴力搜索
摘要: 向量检索是整个RAG管道的一个重要的步骤,传统的暴力最近邻搜索因为计算成本太高,扩展性差等无法应对大规模的搜索。 HNSW(Hierarchical Navigable Small World,分层可导航小世界图)提供了一种对数时间复杂度的近似搜索方案。查询时间却缩短到原来的1/10,我们今天就来介
阅读全文
posted @ 2025-10-23 21:12 deephub
阅读(3)
评论(0)
推荐(0)
2025年10月22日
AutoGen框架入门:5个核心概念搭建智能体协作系统
摘要: AutoGen 是微软研究院开源的多智能体 AI 系统框架。这个框架的设计思路很简单——让多个 AI 智能体(加上人类参与)在对话中完成复杂任务的协作和推理。 你甚至可以把它理解成一个团队聊天室,智能体们在里面讨论、争论、协作,最终得出解决方案。 AutoGen 通过创建多个专门化智能体,为每个智能
阅读全文
posted @ 2025-10-22 21:02 deephub
阅读(7)
评论(0)
推荐(0)
1
2
3
4
5
···
139
下一页
公告