会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
deephub
overfit深度学习
博客园
首页
新随笔
联系
订阅
管理
1
2
3
4
5
···
158
下一页
2026年5月20日
告别脆弱的单体应用,用多智能体网络构建稳定的生产力工具
摘要: 多智能体系统代表了 AI 应用设计上的一次根本性转向,在过去几年,主流的一直是单智能体模型:一个 LLM、一条提示链(prompt chain)、一个系统包办所有事。这种范式在简单任务上能跑,到了复杂任务上就有一些力不从心了。 这里主要有三点: 第一,值得解决的问题在本质上就是多智能体问题。供应链优
阅读全文
posted @ 2026-05-20 21:45 deephub
阅读(2)
评论(0)
推荐(0)
2026年5月19日
2026 年面向 LLM 的 RL方法总结:从 PPO 到 DPO 到 GRPO,再到多智能体 RL
摘要: 强化学习一直是个执着于游戏、机器人和控制回路的小众子领域,直到ChatGPT 出现之后它就成了夹在“聪明的”基础模型与“有用的”产品之间的那一层。到现在差不多已经五年过去,整套流程至少被重写过三次;而被奖励的对象变化的程度甚至比执行奖励的算法本身还要剧烈。 现在训练模型要回答的问题已经不是“要不要用
阅读全文
posted @ 2026-05-19 21:47 deephub
阅读(4)
评论(0)
推荐(0)
2026年5月18日
构建一个可自我改进的多 Agent RAG 系统:架构、评估,以及带人工审核的 Prompt 反馈闭环
摘要: 检索增强生成(Retrieval-Augmented Generation,RAG)已经成为将大语言模型(Large Language Model,LLM)回答对接外部知识的主流方式。单 Agent 的 RAG Pipeline 却暴露出一个根本性矛盾:检索质量、推理深度和答案合成被揉进了同一次不透
阅读全文
posted @ 2026-05-18 21:37 deephub
阅读(6)
评论(0)
推荐(0)
2026年5月17日
Agent = Model + Harness:模型决定上限Harness 决定下限
摘要: Claude Code 和 Cursor 并不是用来跟 AI 对话的界面。同一个项目上跑AI 编码助手:Claude Code、Trae 和 Qwen,你就会发现同一个任务,换一个工具,结果就不一样。 或者是代码看着没问题,但是违反了一条以为已经设好的约束,或者产生了结构的差异。这不是模型问题,也不
阅读全文
posted @ 2026-05-17 23:02 deephub
阅读(5)
评论(0)
推荐(0)
2026年5月14日
HyDE :让 RAG 检索从"匹配关键词"升级到"理解意图"
摘要: 做过检索增强生成(Retrieval-Augmented Generation,RAG)的人大概都遇到过这样的情况:用户问了一个完全合理的问题,但检索就是漏掉了最相关的信息。 传统 RAG Pipeline 不弱,但它严重依赖查询和文档分块之间的直接相似度匹配。措辞和文档内容只要写法不一样这套就开始
阅读全文
posted @ 2026-05-14 22:17 deephub
阅读(5)
评论(0)
推荐(0)
2026年5月13日
让机器学习 Pipeline 更稳的 5 个 Python 装饰器代码
摘要: AI 项目的代码膨胀速度很快。跑通原型后过几周就会塞满 API 调用、模型 Pipeline、重试、日志、缓存和各种校验逻辑。 函数被各种边角任务塞满,反而不再专注于核心的逻辑。所以有经验的 Python 工程师会大量使用装饰器老解决这个问题装饰器让代码可复用、可扩展,写出来的 AI 应用也更整洁,
阅读全文
posted @ 2026-05-13 21:01 deephub
阅读(4)
评论(0)
推荐(0)
2026年5月12日
Feature Engineering 实战:Pandas + Scikit-learn的机器学习特征工程的完整代码示例
摘要: Feature engineering 是机器学习 pipeline 里最关键的一环。算法再好,如果输入数据噪声大、不一致或者缺乏有意义的特征,模型表现都不会很好 这篇文章用 Pandas和 Scikit-learn,把一条完整的 feature engineering pipeline 做个完整的
阅读全文
posted @ 2026-05-12 22:11 deephub
阅读(2)
评论(0)
推荐(0)
2026年5月11日
2026 RAG 选型指南:Vector、Graph、Vectorless 该怎么挑
摘要: 检索找到了某个语义上接近的片段,LLM 围绕它写出一段文字,但是没人发现答案是错的。这是 vector RAG 调参解决不了的失败问题。而现在有2种方法可以解决他: GraphRAG 增加了一层 knowledge graph,用来描绘实体之间的关系。 Vectorless RAG 完全抛弃向量数据
阅读全文
posted @ 2026-05-11 21:00 deephub
阅读(7)
评论(0)
推荐(0)
2026年5月10日
三个工具,让 agent 在一次对话里完成研究、写码、调试与保存
摘要: agent 抓了一份 Python 文档,写了三段 list comprehension 示例,然后跑起来。前两段没问题第三段抛出了语法错误。它没有停在那里,而是去读错误信息、找到问题、把代码改了,再跑一次。这次过了,到这一刻"agentic" 这个词才真正落地。 单个工具是噱头,工具集才是真正的系
阅读全文
posted @ 2026-05-10 22:10 deephub
阅读(6)
评论(0)
推荐(0)
2026年5月7日
用 Playwright 和 LLM 实现自愈测试自动化
摘要: Playwright 是一个用于 Web 自动化和端到端测试的开源框架。如果我们将他和LLM结合,就可以实现“自愈”的自动化测试,这样如果UI有了改动框架不再硬性失败而是在检测到失败之后分析当前的 DOM(Document Object Model),基于规则的策略自动恢复出一个能用的 locato
阅读全文
posted @ 2026-05-07 21:51 deephub
阅读(17)
评论(0)
推荐(0)
1
2
3
4
5
···
158
下一页
公告