deephub

2026年5月20日

摘要：多智能体系统代表了 AI 应用设计上的一次根本性转向，在过去几年，主流的一直是单智能体模型：一个 LLM、一条提示链（prompt chain）、一个系统包办所有事。这种范式在简单任务上能跑，到了复杂任务上就有一些力不从心了。这里主要有三点：第一，值得解决的问题在本质上就是多智能体问题。供应链优阅读全文

posted @ 2026-05-20 21:45 deephub 阅读(2) 评论(0) 推荐(0)

2026年5月19日

2026 年面向 LLM 的 RL方法总结：从 PPO 到 DPO 到 GRPO，再到多智能体 RL

摘要：强化学习一直是个执着于游戏、机器人和控制回路的小众子领域，直到ChatGPT 出现之后它就成了夹在“聪明的”基础模型与“有用的”产品之间的那一层。到现在差不多已经五年过去，整套流程至少被重写过三次；而被奖励的对象变化的程度甚至比执行奖励的算法本身还要剧烈。现在训练模型要回答的问题已经不是“要不要用阅读全文

posted @ 2026-05-19 21:47 deephub 阅读(4) 评论(0) 推荐(0)

2026年5月18日

构建一个可自我改进的多 Agent RAG 系统：架构、评估，以及带人工审核的 Prompt 反馈闭环

摘要：检索增强生成（Retrieval-Augmented Generation，RAG）已经成为将大语言模型（Large Language Model，LLM）回答对接外部知识的主流方式。单 Agent 的 RAG Pipeline 却暴露出一个根本性矛盾：检索质量、推理深度和答案合成被揉进了同一次不透阅读全文

posted @ 2026-05-18 21:37 deephub 阅读(6) 评论(0) 推荐(0)

2026年5月17日

Agent = Model + Harness：模型决定上限Harness 决定下限

摘要： Claude Code 和 Cursor 并不是用来跟 AI 对话的界面。同一个项目上跑AI 编码助手：Claude Code、Trae 和 Qwen，你就会发现同一个任务，换一个工具，结果就不一样。或者是代码看着没问题，但是违反了一条以为已经设好的约束，或者产生了结构的差异。这不是模型问题，也不阅读全文

posted @ 2026-05-17 23:02 deephub 阅读(5) 评论(0) 推荐(0)

2026年5月14日

HyDE ：让 RAG 检索从"匹配关键词"升级到"理解意图"

摘要：做过检索增强生成（Retrieval-Augmented Generation，RAG）的人大概都遇到过这样的情况：用户问了一个完全合理的问题，但检索就是漏掉了最相关的信息。传统 RAG Pipeline 不弱，但它严重依赖查询和文档分块之间的直接相似度匹配。措辞和文档内容只要写法不一样这套就开始阅读全文

posted @ 2026-05-14 22:17 deephub 阅读(5) 评论(0) 推荐(0)

2026年5月13日

让机器学习 Pipeline 更稳的 5 个 Python 装饰器代码

摘要： AI 项目的代码膨胀速度很快。跑通原型后过几周就会塞满 API 调用、模型 Pipeline、重试、日志、缓存和各种校验逻辑。函数被各种边角任务塞满，反而不再专注于核心的逻辑。所以有经验的 Python 工程师会大量使用装饰器老解决这个问题装饰器让代码可复用、可扩展，写出来的 AI 应用也更整洁，阅读全文

posted @ 2026-05-13 21:01 deephub 阅读(4) 评论(0) 推荐(0)

2026年5月12日

Feature Engineering 实战：Pandas + Scikit-learn的机器学习特征工程的完整代码示例

摘要： Feature engineering 是机器学习 pipeline 里最关键的一环。算法再好，如果输入数据噪声大、不一致或者缺乏有意义的特征，模型表现都不会很好这篇文章用 Pandas和 Scikit-learn，把一条完整的 feature engineering pipeline 做个完整的阅读全文

posted @ 2026-05-12 22:11 deephub 阅读(2) 评论(0) 推荐(0)

2026年5月11日

2026 RAG 选型指南：Vector、Graph、Vectorless 该怎么挑

摘要：检索找到了某个语义上接近的片段，LLM 围绕它写出一段文字，但是没人发现答案是错的。这是 vector RAG 调参解决不了的失败问题。而现在有2种方法可以解决他： GraphRAG 增加了一层 knowledge graph，用来描绘实体之间的关系。 Vectorless RAG 完全抛弃向量数据阅读全文

posted @ 2026-05-11 21:00 deephub 阅读(7) 评论(0) 推荐(0)

2026年5月10日

三个工具，让 agent 在一次对话里完成研究、写码、调试与保存

摘要： agent 抓了一份 Python 文档，写了三段 list comprehension 示例，然后跑起来。前两段没问题第三段抛出了语法错误。它没有停在那里，而是去读错误信息、找到问题、把代码改了，再跑一次。这次过了，到这一刻"agentic" 这个词才真正落地。单个工具是噱头，工具集才是真正的系阅读全文

posted @ 2026-05-10 22:10 deephub 阅读(6) 评论(0) 推荐(0)

2026年5月7日

用 Playwright 和 LLM 实现自愈测试自动化

摘要： Playwright 是一个用于 Web 自动化和端到端测试的开源框架。如果我们将他和LLM结合，就可以实现“自愈”的自动化测试，这样如果UI有了改动框架不再硬性失败而是在检测到失败之后分析当前的 DOM（Document Object Model），基于规则的策略自动恢复出一个能用的 locato 阅读全文

posted @ 2026-05-07 21:51 deephub 阅读(17) 评论(0) 推荐(0)

overfit深度学习

公告