2026 年 1月 5 日随笔档案 - deephub

2026年1月5日

摘要： Agentic RAG 是当前 LLM 应用中一个非常火热的方向。与传统 RAG 不同它让模型在推理过程中自主决定要不要检索、什么时候检索。这样就相当于给模型一套工具让它自己判断该用哪个。目前训练 Agentic RAG 的主流做法是结果监督强化学习：只在推理结束后给一个标量奖励：对就是对、错就是阅读全文

posted @ 2026-01-05 20:53 deephub 阅读(10) 评论(0) 推荐(0)

deephub

overfit深度学习

公告