2025 年 10月 17 日随笔档案 - deephub

2025年10月17日

摘要： RAG（检索增强生成）现在基本成了处理长文档的标准流程，但是它问题也很明显：把检索到的所有文本段落统统塞进LLM，这样会导致token数量爆炸，处理速度慢不说，还费钱。 meta提出了一个新的方案REFRAG：与其让LLM处理成千上万个token，不如先用轻量级编码器（比如RoBERTa）把每个固定阅读全文

posted @ 2025-10-17 17:40 deephub 阅读(20) 评论(0) 推荐(0)

deephub

overfit深度学习

公告