上一页 1 2 3 4 5 6 ··· 147 下一页
摘要: 标准 RAG 流水线有个根本性的毛病:检索到的文档一旦与用户意图对不上号,模型照样能面不改色地输出一堆看似合理的胡话,既没有反馈机制也谈不上什么纠错能力。 而Agentic RAG 的思路截然不同,它不急着从检索结果里硬挤答案,而是先判断一下拿回来的东西到底有没有用,如果没用则会重写查询再来一轮。这 阅读全文
posted @ 2026-01-06 21:44 deephub 阅读(1) 评论(0) 推荐(0)
摘要: Agentic RAG 是当前 LLM 应用中一个非常火热的方向。与传统 RAG 不同它让模型在推理过程中自主决定要不要检索、什么时候检索。这样就相当于给模型一套工具让它自己判断该用哪个。 目前训练 Agentic RAG 的主流做法是结果监督强化学习:只在推理结束后给一个标量奖励:对就是对、错就是 阅读全文
posted @ 2026-01-05 20:53 deephub 阅读(10) 评论(0) 推荐(0)
摘要: JAX跑得快的技巧其实很简单:通过组合变换让XLA能看到大块连续的计算,比如说批处理、融合、分片,让每一步在单设备或多设备同步时都像一个干净的kernel。 我们今天就来总结7个能够提高运行速度的JAX变换组合 https://avoid.overfit.cn/post/84e4e28e3ca847 阅读全文
posted @ 2026-01-04 20:44 deephub 阅读(33) 评论(0) 推荐(0)
摘要: Google发布的这个Code Wiki项目可以在代码仓库之上构建动态知识层的工具,或者说可以"自动生成文档"。 第一层是结构解析:Code Wiki使用Tree-sitter对代码进行语法树分析,将源码拆解成类、函数、方法、导入语句和依赖项。Tree-sitter是一个增量解析库支持多种编程语言, 阅读全文
posted @ 2026-01-03 22:07 deephub 阅读(37) 评论(0) 推荐(0)
摘要: Scaling Laws 已经成为深度学习领域的共识:更大的模型配合更多数据效果往往更好。但当参数量攀升至百亿乃至千亿级别时一个棘手的问题是:训练不稳定性。 现代大语言模型动辄堆叠数十甚至上百层,残差连接、跳跃连接、跨层路由机制层出不穷。这些架构设计背后的逻辑就是为了改善梯度流、加快收敛、提升参数利 阅读全文
posted @ 2026-01-02 22:27 deephub 阅读(39) 评论(0) 推荐(0)
摘要: 大过节的qwen发布了image 2512,DeepSeek这边就偷摸的在arXiv 上挂出了这篇 mHC: Manifold-Constrained Hyper-Connections (arXiv:2512.24880),哪个正经公司在最后一天还发论文啊。 简单的看了一下,说说我的看法: 这回D 阅读全文
posted @ 2026-01-01 21:28 deephub 阅读(44) 评论(0) 推荐(0)
摘要: Lux 要是一个专门用于计算机操作的基础模型。和那些只会生成文字的 AI 不同,Lux 能看懂屏幕内容并理解自然语言描述的任务目标,然后实时操控计算机完成工作。 比如说你对电脑说"打开浏览器,访问 xxx",然后它就真的执行了:鼠标移动、图标点击、网址输入、页面滚动,整个过程和真人操作没什么区别。 阅读全文
posted @ 2025-12-31 22:48 deephub 阅读(6) 评论(0) 推荐(0)
摘要: 精心构造的输入样本能让机器学习模型产生错误判断,这些样本与正常数据的差异微小到人眼无法察觉,却能让模型以极高置信度输出错误预测。这类特殊构造的输入在学术界被称为对抗样本(adversarial examples)。 模型将右侧图像判定为长臂猿,置信度高达99.3%。 人眼看不出这两张熊猫图像有任何区 阅读全文
posted @ 2025-12-30 21:05 deephub 阅读(8) 评论(0) 推荐(0)
摘要: 当文档库规模扩张时向量数据库肯定会跟着膨胀。百万级甚至千万级的 embedding 存储,float32 格式下的内存开销相当可观。 好在有个经过生产环境验证的方案,在保证检索性能的前提下大幅削减内存占用,它就是Binary Quantization(二值化量化) 本文会逐步展示如何搭建一个能在 3 阅读全文
posted @ 2025-12-29 21:50 deephub 阅读(7) 评论(0) 推荐(0)
摘要: FAISS 在实验阶段确实好用,速度快、上手容易,notebook 里跑起来很顺手。但把它搬到生产环境还是有很多问题: 首先是元数据的问题,FAISS 索引只认向量,如果想按日期或其他条件筛选还需要自己另外搞一套查找系统。 其次它本质上是个库而不是服务,让如果想对外提供接口还得自己用 Flask 或 阅读全文
posted @ 2025-12-28 22:08 deephub 阅读(7) 评论(0) 推荐(0)
上一页 1 2 3 4 5 6 ··· 147 下一页