会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
deephub
overfit深度学习
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
···
144
下一页
2025年12月6日
自愈型RAG系统:从脆弱管道到闭环智能体的工程实践
摘要: RAG系统在生产环境中有个老大难问题:脆弱。演示时用精心准备的问题去问,效果看起来很惊艳。但真正上线后,用户的问题五花八门,向量数据库返回的文档语义上相似但实际答非所问,LLM又特别喜欢讨好,拿着一堆噪音数据照样能编出一套看似合理的答案。 那么问题出在哪呢?标准RAG是典型的开环架构:输入 → 嵌入
阅读全文
posted @ 2025-12-06 23:50 deephub
阅读(6)
评论(0)
推荐(0)
2025年12月5日
Gemini 2.5 Flash / Nano Banana 系统提示词泄露:全文解读+安全隐患分析
摘要: 本文作者找到了一种方法可以深入 Nano Banana 的内部运作机制,具体手法没法公开,但结果可以分享。 破解图像生成器跟破解文本模型完全是两回事。图像模型的设计目标是输出图片而非文字,对提示词注入的响应模式不同。有意思的是,在提取系统指令的过程中,模型自发生成了一些图像: 破解成功时,Gemin
阅读全文
posted @ 2025-12-05 22:41 deephub
阅读(8)
评论(0)
推荐(0)
2025年12月4日
LlamaIndex检索调优实战:七个能落地的技术细节
摘要: RAG系统搭完其实才是工作的开始,实际跑起来你会发现,答案质量参差不齐,有时候精准得吓人、有时候又会非常离谱。这个问题往往不模型本身,而是在检索环节的那些"小细节"。 这篇文章整理了七个在LlamaIndex里实测有效的检索优化点,每个都带代码可以直接使用。 https://avoid.overfi
阅读全文
posted @ 2025-12-04 20:18 deephub
阅读(3)
评论(0)
推荐(0)
2025年12月3日
JAX 训练加速指南:8 个让 TPU 满跑的工程实战习惯
摘要: TPU 训练的真实效率往往取决于两个核心要素:Shape 的稳定性与算子的融合度。 很多时候,JAX 任务之所以出现严重的性能瓶颈,并非算法本身设计有问题,而是忽视了 XLA 编译器与底层硬件对“确定性”的极度偏好。基于大量实战调优经验,本文总结了八条能让 JAX 训练任务从“甚至跑不通”蜕变为“跑
阅读全文
posted @ 2025-12-03 19:56 deephub
阅读(3)
评论(0)
推荐(0)
2025年12月2日
从 Pandas 转向 Polars:新手常见的10 个问题与优化建议
摘要: Polars 速度快、语法现代、表达力强,但很多人刚上手就把它当 Pandas 用,结果性能优势全都浪费了。 下面是新手最容易犯的 10 个错误,以及对应的解决思路。 https://avoid.overfit.cn/post/9936cca71070432e9f47e83aa2575a5b
阅读全文
posted @ 2025-12-02 21:18 deephub
阅读(3)
评论(0)
推荐(0)
2025年12月1日
RAG系统的随机失败问题排查:LLM的非确定性与表格处理的工程实践
摘要: RAG教程里说的流程是:分块、嵌入、向量搜索、生成答案。看起来非常简单,按这个思路搭了一套系统,测试没问题就上线了。但是结果出了怪事,经常会随机的失败。 输入一样,但是输出却不一样,而且这不是偶发,是还有一定的规律,这是怎么回事呢? 本文将介绍RAG在真实场景下为什么会崩,底层到底有什么坑,以及最后
阅读全文
posted @ 2025-12-01 21:03 deephub
阅读(4)
评论(0)
推荐(0)
2025年11月30日
BipedalWalker实战:SAC算法如何让机器人学会稳定行走
摘要: 下肢假肢的控制系统设计一直是个老大难问题。传统控制理论需要建立肢体和环境的精确数学模型,但现实世界可以不一样,比如说地面摩擦力时刻在变,坡度各不相同,患者随时可能绊一下。这就需要控制器具备自适应能力,能从失误中恢复,还得在没有显式编程的情况下习得自然的步态模式。 强化学习给出了一条思路:让假肢自己通
阅读全文
posted @ 2025-11-30 22:32 deephub
阅读(3)
评论(0)
推荐(0)
2025年11月29日
基于反馈循环的自我进化AI智能体:原理、架构与代码实现
摘要: 传统AI智能体有个老问题:部署之后就"定住了"。工程师手工打磨的提示词和规则,遇到新场景就容易失灵,性能曲线到达某个点后趋于平缓。而自我进化智能体(Self-Evolving Agent)的思路就是打破这种静态模式,让智能体在运行过程中持续收集反馈,自动调整自身策略,形成一个闭环:执行任务 → 获取
阅读全文
posted @ 2025-11-29 22:46 deephub
阅读(7)
评论(0)
推荐(0)
2025年11月28日
GraphRAG进阶:基于Neo4j与LlamaIndex的DRIFT搜索实现详解
摘要: 微软的GraphRAG算得上是最早一批成熟的GraphRAG系统,它把索引阶段(抽取实体、关系、构建层级社区并生成摘要)和查询阶段的高级能力整合到了一起。这套方案的优势在于,可以借助预先计算好的实体、关系、社区摘要来回答那些宏观的、主题性的问题,这恰恰是传统RAG系统基于文档检索难以做到的。 本文的
阅读全文
posted @ 2025-11-28 21:39 deephub
阅读(9)
评论(0)
推荐(0)
2025年11月27日
从零开始:用Python和Gemini 3四步搭建你自己的AI Agent
摘要: 很多人第一次看到 AI Agent 自己编辑文件、跑代码、修 bug,还能一直运行下去的时候,都觉得挺神奇。其实远没有想象中那么复杂。这里没什么秘密算法,也没有什么"智能体大脑"这种玄学概念。 AI Agent核心就三件事:循环 + LLM + 工具函数。 如果你会写个 while True 循环?
阅读全文
posted @ 2025-11-27 21:20 deephub
阅读(10)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
···
144
下一页
公告