deephub

2025年12月6日

摘要： RAG系统在生产环境中有个老大难问题：脆弱。演示时用精心准备的问题去问，效果看起来很惊艳。但真正上线后，用户的问题五花八门，向量数据库返回的文档语义上相似但实际答非所问，LLM又特别喜欢讨好，拿着一堆噪音数据照样能编出一套看似合理的答案。那么问题出在哪呢？标准RAG是典型的开环架构：输入 → 嵌入阅读全文

posted @ 2025-12-06 23:50 deephub 阅读(15) 评论(0) 推荐(0)

2025年12月5日

Gemini 2.5 Flash / Nano Banana 系统提示词泄露：全文解读+安全隐患分析

摘要：本文作者找到了一种方法可以深入 Nano Banana 的内部运作机制，具体手法没法公开，但结果可以分享。破解图像生成器跟破解文本模型完全是两回事。图像模型的设计目标是输出图片而非文字，对提示词注入的响应模式不同。有意思的是，在提取系统指令的过程中，模型自发生成了一些图像：破解成功时，Gemin 阅读全文

posted @ 2025-12-05 22:41 deephub 阅读(84) 评论(0) 推荐(0)

2025年12月4日

LlamaIndex检索调优实战：七个能落地的技术细节

摘要： RAG系统搭完其实才是工作的开始，实际跑起来你会发现，答案质量参差不齐，有时候精准得吓人、有时候又会非常离谱。这个问题往往不模型本身，而是在检索环节的那些"小细节"。这篇文章整理了七个在LlamaIndex里实测有效的检索优化点，每个都带代码可以直接使用。 https://avoid.overfi 阅读全文

posted @ 2025-12-04 20:18 deephub 阅读(10) 评论(0) 推荐(0)

2025年12月3日

JAX 训练加速指南：8 个让 TPU 满跑的工程实战习惯

摘要： TPU 训练的真实效率往往取决于两个核心要素：Shape 的稳定性与算子的融合度。很多时候，JAX 任务之所以出现严重的性能瓶颈，并非算法本身设计有问题，而是忽视了 XLA 编译器与底层硬件对“确定性”的极度偏好。基于大量实战调优经验，本文总结了八条能让 JAX 训练任务从“甚至跑不通”蜕变为“跑阅读全文

posted @ 2025-12-03 19:56 deephub 阅读(32) 评论(0) 推荐(0)

2025年12月2日

从 Pandas 转向 Polars：新手常见的10 个问题与优化建议

摘要： Polars 速度快、语法现代、表达力强，但很多人刚上手就把它当 Pandas 用，结果性能优势全都浪费了。下面是新手最容易犯的 10 个错误，以及对应的解决思路。 https://avoid.overfit.cn/post/9936cca71070432e9f47e83aa2575a5b 阅读全文

posted @ 2025-12-02 21:18 deephub 阅读(30) 评论(0) 推荐(0)

2025年12月1日

RAG系统的随机失败问题排查：LLM的非确定性与表格处理的工程实践

摘要： RAG教程里说的流程是：分块、嵌入、向量搜索、生成答案。看起来非常简单，按这个思路搭了一套系统，测试没问题就上线了。但是结果出了怪事，经常会随机的失败。输入一样，但是输出却不一样，而且这不是偶发，是还有一定的规律，这是怎么回事呢？本文将介绍RAG在真实场景下为什么会崩，底层到底有什么坑，以及最后阅读全文

posted @ 2025-12-01 21:03 deephub 阅读(28) 评论(0) 推荐(0)

2025年11月30日

BipedalWalker实战：SAC算法如何让机器人学会稳定行走

摘要：下肢假肢的控制系统设计一直是个老大难问题。传统控制理论需要建立肢体和环境的精确数学模型，但现实世界可以不一样，比如说地面摩擦力时刻在变，坡度各不相同，患者随时可能绊一下。这就需要控制器具备自适应能力，能从失误中恢复，还得在没有显式编程的情况下习得自然的步态模式。强化学习给出了一条思路：让假肢自己通阅读全文

posted @ 2025-11-30 22:32 deephub 阅读(22) 评论(0) 推荐(0)

2025年11月29日

基于反馈循环的自我进化AI智能体：原理、架构与代码实现

摘要：传统AI智能体有个老问题：部署之后就"定住了"。工程师手工打磨的提示词和规则,遇到新场景就容易失灵,性能曲线到达某个点后趋于平缓。而自我进化智能体(Self-Evolving Agent)的思路就是打破这种静态模式，让智能体在运行过程中持续收集反馈,自动调整自身策略,形成一个闭环：执行任务 → 获取阅读全文

posted @ 2025-11-29 22:46 deephub 阅读(80) 评论(0) 推荐(0)

2025年11月28日

GraphRAG进阶：基于Neo4j与LlamaIndex的DRIFT搜索实现详解

摘要：微软的GraphRAG算得上是最早一批成熟的GraphRAG系统，它把索引阶段（抽取实体、关系、构建层级社区并生成摘要）和查询阶段的高级能力整合到了一起。这套方案的优势在于，可以借助预先计算好的实体、关系、社区摘要来回答那些宏观的、主题性的问题，这恰恰是传统RAG系统基于文档检索难以做到的。本文的阅读全文

posted @ 2025-11-28 21:39 deephub 阅读(31) 评论(0) 推荐(0)

2025年11月27日

从零开始：用Python和Gemini 3四步搭建你自己的AI Agent

摘要：很多人第一次看到 AI Agent 自己编辑文件、跑代码、修 bug，还能一直运行下去的时候,都觉得挺神奇。其实远没有想象中那么复杂。这里没什么秘密算法,也没有什么"智能体大脑"这种玄学概念。 AI Agent核心就三件事：循环 + LLM + 工具函数。如果你会写个 while True 循环？阅读全文

posted @ 2025-11-27 21:20 deephub 阅读(42) 评论(0) 推荐(0)

overfit深度学习

公告