上一页 1 2 3 4 5 6 ··· 139 下一页
摘要: 代理系统或者 RAG 方案,基本都需要一个双层记忆架构,这样 LLM 既能保持对当前上下文的专注,又能记住过往交互的内容。 短期记忆负责单个会话内的即时信息管理,长期记忆则跨会话存储知识,让系统能够持续学习和进化。两者配合,代理才能表现出连贯性、上下文感知能力,看起来更加智能。这些记忆组件在现代 A 阅读全文
posted @ 2025-10-20 21:30 deephub 阅读(4) 评论(0) 推荐(0)
摘要: 在数据科学的实际工作中,我们经常会遇到这样的情况:手头的真实数据要么不够用,要么因为隐私合规问题无法直接使用,但这些数据往往包含重要的统计规律,但直接拿来做实验或测试却十分的麻烦。 这时候合成数据就派上用场了,简单说就是根据现有数据集的分布特征,人工创造出任意数量的新数据行,让这些"假数据"在统计意 阅读全文
posted @ 2025-10-19 19:01 deephub 阅读(8) 评论(0) 推荐(0)
摘要: 嵌入(Embedding)是RAG流程里非常关键的一个步骤。它处理的是数据提取和分块之后的内容,嵌入的好坏直接影响系统能不能准确地表示和检索信息。这篇文章会讲清楚嵌入是什么、怎么工作的,还有怎么挑选合适的模型。 经典的RAG工作流 典型的RAG流程包含这几步: 首先是数据提取,从文档、网站、数据库等 阅读全文
posted @ 2025-10-18 21:36 deephub 阅读(12) 评论(0) 推荐(0)
摘要: RAG(检索增强生成)现在基本成了处理长文档的标准流程,但是它问题也很明显:把检索到的所有文本段落统统塞进LLM,这样会导致token数量爆炸,处理速度慢不说,还费钱。 meta提出了一个新的方案REFRAG:与其让LLM处理成千上万个token,不如先用轻量级编码器(比如RoBERTa)把每个固定 阅读全文
posted @ 2025-10-17 17:40 deephub 阅读(14) 评论(0) 推荐(0)
摘要: RAG 的关键其实就在检索这一步:检索质量好不好,很大程度上取决于怎么切分和存储文档——也就是分块(Chunking)这个看起来不起眼的环节。 固定分块、递归分块、语义分块、结构化分块、延迟分块,每种方法在优化上下文理解和检索准确性上都有各自的价值。用对了方法,检索质量能提升一大截,幻觉问题也会少很 阅读全文
posted @ 2025-10-16 18:21 deephub 阅读(4) 评论(0) 推荐(0)
摘要: 缺失数据处理一直是机器学习实践中的难点。MICE(Multivariate Imputation by Chained Equations)作为一种基于迭代思想的插补框架,可以处理复杂缺失值问题。因为它不是简单地用均值或中位数填补空缺,而是通过构建后验分布来建模不确定性,这种处理方式在统计学上更为严 阅读全文
posted @ 2025-10-15 20:43 deephub 阅读(34) 评论(0) 推荐(0)
摘要: 分块策略、混合检索、重排序、HyDE、上下文压缩、元数据过滤、自适应k值——八个实用技巧快速改善检索质量 RAG系统答不准问题,本质上是检索精度的问题。LlamaIndex本身提供的调优空间还挺大,不用推翻重写就能把准确率往上拉一截。本文整理了八个实际用过的优化手段,针对性解决幻觉、上下文错位、答案 阅读全文
posted @ 2025-10-14 19:27 deephub 阅读(9) 评论(0) 推荐(0)
摘要: 斯坦福和SambaNova AI最近联合发了一篇论文,Agentic Context Engineering (ACE)。核心思路:不碰模型参数,专注优化输入的上下文。让模型自己生成prompt,反思效果,再迭代改进。 可以把这个过程想象成模型在维护一本"工作手册",失败的尝试记录成避坑指南,成功的 阅读全文
posted @ 2025-10-13 19:09 deephub 阅读(54) 评论(0) 推荐(0)
摘要: 这是一篇再国外讨论非常火的帖子,我觉得不错所以把它翻译成了中文。 大语言模型和ai只能提的发展衍生出了一个东西叫"vibe coding"(氛围编程)——用自然语言描述需求,让AI生成代码,看起来不用写代码就能做出产品。 但这玩意儿本质上是个陷阱。它培养的不是开发者,而是一群只会生成代码、却看不懂也 阅读全文
posted @ 2025-10-12 19:06 deephub 阅读(9) 评论(0) 推荐(0)
摘要: Pandas 的 bug 有个特点,就是不会在控制台里大喊大叫,而是悄悄藏在 dtype 转换、索引操作、时区处理的某个角落,或者那种跑十万次才能复现一次的边界条件。所以如果你想找到和定位这种隐藏的BUG就需要一套相对简洁的测试手段能把大部分坑提前暴露出来。 下面这 12 个策略是实际项目里反复使用 阅读全文
posted @ 2025-10-11 21:21 deephub 阅读(2) 评论(0) 推荐(0)
上一页 1 2 3 4 5 6 ··· 139 下一页