代码丰 - 博客园

2026年6月22日

摘要： RAG 系统如何实现全链路追踪：AOP 埋点与流式调用追踪实践前言在 RAG 问答系统中，一次用户提问通常不会只调用一次大模型。完整链路可能包含：会话记忆加载、问题改写、意图识别、歧义判断、知识库检索、Prompt 组装、模型路由、流式输出等多个阶段。如果线上出现“回答慢”“检索不到内容”“大阅读全文

posted @ 2026-06-22 15:45 代码丰阅读(8) 评论(0) 推荐(0)

2026年6月18日

使用 TtlExecutors 解决线程池中的 ThreadLocal 上下文丢失问题

摘要：使用 TtlExecutors 解决线程池中的 ThreadLocal 上下文丢失问题前言在 Web 系统中，我们经常会把当前登录用户、traceId、租户 ID 等信息放到 ThreadLocal 中。比如一次 HTTP 请求进入系统后，拦截器会解析 token，然后把登录用户保存到上下文中阅读全文

posted @ 2026-06-18 16:34 代码丰阅读(17) 评论(0) 推荐(0)

长耗时请求场景下（RAG问答场景），如何基于 Redis 实现分布式公平限流？

摘要：长耗时请求场景下（RAG问答场景），如何基于 Redis 实现分布式公平限流？前言在普通 Web 接口里，请求通常几十毫秒到几百毫秒就结束。限流时，我们往往只需要控制 QPS 或短时间并发即可。但在一些长耗时场景里，请求生命周期会明显变长，例如： AI 流式问答大文件处理报表导出视频转码阅读全文

posted @ 2026-06-18 16:02 代码丰阅读(7) 评论(0) 推荐(0)

2026年6月4日

【面经】缓存一致性全套解决方案：从旁路删除到延迟双删、MQ 补偿、binlog 监听与多级缓存

摘要：缓存一致性全套解决方案：从 Cache-Aside 到延迟双删、MQ 补偿、binlog 监听与多级缓存本文适合 Java 后端、Redis 缓存设计、面试复习和系统设计总结。核心目标：彻底搞清楚数据库与缓存一致性到底有哪些方案、分别解决什么问题、适合什么业务场景。适合面试补差和面试官吹阅读全文

posted @ 2026-06-04 15:05 代码丰阅读(58) 评论(0) 推荐(0)

2026年6月3日

流式大模型调用中的首包监测：解决流式调用大模型的异步问题

摘要：流式大模型调用中的首包监测：解决异步错误与模型切换的窗口期适合场景：RAG 应用、智能客服、知识库问答、Agent 系统、本地大模型推理服务、需要支持流式输出和多模型故障转移的后端系统。前言在大模型应用里，同步调用和流式调用的错误处理方式差异很大。同步调用比较好理解：调用模型 A 失败了，当阅读全文

posted @ 2026-06-03 14:29 代码丰阅读(13) 评论(0) 推荐(0)

2026年5月28日

调用多个AI 模型时，如何实现一个简单的熔断机制

摘要：调用 AI 模型时，如何实现一个简单的熔断机制适合场景：RAG 应用、智能客服、知识库问答、内容生成、Embedding 检索、Rerank 精排等需要调用 AI 模型服务的系统。前言在 AI 应用里，我们经常会调用不同类型的模型服务，例如： Chat 模型：负责对话、问答、总结、生成 Emb 阅读全文

posted @ 2026-05-28 17:13 代码丰阅读(19) 评论(0) 推荐(0)

2026年5月26日

SynchronousQueue + CallerRunsPolicy 与 LinkedBlockingQueue + CallerRunsPolicy 对比

摘要： SynchronousQueue + CallerRunsPolicy 与 LinkedBlockingQueue + CallerRunsPolicy 对比本文是总结业务上遇到的线程池设计问题询问GPT后总结的内容 1. 背景在 Java 线程池中，很多人会重点关注这几个参数： corePo 阅读全文

posted @ 2026-05-26 16:05 代码丰阅读(11) 评论(0) 推荐(0)

2026年5月21日

基于数据库字段实现可续期分布式锁：从任务抢占到心跳续约

摘要：基于数据库字段实现可续期分布式锁：从任务抢占到心跳续约前言在多实例部署的后台系统中，经常会遇到这样一类问题：多个服务节点都会定时扫描数据库中的任务表，找出已经到期的任务并执行。如果没有互斥控制，就可能出现：实例 A 扫到 task-1 到期实例 B 也扫到 task-1 到期实例 C 也阅读全文

posted @ 2026-05-21 14:34 代码丰阅读(21) 评论(0) 推荐(0)

2026年5月19日

Spring Boot 做 RAG 文档上传：为什么要用分布式信号量控制并发？

摘要： Spring Boot 做 RAG 文档上传：为什么要用分布式信号量控制并发？做 RAG 系统时，文档上传不是简单地把文件收下来。用户上传一个 PDF、Word 或 Markdown 后，系统后面通常还要做：保存文件 -> 解析文本 -> 文本分片 -> 生成向量 -> 写入向量库所以文档上阅读全文

posted @ 2026-05-19 16:46 代码丰阅读(7) 评论(0) 推荐(0)

Spring Boot 做 RAG 文档上传：1GB 文件会不会打爆内存？

摘要： Spring Boot 做 RAG 文档上传：1GB 文件会不会打爆内存？做 RAG 系统时，文档上传很容易被低估。普通系统里，上传文件可能只是保存附件。但在 RAG 里，上传只是第一步，后面通常还有：上传文档 -> 保存文件 -> 解析文本 -> 文本分片 -> 生成 embedding - 阅读全文

posted @ 2026-05-19 15:44 代码丰阅读(22) 评论(0) 推荐(0)

lqf-dev

公告