随笔分类 -  服务健康治理

笔者在工作中遇到的线上问题排查和解决方案汇总
摘要:背景: 在大型分布式系统中,线程池的使用非常普遍,但缺乏统一管理会导致一系列问题: 创建随意:各业务模块各自创建线程池,参数设置凭经验,有的核心线程数设得过大导致资源浪费,有的队列容量不足频繁拒绝任务 追踪断裂:分布式追踪中,主线程的 traceId 无法传递到异步线程,导致链路追踪不完整,问题排查 阅读全文
posted @ 2025-07-21 21:52 难得 阅读(76) 评论(0) 推荐(0)
摘要:MAT分析Dump文件: 1、设置MemoryAnalyzer.ini中的-Xmx为需要用的大小,否则会遇到打开dump文件报错。。 2、dump文件导出配置:在节点配置中增加dump导出 -XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=/path/ 阅读全文
posted @ 2025-07-21 21:30 难得 阅读(236) 评论(0) 推荐(0)
摘要:背景: 某一数据表用于记录sku的多次业务操作,要求同一sku在不同状态下是唯一的,数据库针对sku_status建立唯一索引。链路的大致流程如下: 在生产端,同一sku会并发的产生多个消息,但同一时刻只允许有一个状态位数据存在,故在insert和update都加了同一个redis锁,并在执行完成后 阅读全文
posted @ 2025-07-21 16:10 难得 阅读(30) 评论(0) 推荐(0)