随笔分类 -  问题排查

摘要:现象 我们生产最近有个服务偶尔会挂掉,接口报错"connection reset by peer",上服务器curl也是同样报错,意思连接被server拒绝了。 通过dump以及日志分析,我们已经知道了问题代码所在,就是使用easyexcel上传、解析文件,开发同学没有做分页,导致内存溢出。这点在e 阅读全文
posted @ 2025-06-12 10:01 jtea 阅读(4923) 评论(12) 推荐(21)
摘要:问题描述 最近生产有个服务突然出现频繁告警,接口P99响应时间变长,运维同学观察到相应的pod cpu飙升,内存占用很高。 cpu升高问题排查是老生常谈的话题了,一般可以使用top -p pid -H查看是哪个线程占用cpu高,再结合jstack找到对应的java线程代码。 不过经验告诉我们,cpu 阅读全文
posted @ 2024-09-24 10:15 jtea 阅读(2356) 评论(1) 推荐(6)
摘要:## 问题描述 分享一个发版过程服务报错问题,问题出现在每次发版,服务准备下线的时候,报错的位置是在将任务submit提交给线程池,使用Future.get()引发的TimeoutException,错误日志会打印下面的"error"。伪代码如下: ``` List>>> futures = new 阅读全文
posted @ 2023-07-26 10:55 jtea 阅读(681) 评论(0) 推荐(0)
摘要:随着时间推移,参与开发的人员越来越多,项目代码也会越来越复杂,需要我们有意识的定期对代码进行优化,有问题及时解决,避免技术债务越积越多。 这不本人就遇到一个服务启动慢的问题,印象中服务启动是比较快的,一般也就20几秒,但这次开发一个需求发现服务启动要接近1分钟,这对本地开发调试,测试同学测试都是非常 阅读全文
posted @ 2023-07-25 12:47 jtea 阅读(2100) 评论(0) 推荐(5)