因打印日志而引发的故障

问题描述:

最近已经有两个项目因为日志打印问题而引发了故障,可以说是血的教训了。两次故障的原因也是非常的相似,都是由于其他业务系统调用了另外一个老系统的接口,但是由于传递的参数不正确,而老系统会因为参数不正确而打印日志。当错误的请求量增大,打印日志会造成当前线程阻塞,容易使机器机器负载升高,产生性能问题

排查方法:

1. 直接查看机器上日志大小

2. 还可以通过Jstack查看 占用cpu最多的线程,多查看几次,如果每次都是打印日志的线程,那基本上也可以确定是打印日志的问题

解决方案:

1. 提前校验参数,如果参数有问题应该抛出异常

2. 在logback的AsyncAppender中配置<neverBlock>true</neverBlock> 避免业务线程的阻塞

<!-- 异步输出 -->
    <appender name ="STDOUT_ASYNC" class= "ch.qos.logback.classic.AsyncAppender">
        <discardingThreshold >0</discardingThreshold>
        <queueSize>512</queueSize>
        <includeCallerData>false</includeCallerData>
        <neverBlock>true</neverBlock>
        <appender-ref ref ="stdout"/>
    </appender>

Logback的neverBlock原理:

由于logback相当于是生产者-消费者模式,当时我们在系统中ogger.info()或者ogger.error()时,是把日志信息加入到logback的队列中,默认是调用队列的put方法,而当队列满了之后,就会阻塞当前的线程。而设置了neverBlock后,则会调用offer方法,如果队列满了,则丢弃。可以查看源码:

 

posted @ 2019-06-06 21:43  Hello...my...world  阅读(1690)  评论(0编辑  收藏  举报