在测试过程中,注意力往往都在功能上,如果功能正常,是基本不会查看日志的,反之会查看日志定位问题。但是表面上的功能正常不能确保日志没有报错,不能确保其他功能点没有问题,这时我们就需要日志的监控,一旦有报错就触发报警机制(报警机制可以有邮件报警、钉钉微信发消息报警等),我选择的是发邮件报警。

这里先说一下实现思路:

1、在测试过程中,日志时时在刷,时时监控难度太大

2、转换思路,每分钟对日志进行扫描一次,发现报错即报警

  a.获取当前时间前一分钟的日志,并将日志全部写入一个文件中,每次写入前会将该文件清空

  b.获取前一分钟文件时,方法是获取前一分钟日志的第一行的行号和最后一行的行号,然后将这两个行号间的所有内容输出到一个文件中(这样做相比于直接根据时间过滤的好处就是会包含报错内容,因为java日志中报错信息前面是没有时间的,根据时间过滤就会漏掉报错信息)

  c.在前一分钟日志中进行java关键词报错过滤,并将查询到的报错信息的前后20行(具体多少行根据实际情况而定)内容都输出到另一个文件中

  d.发邮件之前判断上一步生成的文件大小,如果大于0(说明有报错)就触发邮件,如果等于0就不触发邮件报警

3.脚本写好后,放入crond定时任务中,每分钟执行一次,即可进行监控

贴上代码,仅供参考

#!/bin/sh

#日志路径
mall_c_log_path='xxx'
mall_mg_log_path='xxx'

#当前时间前一分钟,精确到分
curdate=`date -d "1 minute ago" +"%Y-%m-%d %H:%M"`
echo ${curdate}

#获取mall_c要截取日期日志的开始和结束行号
c_start_line=`cat -n $mall_c_log_path | grep "${curdate}" | head -1 | cut -f1`
c_end_line=`cat -n $mall_c_log_path | grep "${curdate}" | tail -1 | cut -f1`

#获取mall_mg要截取日期日志的开始和结束行号
mg_start_line=`cat -n $mall_mg_log_path | grep "${curdate}" | head -1 | cut -f1`
mg_end_line=`cat -n $mall_mg_log_path | grep "${curdate}" | tail -1 | cut -f1`

sed -n "$c_start_line,${c_end_line}p" $mall_c_log_path > /data/admin/log_err/mall_c_now.log
sed -n "$mg_start_line,${mg_end_line}p" $mall_mg_log_path > /data/admin/log_err/mall_mg_now.log


#清空错误日志文件
> /data/admin/log_err/mall-c_err.txt
> /data/admin/log_err/mall-mg_err.txt


#将报错信息写入文件
err_list=(ArithmeticExecption NullPointerException ClassCastException NegativeArrayException ArrayIndexOutOfBoundsException SecturityException EOFException FileNotFoundException NumberFormatException SQLException IOException NoSuchMethodException SocketTimeoutException)
for i in ${err_list[*]}; do
cat /data/admin/log_err/mall_c_now.log | grep -C 20 "${i}" >> /data/admin/log_err/mall-c_err.txt
cat /data/admin/log_err/mall_mg_now.log | grep -C 20 "${i}" >> /data/admin/log_err/mall-mg_err.txt
done
# -*- coding: UTF-8 -*-
import smtplib,os
from email.mime.text import MIMEText
from email.mime.multipart import MIMEMultipart
from email.header import Header

def send_mail_attch():
    #发送邮箱
    sender='xxxxxxxx@qq.com'
    #接收邮箱
    receiver='xxxxxxxx@qq.com'
    #发送邮箱服务器
    # smtpserver='smtp.163.com'
    smtpserver='smtp.qq.com'
    #用户名  口令
    # username='18706710668@163.com'
    username='xxxxxxx@qq.com'
    password='-----------'

    #中文需参数‘utf8’,单字节字符不需要
    # 发送邮件主题
    subject = '互动赢家QA环境日志监控报警'
    msg = MIMEMultipart('mixed')
    msg['Subject'] = Header(subject, 'utf-8')

    #邮件正文
    text = "Dear all!\n 附件是后端日志报错内容,请查收~"
    zw = MIMEText(text,'plain','utf-8')
    msg.attach(zw)

    #邮件附件1
    size_mall_c = os.path.getsize('/data/admin/log_err/mall-c_err.txt')
    if size_mall_c != 0:
        mall_c_log = open('/data/admin/log_err/mall-c_err.txt',"rb")
        send_mall_c_log = mall_c_log.read()
        mall_c_log.close()
        att_1 = MIMEText(send_mall_c_log, 'base64', 'utf-8')
        att_1["Content-Type"] = "application/octet-stream"
        att_1["Content-Disposition"] = "attachment;filename = 'mall_c_err.txt'"
        msg.attach(att_1)

    #邮件附件2
    size_mall_mg = os.path.getsize('/data/admin/log_err/mall-mg_err.txt')
    if size_mall_mg != 0:
        mall_mg_log = open('/data/admin/log_err/mall-mg_err.txt',"rb")
        send_mall_mg_log = mall_mg_log.read()
        mall_mg_log.close()
        att_2 = MIMEText(send_mall_mg_log, 'base64', 'utf-8')
        att_2["Content-Type"] = "application/octet-stream"
        att_2["Content-Disposition"] = "attachment;filename = 'mall_mg_err.txt'"
        msg.attach(att_2)


    msg['to']='xxxxxxxx@qq.com'
    msg['from']='xxxxxxxx@qq.com'

    smtp=smtplib.SMTP_SSL('smtp.qq.com',port=465)
    #smtp=smtplib.SMTP()
    #smtp.connect('smtp.qq.com')
    #smtp.set_debuglevel(1)
    smtp.login(username,password)
    smtp.sendmail(sender,receiver,msg.as_string())
    smtp.quit()

if __name__ == '__main__':
    size_mall_c = os.path.getsize('/data/admin/log_err/mall-c_err.txt')
    size_mall_mg = os.path.getsize('/data/admin/log_err/mall-mg_err.txt')
    if (size_mall_c != 0) or (size_mall_mg != 0):
        send_mail_attch()
#!/bin/sh
#执行收集报错的脚本
sh /data/admin/log_err/monitor_log_err.sh

sleep 10

#执行发送邮件脚本
/usr/bin/python /data/admin/log_err/send_email.py

希望能帮到你~

 

posted on 2020-04-24 19:02  linkenzhou  阅读(958)  评论(0编辑  收藏  举报