python正则表达式-案例

 

 

工作中遇到一个小问题,需要在一个日志文件中,删选出包含emrfs sync命令和之后内容的行,格式如下,

[2019-10-31 08:20:16,389] {logging_mixin.py:84} INFO - emrfs sync s3://cf-data-sync/mysql2s3/account/tbl_user_account/

考虑采用正则表达式来做,代码如下

import re
pattern = re.compile(r'emrfs sync \S+')

with open('sync.sh', 'r') as f:
    line=f.readline()
    while line:
        m = pattern.findall(line)
        if m:
            print(m[0])
        line=f.readline()

 

posted @ 2019-10-31 17:35  Mars.wang  阅读(378)  评论(0编辑  收藏  举报