[正则]正则表达式 捕获型括号和非捕获型括号

正则表达式 捕获型括号和非捕获型括号

对于括号中的子表达式,正则表达式会将匹配的子表达式进行存储。

问题描述

import re
PATH='/Users/Michael/.../app_stat.sh'
CREATE_PATT = '.*?exists.*?(\w+(_\w+)+)\('
with open(PATH) as fr:
    content = fr.read()
    createPatt = re.compile(CREATE_PATT)
    tables = re.findall(createPatt, content)
    print tables

结果如下:

[('mds_anti_app_stat', '_stat'), ('mds_anti_app_blacklist', '_blacklist'), ('mds_anti_app_mail', '_mail'), ('mds_anti_app_few_follow', '_follow'), ('mds_anti_app_mail_spamfan', '_sp
amfan')]

很显然,我想要的结果是

['mds_anti_app_stat', 'mds_anti_app_blacklist', 'mds_anti_app_mail', 'mds_anti_app_few_follow', 'mds_anti_app_mail_spamfan']

由于
(_\w+)+ 夹杂这一个括号,导致多匹配了一个结果。

解决方案

(_\w+)+ 改为 (?:w+)+

posted @ 2016-11-23 21:04  cn_wk  阅读(244)  评论(0)    收藏  举报