正则表达式——子模式

import re
# string = "this is a love1ly girl lovel1y"
# pattern = re.compile(r"lovely")
# ret = pattern.search(string)
# print(ret.group())
# # group()是返回匹配的整个表达式的字符串


string = "额呵呵<span><div>床前明月光,疑是地上霜</div></span>"
pattern = re.compile(r"<(\w+)><(\w+).*</(\2)></(\1)>")
ret = pattern.search(string)

print(ret.group())

# 指返回匹配的整个表达式的第一个子模式的字符串
# 显示结果:<span><div>床前明月光,疑是地上霜</div></span>

print(ret.group(1))

# group(1)表示匹配的第一个子模式的字符串,其他的同理
# 显示结果:span

print(ret.group(2))
# 显示结果:div




string = "lakdsk<span><div>醉卧沙场君莫笑</div></span>呵呵呵<a><div>古来征战几人回</div></a>哈哈哈"
pattern = re.compile(r"<(\w+)><(\w+)>.*</\2></\1>")
rer = pattern.search(string)

print(rer)
#显示结果是一个对象
#显示结果:<_sre.SRE_Match object; span=(6, 37), match='<span><div>醉卧沙场君莫笑</div></span>'>

print(rer.group())

#显示结果:<span><div>醉卧沙场君莫笑</div></span>



pattern1 = re.compile(r"(<(\w+)><(\w+)>.*</\3></\2>)")

re1 =pattern1.findall(string)

print(re1)

#显示结果:[('<span><div>醉卧沙场君莫笑</div></span>', 'span', 'div'), ('<a><div>古来征战几人回</div></a>', 'a', 'div')]
#注意:使用findall进行匹配时,有几个子模式,就在列表中显示几个子模式

posted @ 2019-02-14 10:15  石桥浪子  阅读(1467)  评论(0编辑  收藏  举报