Re模块 组名的再次引用

 

import re

ret = re.search(r"<(?P<body_info>\w+)>.*?</(?P=body_info)>", "<html><body><a href=#>跳转到头部</a><p>你点击试试</p></body></html>")  # ()组的顺序号 获取想得到的内容
if ret:
    print(ret.group())  # 成对标签中的所有内容都被匹配上
    print(ret.group('body_info'))  # 标签的名字 是一个独立的组(\w+)  该组被起名为 ?P<body_info>  该组在标签末尾被再次引用 (?P=body_info)


ret = re.search(r"<(?P<body_info>\w+)>.*?</\1>", "<html><body><a href=#>跳转到头部</a><p>你点击试试</p></body></html>")  # ()组的顺序号 获取想得到的内容
if ret:
    print(ret.group())  # 成对标签中的所有内容都被匹配上
    print(ret.group(1))  # 该组在标签末尾被再次引用 而该组的序号为1哦~

 

posted @ 2020-05-06 22:01  CherryYang  阅读(123)  评论(0)    收藏  举报