python系列(亲测有效):lxml数据解析小技巧; element对象转化成str, 并使用正则替换HTML标签, 保留内容(gvm专用,类比pretty_print)

lxml数据解析小技巧; element对象转化成str, 并使用正则替换HTML标签, 保留内容

功能: element对象转化成str, 并使用正则替换HTML标签, 保留内容, 非贪婪模式

def string_process(element):
    string = etree.tostring(element, encoding='utf-8').strip().decode('utf-8')
    return re.sub('<[^>]*>', '', string).strip()







qq_43031234

lxml数据解析小技巧; element对象转化成str, 并使用正则替换HTML标签, 保留内容

posted @ 2024-06-29 20:40  坦笑&&life  阅读(27)  评论(0)    收藏  举报  来源