摘要: # -*- coding: utf-8-*-import re##过滤HTML中的标签#将HTML中标签等信息去掉#@param htmlstr HTML字符串.def filter_tags(htmlstr):#先过滤CDATA re_cdata=re.compile('//]*//\]\]>',re.I) #匹配CDATA re_script=re.compile(']*>[^',re.I)#Script re_style=re.compile(']*>[^',re.I)#style re_br=re.compile( 阅读全文
posted @ 2013-11-12 16:57 Tinan 阅读(1375) 评论(0) 推荐(0) 编辑