随笔分类 - 正则表达式
正则表达式的各种常规处理过程方法与方式。
摘要:1:从html代码里搜索纯文本,这个纯文本只包括html的Body标记 " (?m)<body[^>]*>(\w|\W)*?</body[^>]*> “2:从网页中检索脚本代码 " (?m)<script[^>]*>(\w|\W)*?</script[^>]*> "3:正则表达式获取图片 "(?is)<img.*?> "4:正则表达式获取连接 "(?is)<a .*?>"注意:(?is)表示启用模式修改符号 i表示忽略大小写 s表
阅读全文
摘要:1:正则表达式的各种基本操作,2:C#中对正则表达式的各种常规操作,3:正则表达式的使用技巧4:常见的匹配类别 匹配单个字符 匹配多个字符 匹配边界 匹配子模式 后向引用 文本替换 预查和非获取匹配详细:元字符(metacharacter)正则引擎保留字符,作为一般字符匹配时需要转义流派(flavor)不同工具支持的元字符和特性各不相同,构成正则表达式的不同流派。子表达式(subexpression)括号内的表达式,常用于获取部分匹配结果字符(character)正则表达式的基本构成。需要注意不同编码下字符的意义不同,大多数工具只支持ascii编码的字节匹配,近来有部分工作支持unicode编
阅读全文
浙公网安备 33010602011771号