随笔分类 -  12_正则_regex

摘要:1、匹配文本中的汉字 \p{InCJK Unified Ideographs}2 、常见a连接匹配 ]*?href\s*=[^\\]\s*['""]?([^'""\s>]*)[^>]*>[\s\S]*?(.*?)[].+? window\.location\.href=['"](.*?)['"];*3 、常见图片连接匹配 url\((.+?)\) 注释常见匹配 (?4 、匹配javacript ].*[].* 阅读全文
posted @ 2013-09-04 22:30 cphmvp 阅读(225) 评论(0) 推荐(0)

爬虫在线测试小工具: http://tool.haoshuju.cn/