会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
cphmvp
简单 简约 It's me
博客园
首页
新随笔
联系
管理
随笔分类 -
12_正则_regex
常用正则收集 自己总结
摘要:1、匹配文本中的汉字 \p{InCJK Unified Ideographs}2 、常见a连接匹配 ]*?href\s*=[^\\]\s*['""]?([^'""\s>]*)[^>]*>[\s\S]*?(.*?)[].+? window\.location\.href=['"](.*?)['"];*3 、常见图片连接匹配 url\((.+?)\) 注释常见匹配 (?4 、匹配javacript ].*[].*
阅读全文
posted @
2013-09-04 22:30
cphmvp
阅读(225)
评论(0)
推荐(0)
公告
爬虫在线测试小工具:
http://tool.haoshuju.cn/