JAVA网络爬虫
HttpClient

导航

 

python正则表达式

  • 参数说明

     表示字符
     字符                                            功能
     .                                               匹配任意1个字符(除了\n)
     []                                              匹配[]中列举的字符
     \d                                              匹配数字,0-9
     \D                                              匹配非数字,既不是数字
     \s                                              匹配空白,即空格,tab键,\n,\t,\r等
     \S                                              匹配非空白
     \w                                              匹配单词字符,即a-z,A-Z,0-9,_
     \W                                              匹配非单词字符
    
    
     表示数量
     字符                        功能
     *                           匹配前一个字符出现0次或者无限次,及可有可无
     +                           匹配前一个字符出现1次或者无限次,即至少1次
     ?                           匹配前一个字符出现1次或者0,即要么右1,要么没有
     {m}                         匹配前一个字符出现m次
     {m,}                        匹配前一个字符至少出现m次
     {m,n}                       匹配前一个字符出现从m到n次
     
      
     表示边界
     字符                        功能
     ^                           匹配字符串开头
     $                           匹配字符串结尾
     \b                          匹配一个单词的边界
     \B                          匹配非单词边界
     
    
     匹配分组
     字符                    功能
     |                       匹配左右任意一个表达式
     (ab)                    将括号中字符作为一个分组
     \num                    引用分组num匹配到的字符串
     (?P<name>)              分组起别名
     (?P=name)               引用别名为name分组匹配到的字符串
    
posted on 2019-05-05 13:58  gmlgxx  阅读(61)  评论(0)    收藏  举报