正则表达式

https://blog.csdn.net/weixin_53496398/article/details/115706498

概述：使用一组字符串来描述，匹配一系列符合某个句法规则的字符串。广泛适用于脚本编辑，文件编辑器如，PHP，Java，Python，Perl，shell等。
优点：可以方便编辑，使用对文本的增删改查等操作。
正则表达式分类
- 基础正则表达式
- 扩展正则表达式
linux中常用的文本处理工具
- grep：匹配，查询
- sed：编辑（增删改查）
- awk：文本格式化（字符串提取）
通配符
- “*” 任意长度字符串
- “？”单个任意字符串
grep命令的参数
- -v：排除匹配的内容
- -E：支持扩展的正则表达式
- -l：忽略大小写
- -n：显示行号
- -q：匹配内容不显示
- -c：只对匹配行的计数
基础正则表达式
- \：转义字符
- ^：以...开头
- $：以...结束
- ^$：表示空行
- .：匹配任意一个字符
- *：匹配0次或者多次
- .*：匹配任意字符串
- 【list】：列表
- 【^list】：非list表中的
- {n}：匹配子表达式n次
- {n,}：匹配子表达式至少n次
- {n,m}：匹配子表达式至少n次，最多m次

eg：

nl test.txt 
   1	gd
   2	god
   3	good
   4	goood
   5	gooood
   6	gold
   7	glad
   8	gaad
   9	abCDf
  10	food
  11	162478383
  12	HELLO
  13	010-666888
  14	0665-5666888
  15	ip 192.168.200.10
  16	ip 1.2.3.4
  17	pay $180


#打印出包括"$"字符的行且打印出行数
[root@localhost ~]# grep -n '\$' test.txt 
17:pay$180
[root@localhost ~]# awk '/\$/{print}' test.txt 
pay$180

#过滤出以小写字母开头的行（非：在里面添加非^）
[root@localhost ~]# grep "^[a-z]" test.txt
[root@localhost ~]# sed -n '/^[a-z]/p' test.txt
[root@localhost ~]# awk '/^[a-z]/{print}' test.txt

#过滤出以数字为结尾的行
[root@localhost ~]# grep '[0-9]$' test.txt 
[root@localhost ~]# sed -n '/[0-9]$/p' test.txt 
[root@localhost ~]# awk '/[0-9]$/{print}' test.txt

#查看go0*d go.d go+d go.*d go？d 区别
[root@localhost ~]# grep -E "go.d" test.txt 
good
gold  #.表示匹配任意字符
[root@localhost ~]# grep -E "go.*d" test.txt 
god
good
goood
gooood
gold  #.*表示匹配任意字符
[root@localhost ~]# grep -E "go*d" test.txt 
gd
god
good
goood
gooood  #*表示匹配0次到多次
[root@localhost ~]# grep -E "go+d" test.txt 
god
good
goood
gooood  #+表示匹配大于等于一次
[root@localhost ~]# grep -E "go?d" test.txt 
gd
god  #？表示匹配0次或1次

#过滤出电话号码
[root@localhost ~]# grep -E '[0-9]{3,4}-[0-9]{7,8}' test.txt 
[root@localhost ~]# sed -n '/[0-9]\{3,4\}-[0-9]\{7,8\}/p' test.txt 
010-6668888
0665-5666888

#过滤出IP地址
[root@localhost ~]# grep -E '[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}' test.txt
[root@localhost ~]# grep -E '([0-9]{1,3}\.){1,3}[0-9]{1,3}' test.txt 
ip 192.168.200.10
ip 1.2.3.4

扩展正则表达式

+：匹配一次以上
？：匹配0次或一次
（）：括号内为一个整体
|：或者

#过滤ifconfig中的ip
[root@localhost ~]# ifconfig ens33 | grep -E '([0-9]{1,3}\.){1,3}[0-9]{1,3}'  
inet 192.168.200.10  netmask 255.255.255.0  broadcast 192.168.200.255
RX packets 23315  bytes 1903937 (1.8 MiB)
TX packets 17996  bytes 4077053 (3.8 MiB)
[root@localhost ~]# ifconfig ens33 | awk '/ inet /{print $2}'
192.168.200.10

nginx正则及location匹配

nginx location匹配
- ^~：对个后续正则表达式标识匹配
- =：精准匹配
- ~：区分大小匹配
- ~*：不区分大小匹配
- !~：去区分大小的匹配取非
- !~*：对不区分大小的匹配取非
- /：通用
正则表达式补充
- *?：重复前面的字符0次或多次
- +？：重复前面的字符一次或多次
- ??：重复前面的字符0次或一次
- {n,m}?：重复前面的字符n次到m次
- {n,}?：重复前面的字符n次以上
nginx location应用规则
- location：用于匹配相应的路径，进行控制访问或者反向代理。
- 位置：配置文件/usr/local/nginx/conf/nginx.conf的http项中的server项里。
- 用处：server项用于区分不同站点的监听地址、端口号和域名以及相关的站点目录
- 分类：
  精准匹配：location = / {…}
  正则匹配：location ~ / {…}（匹配即停止）
  一般匹配：location / {…}(遵循最长匹配原则)
- location 优先级
  1.首先精确匹配=
  2.其次前缀匹配^~
  3.其次是按文件中顺序的正则匹配_或*
  4.然后匹配不带任何修饰的前缀匹配
  5.最后是交给/ 通用匹配
  location =>location 完整路径>location ^~ 路径>location _, 正则顺序>location 部分起始路径>location /*
- 实用建议规则
  - 一个网站，至少有三个匹配规则定义
    第一个必选规则
    直接匹配网站根，通过域名访问网站首页比较频繁，使用这个会加速处理，比如说官网。
    可以是一个静态首页，也可以直接转发给后端应用服务器
    location = / {
    proxy_pass http://tomcat_server/;
    }
    
    第二个必选规则
    处理静态文件请求，这是nginx作为http服务器的强项，有两种配置模式，目录匹配或后缀匹配,任选其一或搭配使用
    location ^~ /static/ {
    root /webroot/static/;
    }
    
    location ~* .(html|gif|jpg|jpeg|png|css|js|ico)$ {
    root /webroot/res/;
    }
    
    第三个规则
    通用规则，比如用来转发带.php、.jsp后缀的动态请求到后端应用服务器
    非静态文件请求就默认是动态请求
    location / {
    proxy_pass http://tomcat_server;
    }
nginx rewrite规则
- 是使用nginx的全局变量或者子集设置的变量，结合正则表达式，来对URL重定向。
- 位置：server{}里的location{}里的if{}判断中
- 例如：http://www.lisi.com/a/we/index.php?id=1&u=str 只对/a/we/index.php重写
- 语法：rewrite 正则表达式更换目标【标志位】
- 执行顺序：执行server块中的rewrite指令----执行location匹配----执行选定的location中的rewrite指令，如果未找到循环十次返回500==内部错误
- flag标志位
  - last：相当于Apache的【L】标记，也就是默认
  - break：匹配到本规则后，停止匹配后面规则
  - redirect：返回302临时重定向，浏览器地址会显示跳转后的URL地址。
  - permanent：返回301永久重定向，浏览器地址栏会显示跳转后的URL地址
    last一般写于server的if中，而break一般用于location中
- if判断：
  - 语法：if(condition){...}，对condition判断，若真则执行
  - -f和!-f：用来判断是否存在文件
  - -d和!-d：用来判断是否存在目录
  - -e和!-e：用来判断是否存在文件或目录
  - -x和!-x：用来判断是否可执行

posted @ 2021-09-27 18:33 whml 阅读(84) 评论(0) 收藏举报

刷新页面返回顶部

whml

正则表达式

正则表达式

nginx正则及location匹配

公告