『学了就忘』Linux基础命令 — 31、grep命令和通配符

1、grep命令介绍

grep命令:是一个Shell命令,是Shell中文本三剑客之一,作用是在文件中提取和匹配符合条件的字符串行

grep命令是一个非常常见的命令,和find命令有很多非常相似的地方,所以在这里先说明。

grep命令格式如下:

[root@localhost ~ ]# grep [选项] “搜索内容” 文件名

选项:
  -i:忽略大小写
  -n:输出行号(显示原始文件中的行号)
  -v:反向查找
  --color=auto:搜索出的关键字用颜色显示

举例:

# 输出行号。
[root@localhost ~]# grep -n"123" abc
3:123abc
4:123abcdef123
5:abc 123
6:123aaaaabc
7:123bc
8:123aabc
10:abc123abc

# 把你要搜索的内容用红色高亮显示。
[root@localhost ~]# grep --color=auto "123" abc

注意:如果要搜索的内容中没有空格,“搜索内容”部分就可以不加双引号,如果“搜索内容”中有空格,则一定要加双引号。

2、find命令和grep命令的区别(重点)

(1)find命令

find命令用于在系统中搜索符合条件的文件名,如果需要模糊查询,则使用通配符进行匹配,通配符是完全匹配。

提示:find命令可以通过-regex选项,把匹配规则转为正则表达式规则,但是不建议如此。

(2)grep命令

grep命令用于在文件中搜索符合条件的字符串,如果需要模糊查询,则使用正则表达式进行匹配,正则表达式是包含匹配。

注意:完全匹配和包含匹配的规则不是find命令和grep命令的区别,是通配符正则表达式的区别。

3、通配符与正则表达式的区别

(1)通配符:

用于匹配文件名,是完全匹配。

下面举例说明:

  • ?:匹配一个任意字符。
  • *:匹配0个或任意多个任意字符,也就是可以匹配任何内容。
  • []:匹配中括号中任意一个字符。例如:[abc]代表一定匹配一个字符,或者是a,或者是b,或者是c
  • [-]:匹配中括号中任意一个字符,-代表一个范围。例如:[a-z]代表匹配一个小写字母。
  • [\^]:逻辑非,表示匹配不是中括号内的一个字符。例如:[\^0-9]代表匹配一个不是数字的字符。
# 通过通配符查找文件
[root@localhost ~ ] # find . -name "abc*"
./abcd
./abc

[root@localhost ~ ]# find . -name "a?c"
./acc
./abc

# 其他同理

提示:只要是操作文件名或者目录名的命令都可以是用通配符。如rm命令。

(2)正则表达式:

用于匹配字符串,是包含匹配。

下面简单举例:

  • ?:匹配前一个字符重复0次,或1次(?是扩展正则,需要使用egrep命令。注Shell分为标准正则和扩展正则。)。
  • *:匹配前一个字符重复0次,或任意多次。
  • []:匹配中括号中任意一个字符。例如:[abc]代表一定匹配一个字符,或者是a,或者是b,或者是c
  • [-]:匹配中括号中任意一个字符,-代表一个范围。例如:[a-z]代表匹配一个小写字母。
  • [\^]:逻辑非,表示匹配不是中括号内的一个字符。例如:[\^0-9]代表匹配一个不是数字的字符。
  • ^:匹配行首(限位符)。
  • $:匹配行尾(限位符)。

其中主要是是?*,在通配符和正则表达式的不同。

关于*注意:
[root@localhost ~ ] # grep "a*" abc
向上面命令中,单写一个字母+*是没有任何意义的。结果会显示文件中所有内容,包括空白行。
因为*是匹配前一个字符重复0次,或任意多次。0次代表什么都没有,也就是没有条件的筛选,所以就显示文件汇总所有的内容。

[root@localhost ~ ] # grep "aa*" abc命令,则表示查找文件中包含有小写字母a的行。和开头无关,正则是含有匹配,包含就会被列出。

如果想要在正则当中去匹配开头的内容,就需要使用限位符。如下:

[root@localhost ~]  # grep "^a" abc
abc
abc 123
abc123abc

[root@localhost ~]  # grep "^aa*" abc 和上面查询结果也一样。

小练习:

[root@localhost ~]# egrep"aaa?" abc
123aaaaabc
123aabc
# 上面证明是包含匹配

[root@localhost ~j# egrep "3aaa?b"abc
123aabc
[root@localhost ]#
# 如果只想要搜索两个a的字符串,就需要使用限位符,其中的3和b都属于限位符。
# 限位符是包括自己与其他字符串不匹配的任何字符的统称。
posted @ 2021-11-08 20:21  繁华似锦Fighting  阅读(3695)  评论(2编辑  收藏  举报