AWK学习日记

AWK是一种处理文本文件的语言，是一个强大的文本分析工具。

工作流程：

AWK遵循一个简单的工作流程：读取-》执行-》重复。
① awk从输入流（文件，管道，标准输入）读取一行，并将其存储在存储器（内存）中。

② 所有的awk命令一次提交输入。默认情况下awk执行命令每一行，但我们可以通过提供的模式限制。

③ 重复以上过程，一直到这个文件被处理完成。

程序结构：

BEGIN 块
以下是BEGIN块语法：

BEGIN {awk-commands}
在BEGIN块被在程序启动时执行，且只执行一次。这是一个很好的初始化变量的地方。 BEGIN是AWK关键字，因此它必须是大写。请注意，这个块是可选的。

Body块
以下是主体（Body）块的语法：

/pattern/ {awk-commands}
主体块适用于AWK的每个输入行命令。默认情况下AWK执行每一行命令，但可以通过提供的模式限制。请注意，没有主体块的关键字。

END 块
以下是END块的语法：

END {awk-commands}
END块被在程序结束时执行。END是AWK关键字，因此它必须是大写。请注意，此块也是可选的

基本语法：

awk [options] file .....

awk [oprions] -f file ....
file可以是一个包含awk命令的文件
例如：
awk '{print}' test.txt 命令为列出test.txt的内容
可以将{print}写入文件test.awk 
执行 awk -f test.awk test.txt
效果相同。

AWK标准选项：

-v 选项

此选项分配一个只的变量，允许程序执行前分配。

awk -v name=ck 'BEGIN {printf "name=%s\n",name}'
得到结果 name=ck

--dump-variables[=file] 选项

它打印全局变量和最终值到文件的一个排序列表。默认的文件是awkvars.out。

awk -dump-variables ''
cat awkvars.out

--help 选项

此选项将在标准输出的帮助信息。

下面开始实例操作：

以netstat命令中提取了如下信息作为用例：

下面是最简单最常用的awk示例，其输出第一列和第四列，

　　其中单引号中的被大括号括着的就是awk的语句，注意，其职能被单引号包含。

　　其中$1...$n表示第几列。$0表示整个行

过滤记录

我们再来看看如何过滤记录（下面过滤条件为：第三列的值为0 && 第6列的值为LISTEN）

其中的“==”为比较运算符。其他比较运算符：!=, >, <, >=, <=

如果我们需要表头的话，我们可以引入内建变量NR:

内建变量

$0 当前记录（这个变量存放着整个行的内容）

$1~$n 当前记录得第n个字段，字段由FS分割

FS 输入字段分隔符默认是空格或者Tab

NF 当前记录中的字段个数，就是有多少列

NR 记录读出的记录数，就是行号，从1开始如果有多个文件，这个值也不断累加。

FNR 当前记录数，与NR不同的是这个值会是各个文件自己的行号

RS 输入的记录分隔符，默认是换行符

OFS 输出字段分隔符，默认空格

ORS 输出记录分隔符，默认为换行符

FILENAME 当前输入文件的名字

上面的命令等价于：awk -F: '{print $1,$3,$6}' /etc/passwd

如果要制定多个分隔符：awk -F '[;:]'

再来看一个以\t作为分隔符输出的例子（下面使用了/etc/passwd文件，这个文件是以:分隔的）：

转自：https://www.cnblogs.com/chenshoubiao/p/4773808.html

posted on 2018-02-22 16:40 oceanL 阅读(301) 评论(0) 收藏举报

刷新页面返回顶部

AWK学习日记

-v 选项

--dump-variables[=file] 选项

--help 选项

过滤记录

导航

公告