linux下shell编程（一）-awk 命令用法详解

13.3 awk的用法

转载至：http://book.51cto.com/art/201003/191292.htm

awk是一种可以处理数据、产生格式化报表的语言，功能相当强大。awk的工作方式是读取数据文件，将每一行数据视为一条记录（record），每笔记录以字段分隔符分成若干字段，然后输出各个字段的值。

以下是执行ps auxw的输出片段：

USER PID %CPU %MEM VSZ RSS TTY
STAT START TIME COMMAND
root 1 0.0 0.0 164 92 ?
Ss Apr09 0:01 init [5]

像这种固定结构的数据，用awk来处理，特别有威力，通常只要短短几行程序代码就可以完成工作。

例如，仅用以下单一指令，就可取得所有行程的PID：

ps auxw | awk '{print $2}'

那么，awk是如何处理每一笔记录的呢？

awk对每一条记录，都会套用一个"样式{操作}"，如果该行符合样式，就执行指定的操作。样式或操作之一，可以省略。如果只有样式，表示要显示符合样式的数据行；如果只有操作，表示对每一数据行都执行该项操作。

以下是awk常用的作用格式：

awk"样式"文件：把符合样式的数据行显示出来。

awk '{操作}' 文件：对每一行都执行{}中的操作。

awk '样式{操作}' 文件：对符合样式的数据行，执行{}中的操作。

用例

awk的用法1：

awk '/La/' dataf3

显示含La的数据行。

awk的用法2：

awk '{ print $1, $2 }' dataf3

显示dataf3每一行的第1和第2个字段。

$1代表第1个字段，$2代表第二字段，其他类推。

awk的用法3：

awk '/La/{ print $1, $2 }' dataf3

将含有La关键词的数据行的第1及第2个字段显示出来。

awk的用法4：

awk -F: '/^ols3/{ print $3, $4 }' /etc/passwd

使用选项-F，指定:为分隔字符，账号ols3的uid（第3字段）及gid（第4字段）显示出来。

awk的用法5：

awk -F: 'BEGIN{OFS="+++"}/^ols3/{ print $1,
$2, $3, $4, $5 }' /etc/passwd

以:为分隔字符，+++为输出字段分隔符，将账号ols3的第1~5栏显示出来。

}执行结果：

ols3+++x+++1002+++1002+++

本例中，BEGIN{}区域指示awk一开始先做初始化的操作，即设定OFS="+++"。变量OFS的作用是存储输出字段的分隔符。接着，寻找ols3的账号行，找到后，使用print印出第1 ~ 第5个字段，且彼此用 +++ 隔开。

实例应用

取得网卡的IP：

ifconfig | grep 'inet addr:' | grep Bcast |
awk '{print $2}' | awk -F: '{print $2}'

取得网络设备名称：

cat /proc/net/dev | awk -F: '/eth.:|ppp.:|wlan.:/{print $1}'

在本例中，-F:把分隔字符设为:，而且，采用多选一的样式 /eth.:|ppp.:|wlan.:/。这个样式的意思是：设备名称可以是eth0:、ppp1:、wlan1: 这3个其中之一。一旦找到符合样式的字符串后，去掉:，取其中的第一个域值，因此，可能的答案是eth0或ppp1或wlan1。

取得系统内存大小：

cat /proc/meminfo | awk '/MemTotal/{print $2}'

/proc/meminfo记载主机内存相关数据，其中MemTotal为内存大小，其样本值如下：

MemTotal: 223128 kB

因此，在awk的样式语法中，利用/MemTotal/ 找到这一行，再印出第二个字段，即可得到内存的大小。

修改CSV文件各字段的顺序：

以下是数据文件dataf6.csv，想要把第2个字段和第4字段调换：

所在乡镇,学校名称,学校网址,校长姓名,学校电话,VOIP前三码,学校地址

新营市,南新国中,http://www.ns12jh.tnc.edu.tw,ABC,06-656313012,1021,新营市民治路6675号

佳里镇,佳里国中,http://www.jl41jh.tnc.edu.tw,NOP,06-722224432,1146,佳里镇安南路5523号

新营市,新营国小,http://www.sy53es.tnc.edu.tw,DEF,06-632213642,1482,新营市中正路3248号

做法如下：

范例 13-3-1：chcsv24.sh

01. #! /bin/Bash
02.
03. TMPF='/tmp/tmp.$$'
04. cat dataf6.csv | awk -F, 'BEGIN{OFS=","}
{print $1,$4,$3,$2,$5,$6,$7}' > $TMPF
05. mv -f $TMPF dataf6.csv

行3，设定临时文件名。

行4，将数据文件的内容通过管道交给awk处理。awk的字段分隔字符和输出分隔字符，皆设为,。在{}的操作中，调换$2和$4的顺序，再把结果转向存储在临时文件中。

行5，将临时文件覆盖原文件。

转载：http://book.51cto.com/art/201003/191292.htm

posted @ 2014-03-03 20:12 lenjent 阅读(598) 评论(0) 收藏举报

刷新页面返回顶部

lenjent

linux下shell编程（一）-awk 命令用法详解

公告