linux下shell编程(一)-awk 命令用法详解

13.3  awk的用法

转载至:http://book.51cto.com/art/201003/191292.htm

awk是一种可以处理数据、产生格式化报表的语言,功能相当强大。awk的工作方式是读取数据文件,将每一行数据视为一条记录(record),每笔记录以字段分隔符分成若干字段,然后输出各个字段的值。

以下是执行ps auxw的输出片段:

  1. USER       PID %CPU %MEM   VSZ  RSS TTY     
    STAT START   TIME COMMAND  
  2. root         1  0.0  0.0   164   92 ?    
    Ss   Apr09   0:01 init [5] 

像这种固定结构的数据,用awk来处理,特别有威力,通常只要短短几行程序代码就可以完成工作。

例如,仅用以下单一指令,就可取得所有行程的PID:

  1. ps auxw | awk '{print $2}' 

那么,awk是如何处理每一笔记录的呢?

awk对每一条记录,都会套用一个"样式{操作}",如果该行符合样式,就执行指定的操作。样式或操作之一,可以省略。如果只有样式,表示要显示符合样式的数据行;如果只有操作,表示对每一数据行都执行该项操作。

以下是awk常用的作用格式:

awk"样式"文件:把符合样式的数据行显示出来。

awk '{操作}' 文件:对每一行都执行{}中的操作。

awk '样式{操作}' 文件:对符合样式的数据行,执行{}中的操作。

用例

awk的用法1:

  1. awk '/La/' dataf3 

显示含La的数据行。

awk的用法2:

  1. awk '{ print $1, $2 }' dataf3 

显示dataf3每一行的第1和第2个字段。

$1代表第1个字段,$2代表第二字段,其他类推。

awk的用法3:

  1. awk '/La/{ print $1, $2 }' dataf3 

将含有La关键词的数据行的第1及第2个字段显示出来。

awk的用法4:

  1. awk -F: '/^ols3/{ print $3, $4 }' /etc/passwd 

使用选项-F,指定:为分隔字符,账号ols3的uid(第3字段)及gid(第4字段)显示出来。

awk的用法5:

  1. awk -F: 'BEGIN{OFS="+++"}/^ols3/{ print $1,
    $2, $3, $4, $5 }' /etc/passwd 

以:为分隔字符,+++为输出字段分隔符,将账号ols3的第1~5栏显示出来。

}执行结果:

  1. ols3+++x+++1002+++1002+++ 

本例中,BEGIN{}区域指示awk一开始先做初始化的操作,即设定OFS="+++"。变量OFS的作用是存储输出字段的分隔符。接着,寻找ols3的账号行,找到后,使用print印出第1 ~ 第5个字段,且彼此用 +++ 隔开。

实例应用

取得网卡的IP:

  1. ifconfig | grep 'inet addr:' | grep Bcast |
    awk '{print $2}' | awk -F: '{print $2}' 

取得网络设备名称:

  1. cat /proc/net/dev | awk -F: '/eth.:|ppp.:|wlan.:/{print $1}' 

在本例中,-F:把分隔字符设为:,而且,采用多选一的样式 /eth.:|ppp.:|wlan.:/。这个样式的意思是:设备名称可以是eth0:、ppp1:、wlan1: 这3个其中之一。一旦找到符合样式的字符串后,去掉:,取其中的第一个域值,因此,可能的答案是eth0或ppp1或wlan1。

取得系统内存大小:

  1. cat /proc/meminfo | awk '/MemTotal/{print $2}' 

/proc/meminfo记载主机内存相关数据,其中MemTotal为内存大小,其样本值如下:

MemTotal:       223128 kB

因此,在awk的样式语法中,利用/MemTotal/ 找到这一行,再印出第二个字段,即可得到内存的大小。

修改CSV文件各字段的顺序:

以下是数据文件dataf6.csv,想要把第2个字段和第4字段调换:

所在乡镇,学校名称,学校网址,校长姓名,学校电话,VOIP前三码,学校地址

新营市,南新国中,http://www.ns12jh.tnc.edu.tw,ABC,06-656313012,1021,新营市民治路6675号

佳里镇,佳里国中,http://www.jl41jh.tnc.edu.tw,NOP,06-722224432,1146,佳里镇安南路5523号

新营市,新营国小,http://www.sy53es.tnc.edu.tw,DEF,06-632213642,1482,新营市中正路3248号

做法如下:

范例  13-3-1:chcsv24.sh

  1. 01.     #! /bin/Bash  
  2. 02.  
  3. 03.     TMPF='/tmp/tmp.$$' 
  4. 04.     cat dataf6.csv | awk -F, 'BEGIN{OFS=","}
    {print $1,$4,$3,$2,$5,$6,$7}' 
    > $TMPF  
  5. 05.     mv -f $TMPF dataf6.csv 

行3,设定临时文件名。

行4,将数据文件的内容通过管道交给awk处理。awk的字段分隔字符和输出分隔字符,皆设为,。在{}的操作中,调换$2和$4的顺序,再把结果转向存储在临时文件中。

行5,将临时文件覆盖原文件。

 转载:http://book.51cto.com/art/201003/191292.htm

posted @ 2014-03-03 20:12  lenjent  阅读(592)  评论(0)    收藏  举报