awk数组、tr、计数

1、统计用户登录类型

#!/bin/bash
declare -A  shells （定义关联数组shells）
while read ll   （读取/etc/passwd，ll为变量）

do
type=`echo $ll | awk -F: '{print $7}'`  （type为变量，切割ll后的变量）
let shells[$type]++
done < /etc/passwd

for i in ${!shells[@]}
do
 echo "$i ::::: ${shells[$i]}"                                                        
done
~                                                                                       

[root@localhost ~]# bash tj2.sh
/sbin/nologin ::::: 17
/bin/sync ::::: 1
/bin/bash ::::: 3
/sbin/shutdown ::::: 1
/sbin/halt ::::: 1

2、将域名取出并根据域名进行计数排序处理（常用）

cat 1.txt   |  awk -F "/+"  '{ip[$2]++}END{for(i in ip) print i,ip[i]}' | sort  -rnk2

3、替换硬件地址小写为大写，去掉：

# ip a | grep "link/ether" | awk -F" " '{print $2}' | tr '[a-z]' '[A-Z]'|sed 's/://g'

4、打印某行某列

# cat /etc/passwd |  column -s :  -t  | awk 'NR==2  {print $3}'    #NR表示行，$跟列（$0特殊，表示本行）

# cat /etc/passwd |  column -s :  -t  | awk 'NR==2，NR==4  {print $3}'  #行的范围

# cat /etc/passwd |  column -s :  -t | awk 'NR==1'        #只要某行时，不需要跟print就能出来
root             x  0      0      root                        /root               /bin/bash
注意：column  -t 表示把输出以表格显示，-s参数是指定输出中已经存在的字符变为空格符。

5、sed和cut

# sed -n 1,5p file1 | cut -d : -f1-6  (1,5p打印范围，-d 指定分隔符，-f字符串)
root:x:0:0:root:/root
bin:x:1:1:bin:/bin
daemon:x:2:2:daemon:/sbin
adm:x:3:4:adm:/var/adm
lp:x:4:7:lp:/var/spool/lpd

# sed -n 1,5p file1  |  cut  -c1-6（-c从左往右一个单字符就算一个整体）
root:x
bin:x:
daemon
adm:x:
lp:x:4

打印1行5列
# sed -n  4p file1 |cut  -c 5  （文本里是连续纯字符，-d 和 -f 组合就不适用了）
5

6、awk拼接打印

# docker images | grep 192 | awk  'BEGIN{OFS=":"}''{print $1,$2}' > 1.txt

# cat images.txt | awk '{print $1 ":" $2}'

OFS=":"表示以：为拼接符号

或者awk '{print $x".xxx"}'，xxx为任意想要添加的变量

cat output.txt | awk '{print $4".bmp"}'  > bar

cat bar
RBA32010419vbjk101638.bmp
RBA320104197904101611.bmp

或者

docker images | grep harbor | awk '{print "docker tag" " " $3 " " $1":"$2}'

docker tag 18036ee471bc harbor.cetccloud.com/amd64/redis-photon:v1.8.2
docker tag ad798fd6e618 harbor.cetccloud.com/amd64/harbor-registryctl:v1.8.2
docker tag 081bfb3dc181 harbor.cetccloud.com/amd64/registry-photon:v2.7.1-patch-2819-v1.8.2

paste拼接命令方式

paste -d -s -file1 file2

选项的含义如下：

-d 指定不同于空格分隔符，如果不指定，默认用空格分割

-s 将每个文件合并成行而不是按行粘贴。

- 使用标准输入。例如ls -l | paste ，意即只在一列上显示输出

-s用法

# cat per1
ID897
ID666
ID982

# cat per2
P.Jones
S.Round
L.Clip

# paste per1 per2
ID897   P.Jones
ID666   S.Round
ID982   L.Clip
 
# paste -s per1 per2
ID897   ID666   ID982
P.Jones S.Round L.Clip

-d案例

paste file1.txt file2.txt 
12345	6789

paste -d "+" file1.txt file2.txt 
12345+6789

paste -d "" file1.txt file2.txt 
123456789

交叉合并
$ cat 123.txt 
aa
bb
cc
dd
$ cat 456.txt 
11
22
33
$ paste 123.txt 456.txt |tr "\t" "\n"
aa
11
bb
22
cc
33
dd

7、awk -F分隔符 'BEGIN { 初始化 } { 循环执行部分 } END { 结束处理 }' file1 file2

NR放在循环执行部分

# awk '{print NR,$0}' aa.txt，表示行数，显示行号。
1 aadak
2 ksdlb
3 d;smlb
4 fl; b

放在 END { 结束处理 }'，表示最后一行。

# awk 'END{print NR,$0}' aa.txt  
4 fl; b

8、求和（docker images镜像的大小）

# cat 1.sh  |grep MB | awk '{sum+=$7}END{print sum}'
7256
# cat 1.sh  |grep MB| awk '{print sum+=$7}END{print sum}'
697
1105
1513
1926
2359
2773
3693
4118
4543
5030
5623
6465
6848
7256
7256

9、tr常用操作

echo 1 2 3 4 5 6 7 8 9 | xargs -n1 | echo $[ $(tr '\n' '+') 0 ]
45  
注：$[]表示计算，0表示末尾要加的数，因为会9后面的回车符会换成+号。
xargs -n1 ：表示每次只传递一个参数
echo 1 2 3 4 | xargs -n1 
1 
2 
3 
4 
echo 1 2 3 4 | xargs -n2 
1 2 
3 4 

批量解压*.tar.gz文件。
ls *.tar.gz | xargs -n1 tar -zxvf

echo 1 2 3 4 5 6 7 8 9 | xargs -n1 | echo $[ $(tr '\n' '+') 1 ]
46

echo 1 2 3 4 5 6 7 8 9 | xargs -n1 | echo $[ $(tr '\n' '+') 2 ]
47

echo 1 2 3 4 5 6 7 8 9 |tr ' ' '+'
1+2+3+4+5+6+7+8+9

echo 1 2 3 4 5 6 7 8 9 |tr ' ' '+'|bc
45

-s 压缩重复的部分或者是把多个字符当做一个整体

cat 1.sh  |grep MB| awk '{print $7}'| tr  "MB\n" '+' 
697+++408+++408+++413+++433+++414+++920+++425+++425+++487+++593+++842+++383+++408+++

cat 1.sh  |grep MB| awk '{print $7}'| tr -s "MB\n" '+' 
697+408+408+413+433+414+920+425+425+487+593+842+383+408+

-d 删除

# cat 1.sh  |grep MB| awk '{print $7}'
697MB
408MB
408MB
# cat 1.sh  |grep MB| awk '{print $7}'|tr -d MB
697
408
408

10、生成任意长度的字符串

# head /dev/urandom | tr -dc A-Za-z0-9 | head -c 12
FZmEl60TxdvX

11、打印所有的进程、slab分别占用内存总量（linux系统内存消耗主要有三个地方：进程、slab、pagecacge）

#  echo `ps aux |awk '{mem += $6} END {print mem/1024/1024}'` GB
0.494217 GB

# echo `cat /proc/meminfo|grep Slab|awk '{mem += $2} END {print mem/1024/1024}'` GB
0.111328 GB

12、取出本机ip

#hostname  -i  |awk -F" " '{print $2}'  #注意，{}外面的单引号
192.168.40.132

#hostname -i
fe80::20c:29ff:fece:16d0%ens33 192.168.40.132 172.17.0.1

#hostname -I
192.168.40.132 172.17.0.1

13、数组结合for循环

# cat clean-rook-dir.sh
hosts=(
  ke-dev1-master3
  ke-dev1-worker1
  ke-dev1-worker3
  ke-dev1-worker4
)

for host in ${hosts[@]} ; do
  ssh $host "rm -rf /var/lib/rook/*"
done

14、查看Apache的并发请求数及其TCP连接状态

netstat -n | awk ‘/^tcp/ { S[$NF]} END {for(a in S) print a, S[a]}’

结果解读

LAST_ACK 5
SYN_RECV 30
ESTABLISHED 1597
FIN_WAIT1 51
FIN_WAIT2 504
TIME_WAIT 1057
其中的SYN_RECV表示正在等待处理的请求数；
ESTABLISHED表示正常数据传输状态；
TIME_WAIT表示处理完毕，等待超时结束的请求数。
关于TCP状态的变迁，可以从下图形象地看出：
状态：描述
CLOSED：无连接是活动的或正在进行
LISTEN：服务器在等待进入呼叫
SYN_RECV：一个连接请求已经到达，等待确认
SYN_SENT：应用已经开始，打开一个连接
ESTABLISHED：正常数据传输状态
FIN_WAIT1：应用说它已经完成
FIN_WAIT2：另一边已同意释放
ITMED_WAIT：等待所有分组死掉
CLOSING：两边同时尝试关闭
TIME_WAIT：另一边已初始化一个释放
LAST_ACK：等待所有分组死掉

15、多个分隔符提取多个字段

log.txt的内容格式大概如下：

30000|ddddd|/jjjjj/22/nn|20000
3|mmm|/ffffff/222222/mmmmmm|111111

每行的第一个数据和第三个数据和第五个数据截出来，用“，”隔开，写法如下

awk -F'[|/]' '{OFS=","}{print $1,$4,$6}' log.txt

16、统计当前目录中以.html结尾的文件总大

find . -name "*.html" -exec du -k {} \; |awk '{sum+=$1}END{print sum}'

或者

for size in $(ls -l *.html |awk '{print $5}'); do
    sum=$(($sum+$size))
done
echo $sum

for 和数组

#!/bin/bash
a="
file1
file2
file3
file4
file5
file6
file7
file8
"
for i in ${a[*]}
do
mkdir $i
done
echo "输出数组的所有元素： ${a[*]}"

关于shell中数组array的补充

1、定义

数组中可以存放多个值。Bash Shell 只支持一维数组（不支持多维数组），初始化时不需要定义数组大小（与 PHP 类似）。

与大部分编程语言类似，数组元素的下标由 0 开始。

Shell 数组用括号来表示，元素用"空格"符号分割开，语法格式如下：

array_name=(value1 value2 ... valuen)

2、创建与查看

##方式1
my_array=(A B "C" D)

##方式2
array_name[0]=value0
array_name[1]=value1
array_name[2]=value2

##查看数组元素
echo   ${array_name[index]}

获取数组中的所有元素

使用 @ 或 * 可以获取数组中的所有元素

在数组前加一个感叹号 ! 可以获取数组的所有键，例如：

declare -A site
site["google"]="www.google.com"
site["runoob"]="www.runoob.com"
site["taobao"]="www.taobao.com"

echo "数组的键为: ${!site[*]}"
echo "数组的键为: ${!site[@]}"

获取数组的长度

获取数组长度的方法与获取字符串长度的方法相同，例如：

my_array[0]=A
my_array[1]=B
my_array[2]=C
my_array[3]=D

echo "数组元素个数为: ${#my_array[*]}"
echo "数组元素个数为: ${#my_array[@]}"

3、关联数组

Bash 支持关联数组，可以使用任意的字符串、或者整数作为下标来访问数组元素。

类似于py的字典，用-A指定

关联数组使用 declare 命令来声明，语法格式如下：

declare -A array_name

-A 选项就是用于声明一个关联数组。

关联数组的键是唯一的。

以下实例我们创建一个关联数组 site，并创建不同的键值：

declare -A site=(["google"]="www.google.com" ["runoob"]="www.runoob.com" ["taobao"]="www.taobao.com")

##也可以先声明一个关联数组，然后再设置键和值
declare -A site
site["google"]="www.google.com"
site["runoob"]="www.runoob.com"
site["taobao"]="www.taobao.com"

4、数组操作案例

场景：ansible hosts文件中定义了一组标签，想要取出swarm-03的标签，将标签添加到新的swarm-02节点

[docker_swarm_worker]
swarm-02 swarm_labels='["secondary-manager", "opt", "es1", "mysqls", "common"]'
swarm-03 swarm_labels='["dp", "kafka", "logstash", "es3", "dataflow_task", "systools", "common", "nacos"]'

shell部分代码

function add_tag() {
    # 从文本中解析出的标签字符串
    label_string=$(cat /etc/ansible/hosts | grep docker_swarm_worker -A 4 | grep $1 | grep -oP 'swarm_labels=\K.*')
    
    # 使用 sed 删除反斜杠，方括号，双引号，'和\
    # cut -c 2-  表示从第二个字符到末尾结束做保留，rev反转
    label_list=$(echo $label_string | tr -d '["]' | cut -c 2- | rev | cut -c 2- | rev)
    
    # 使用逗号将标签字符串分割为数组
    IFS=',' read -ra labels <<< "$label_list"
    
    # 循环标签数组,每个标签都使用docker node update --label-add方式添加到swarm-02上
    for label in "${labels[@]}"; do
        ssh ${new_master_ip} "docker node update --label-add $label=true $2"
    done
}

if [ ${node_num} -eq 2 ]; then
  add_tag swarm-03 ${curr_node_name}
elif [ ${node_num} -eq 4 ];then 
  add_tag swarm-05  ${curr_node_name}
else
  exit 1
fi

注释：

1、在grep命令中，-o选项表示仅把匹配的部分打印出来，-P选项表示使用Perl的正则表达式。

\K是一个在Perl正则表达式中的特殊序列，表示"忽略前面已经匹配的内容"。'swarm_labels=\K.*'表示匹配'swarm_labels='和其后面的任何内容，但是只获取和返回=号之后的内容。所以，如果你有一行内容如下：

swarm-05 swarm_labels='["dp", "kafka", "logstash", "dataflow_task", "systools", "common", "nacos"]'

grep -oP 'swarm_labels=\K.*'会返回：

'["dp", "kafka", "logstash", "dataflow_task", "systools", "common", "nacos"]'

2、tr -d '["]' 表示删除所有的 ' (单引号)，" (双引号) 和 [，] 这些字符。

dp, kafka, logstash, dataflow_task, systools, common, nacos

3、IFS=',' read -ra labels <<< "$label_list"

作用是将变量$label_list的内容按分隔符,解析，并分割为一个数组labels。

IFS=',': 这是bash shell中的特殊变量，全名是Internal Field Separator(内部字段分隔符)，用来定义分词时的分割字符。在这里，我们设置IFS=','，意味着接下来的读取操作将使用,作为分割符。
read -ra labels: read 命令用于读取一行输入。-a选项的作用是将读取到的数据分割成数组。-r选项的作用是使得read命令不会把反斜杠字符解释为转义字符。在这个命令中，我们使用read -ra labels读取分割后的数据到数组labels中。
<<< "$label_list": <<<是shell的一种输入重定向操作，它将$label_list的值作为输入传递给前面的read命令。
执行完这个命令后，$labels变成了一个数组，其中存储了以,分割的每一个子项。例如，如果$label_list为dp, kafka, logstash, dataflow_task, systools, common, nacos，那么$labels将会是一个包含了各个项dp kafka logstash dataflow_task systools common nacos的数组。

https://www.runoob.com/linux/linux-shell-array.html 数组

posted @ 2019-08-14 14:07 凡人半睁眼阅读(478) 评论(0) 收藏举报

刷新页面返回顶部

海棠未雨，梨花先雪，一半春休

想看山海，早也去，晚也去，一个人也去

awk数组、tr、计数

paste拼接命令方式

9、tr常用操作

关于shell中数组array的补充

公告

海棠未雨，梨花先雪，一半春休

想看山海，早也去，晚也去 ，一个人也去

awk数组、tr、计数

paste拼接命令方式

9、tr常用操作

关于shell中数组array的补充

公告

想看山海，早也去，晚也去，一个人也去