awk数组、tr、计数
1、统计用户登录类型
#!/bin/bash
declare -A shells (定义关联数组shells)
while read ll (读取/etc/passwd,ll为变量)
do
type=`echo $ll | awk -F: '{print $7}'` (type为变量,切割ll后的变量)
let shells[$type]++
done < /etc/passwd
for i in ${!shells[@]}
do
echo "$i ::::: ${shells[$i]}"
done
~
[root@localhost ~]# bash tj2.sh
/sbin/nologin ::::: 17
/bin/sync ::::: 1
/bin/bash ::::: 3
/sbin/shutdown ::::: 1
/sbin/halt ::::: 1
2、将域名取出并根据域名进行计数排序处理(常用)
cat 1.txt | awk -F "/+" '{ip[$2]++}END{for(i in ip) print i,ip[i]}' | sort -rnk2


3、替换硬件地址小写为大写,去掉:
# ip a | grep "link/ether" | awk -F" " '{print $2}' | tr '[a-z]' '[A-Z]'|sed 's/://g'
4、打印某行某列
# cat /etc/passwd | column -s : -t | awk 'NR==2 {print $3}' #NR表示行,$跟列($0特殊,表示本行)
# cat /etc/passwd | column -s : -t | awk 'NR==2,NR==4 {print $3}' #行的范围
# cat /etc/passwd | column -s : -t | awk 'NR==1' #只要某行时,不需要跟print就能出来
root x 0 0 root /root /bin/bash
注意:column -t 表示把输出以表格显示,-s参数是指定输出中已经存在的字符变为空格符。
5、sed和cut
# sed -n 1,5p file1 | cut -d : -f1-6 (1,5p打印范围,-d 指定分隔符,-f字符串) root:x:0:0:root:/root bin:x:1:1:bin:/bin daemon:x:2:2:daemon:/sbin adm:x:3:4:adm:/var/adm lp:x:4:7:lp:/var/spool/lpd
# sed -n 1,5p file1 | cut -c1-6(-c从左往右一个单字符就算一个整体) root:x bin:x: daemon adm:x: lp:x:4 打印1行5列 # sed -n 4p file1 |cut -c 5 (文本里是连续纯字符,-d 和 -f 组合就不适用了) 5
6、awk拼接打印
# docker images | grep 192 | awk 'BEGIN{OFS=":"}''{print $1,$2}' > 1.txt
# cat images.txt | awk '{print $1 ":" $2}'
OFS=":"表示以:为拼接符号
或者awk '{print $x".xxx"}',xxx为任意想要添加的变量
cat output.txt | awk '{print $4".bmp"}' > bar
cat bar
RBA32010419vbjk101638.bmp
RBA320104197904101611.bmp
或者
docker images | grep harbor | awk '{print "docker tag" " " $3 " " $1":"$2}'
docker tag 18036ee471bc harbor.cetccloud.com/amd64/redis-photon:v1.8.2
docker tag ad798fd6e618 harbor.cetccloud.com/amd64/harbor-registryctl:v1.8.2
docker tag 081bfb3dc181 harbor.cetccloud.com/amd64/registry-photon:v2.7.1-patch-2819-v1.8.2
paste拼接命令方式
paste -d -s -file1 file2
选项的含义如下:
-d 指定不同于空格分隔符,如果不指定,默认用空格分割
-s 将每个文件合并成行而不是按行粘贴。
- 使用标准输入。例如ls -l | paste ,意即只在一列上显示输出
-s用法
# cat per1 ID897 ID666 ID982 # cat per2 P.Jones S.Round L.Clip # paste per1 per2 ID897 P.Jones ID666 S.Round ID982 L.Clip # paste -s per1 per2 ID897 ID666 ID982 P.Jones S.Round L.Clip
-d案例
paste file1.txt file2.txt 12345 6789 paste -d "+" file1.txt file2.txt 12345+6789 paste -d "" file1.txt file2.txt 123456789 交叉合并 $ cat 123.txt aa bb cc dd $ cat 456.txt 11 22 33 $ paste 123.txt 456.txt |tr "\t" "\n" aa 11 bb 22 cc 33 dd
7、awk -F分隔符 'BEGIN { 初始化 } { 循环执行部分 } END { 结束处理 }' file1 file2
NR放在循环执行部分
# awk '{print NR,$0}' aa.txt,表示行数,显示行号。
1 aadak
2 ksdlb
3 d;smlb
4 fl; b
放在 END { 结束处理 }',表示最后一行。
# awk 'END{print NR,$0}' aa.txt
4 fl; b
8、求和(docker images镜像的大小)
# cat 1.sh |grep MB | awk '{sum+=$7}END{print sum}'
7256
# cat 1.sh |grep MB| awk '{print sum+=$7}END{print sum}'
697
1105
1513
1926
2359
2773
3693
4118
4543
5030
5623
6465
6848
7256
7256
9、tr常用操作
echo 1 2 3 4 5 6 7 8 9 | xargs -n1 | echo $[ $(tr '\n' '+') 0 ] 45 注:$[]表示计算,0表示末尾要加的数,因为会9后面的回车符会换成+号。 xargs -n1 :表示每次只传递一个参数 echo 1 2 3 4 | xargs -n1 1 2 3 4 echo 1 2 3 4 | xargs -n2 1 2 3 4 批量解压*.tar.gz文件。 ls *.tar.gz | xargs -n1 tar -zxvf echo 1 2 3 4 5 6 7 8 9 | xargs -n1 | echo $[ $(tr '\n' '+') 1 ] 46 echo 1 2 3 4 5 6 7 8 9 | xargs -n1 | echo $[ $(tr '\n' '+') 2 ] 47 echo 1 2 3 4 5 6 7 8 9 |tr ' ' '+' 1+2+3+4+5+6+7+8+9 echo 1 2 3 4 5 6 7 8 9 |tr ' ' '+'|bc 45
-s 压缩重复的部分或者是把多个字符当做一个整体
cat 1.sh |grep MB| awk '{print $7}'| tr "MB\n" '+'
697+++408+++408+++413+++433+++414+++920+++425+++425+++487+++593+++842+++383+++408+++
cat 1.sh |grep MB| awk '{print $7}'| tr -s "MB\n" '+'
697+408+408+413+433+414+920+425+425+487+593+842+383+408+
-d 删除
# cat 1.sh |grep MB| awk '{print $7}'
697MB
408MB
408MB
# cat 1.sh |grep MB| awk '{print $7}'|tr -d MB
697
408
408
10、生成任意长度的字符串
# head /dev/urandom | tr -dc A-Za-z0-9 | head -c 12 FZmEl60TxdvX
11、打印所有的进程、slab分别占用内存总量(linux系统内存消耗主要有三个地方:进程、slab、pagecacge)
# echo `ps aux |awk '{mem += $6} END {print mem/1024/1024}'` GB
0.494217 GB
# echo `cat /proc/meminfo|grep Slab|awk '{mem += $2} END {print mem/1024/1024}'` GB
0.111328 GB
12、取出本机ip
#hostname -i |awk -F" " '{print $2}' #注意,{}外面的单引号
192.168.40.132
#hostname -i
fe80::20c:29ff:fece:16d0%ens33 192.168.40.132 172.17.0.1
#hostname -I
192.168.40.132 172.17.0.1
13、数组结合for循环
# cat clean-rook-dir.sh
hosts=(
ke-dev1-master3
ke-dev1-worker1
ke-dev1-worker3
ke-dev1-worker4
)
for host in ${hosts[@]} ; do
ssh $host "rm -rf /var/lib/rook/*"
done
14、查看Apache的并发请求数及其TCP连接状态
netstat -n | awk ‘/^tcp/ { S[$NF]} END {for(a in S) print a, S[a]}’
结果解读
LAST_ACK 5 SYN_RECV 30 ESTABLISHED 1597 FIN_WAIT1 51 FIN_WAIT2 504 TIME_WAIT 1057 其中的SYN_RECV表示正在等待处理的请求数;
ESTABLISHED表示正常数据传输状态;
TIME_WAIT表示处理完毕,等待超时结束的请求数。 关于TCP状态的变迁,可以从下图形象地看出: 状态:描述 CLOSED:无连接是活动的或正在进行 LISTEN:服务器在等待进入呼叫 SYN_RECV:一个连接请求已经到达,等待确认 SYN_SENT:应用已经开始,打开一个连接 ESTABLISHED:正常数据传输状态 FIN_WAIT1:应用说它已经完成 FIN_WAIT2:另一边已同意释放 ITMED_WAIT:等待所有分组死掉 CLOSING:两边同时尝试关闭 TIME_WAIT:另一边已初始化一个释放 LAST_ACK:等待所有分组死掉
15、多个分隔符提取多个字段
log.txt的内容格式大概如下:
30000|ddddd|/jjjjj/22/nn|20000 3|mmm|/ffffff/222222/mmmmmm|111111
每行的第一个数据和第三个数据和第五个数据截出来,用“,”隔开,写法如下
awk -F'[|/]' '{OFS=","}{print $1,$4,$6}' log.txt
16、统计当前目录中以.html结尾的文件总大
find . -name "*.html" -exec du -k {} \; |awk '{sum+=$1}END{print sum}'
或者
for size in $(ls -l *.html |awk '{print $5}'); do
sum=$(($sum+$size))
done
echo $sum
for 和数组
#!/bin/bash
a="
file1
file2
file3
file4
file5
file6
file7
file8
"
for i in ${a[*]}
do
mkdir $i
done
echo "输出数组的所有元素: ${a[*]}"
关于shell中数组array的补充
1、定义
数组中可以存放多个值。Bash Shell 只支持一维数组(不支持多维数组),初始化时不需要定义数组大小(与 PHP 类似)。
与大部分编程语言类似,数组元素的下标由 0 开始。
Shell 数组用括号来表示,元素用"空格"符号分割开,语法格式如下:
array_name=(value1 value2 ... valuen)
2、创建与查看
##方式1
my_array=(A B "C" D)
##方式2
array_name[0]=value0
array_name[1]=value1
array_name[2]=value2
##查看数组元素
echo ${array_name[index]}
获取数组中的所有元素
使用 @ 或 * 可以获取数组中的所有元素
在数组前加一个感叹号 ! 可以获取数组的所有键,例如:
declare -A site
site["google"]="www.google.com"
site["runoob"]="www.runoob.com"
site["taobao"]="www.taobao.com"
echo "数组的键为: ${!site[*]}"
echo "数组的键为: ${!site[@]}"
获取数组的长度
获取数组长度的方法与获取字符串长度的方法相同,例如:
my_array[0]=A
my_array[1]=B
my_array[2]=C
my_array[3]=D
echo "数组元素个数为: ${#my_array[*]}"
echo "数组元素个数为: ${#my_array[@]}"
3、关联数组
Bash 支持关联数组,可以使用任意的字符串、或者整数作为下标来访问数组元素。
类似于py的字典,用-A指定
关联数组使用 declare 命令来声明,语法格式如下:
declare -A array_name
-A 选项就是用于声明一个关联数组。
关联数组的键是唯一的。
以下实例我们创建一个关联数组 site,并创建不同的键值:
declare -A site=(["google"]="www.google.com" ["runoob"]="www.runoob.com" ["taobao"]="www.taobao.com") ##也可以先声明一个关联数组,然后再设置键和值 declare -A site site["google"]="www.google.com" site["runoob"]="www.runoob.com" site["taobao"]="www.taobao.com"
4、数组操作案例
场景:ansible hosts文件中定义了一组标签,想要取出swarm-03的标签,将标签添加到新的swarm-02节点
[docker_swarm_worker] swarm-02 swarm_labels='["secondary-manager", "opt", "es1", "mysqls", "common"]' swarm-03 swarm_labels='["dp", "kafka", "logstash", "es3", "dataflow_task", "systools", "common", "nacos"]'
shell部分代码
function add_tag() {
# 从文本中解析出的标签字符串
label_string=$(cat /etc/ansible/hosts | grep docker_swarm_worker -A 4 | grep $1 | grep -oP 'swarm_labels=\K.*')
# 使用 sed 删除反斜杠,方括号,双引号,'和\
# cut -c 2- 表示从第二个字符到末尾结束做保留,rev反转
label_list=$(echo $label_string | tr -d '["]' | cut -c 2- | rev | cut -c 2- | rev)
# 使用逗号将标签字符串分割为数组
IFS=',' read -ra labels <<< "$label_list"
# 循环标签数组,每个标签都使用docker node update --label-add方式添加到swarm-02上
for label in "${labels[@]}"; do
ssh ${new_master_ip} "docker node update --label-add $label=true $2"
done
}
if [ ${node_num} -eq 2 ]; then
add_tag swarm-03 ${curr_node_name}
elif [ ${node_num} -eq 4 ];then
add_tag swarm-05 ${curr_node_name}
else
exit 1
fi
注释:
1、在grep命令中,-o选项表示仅把匹配的部分打印出来,-P选项表示使用Perl的正则表达式。
\K是一个在Perl正则表达式中的特殊序列,表示"忽略前面已经匹配的内容"。'swarm_labels=\K.*'表示匹配'swarm_labels='和其后面的任何内容,但是只获取和返回=号之后的内容。所以,如果你有一行内容如下:
swarm-05 swarm_labels='["dp", "kafka", "logstash", "dataflow_task", "systools", "common", "nacos"]'
grep -oP 'swarm_labels=\K.*'会返回:
'["dp", "kafka", "logstash", "dataflow_task", "systools", "common", "nacos"]'
2、tr -d '["]' 表示删除所有的 ' (单引号)," (双引号) 和 [,] 这些字符。
dp, kafka, logstash, dataflow_task, systools, common, nacos
3、IFS=',' read -ra labels <<< "$label_list"
作用是将变量$label_list的内容按分隔符,解析,并分割为一个数组labels。
-
IFS=',': 这是bashshell中的特殊变量,全名是Internal Field Separator(内部字段分隔符),用来定义分词时的分割字符。在这里,我们设置IFS=',',意味着接下来的读取操作将使用,作为分割符。 -
read -ra labels:read命令用于读取一行输入。-a选项的作用是将读取到的数据分割成数组。-r选项的作用是使得read命令不会把反斜杠字符解释为转义字符。在这个命令中,我们使用read -ra labels读取分割后的数据到数组labels中。 -
<<< "$label_list":<<<是shell的一种输入重定向操作,它将$label_list的值作为输入传递给前面的read命令。 -
执行完这个命令后,
$labels变成了一个数组,其中存储了以,分割的每一个子项。例如,如果$label_list为dp, kafka, logstash, dataflow_task, systools, common, nacos,那么$labels将会是一个包含了各个项dpkafkalogstashdataflow_tasksystoolscommonnacos的数组。
https://www.runoob.com/linux/linux-shell-array.html 数组

浙公网安备 33010602011771号