我学shell程序的记录

1. 将当前目录下的文件去除后缀名".sh"
for i in `ls .`
 do
   mv -v $i `echo ${i%%.sh}`
 done
2.shell中在列文件目录时防止带空格的文件名被显示成2个文件带空格的文件名变量不被当成两个参数
ls -1 目录路径 | while read line
do
echo $line
done
解释:ls后面的-1是用来让文件每行只显示一个,然后我们依次读取这些行,这样就能把指定目录下的文件依次赋给变量$line,然后使用变量$line就行了。
其他情况下对于带有空格情况的处理方式就是对变量加上双引号:
如 rm -r "$a"
3. 统计目录下文件的数目
(1)查看文件夹下的文件个数(当前目录的文件数)
 ls   -l   |grep   "^-"   |   wc   -l   
说明:
 ls   -l   长列表输出该目录下文件信息(注意这里的文件,不同于一般的文件,可能是目录、链接、设备文件等)   
grep   ^-   这里将长列表输出信息过滤一部分,只保留一般文件,如果只保留目录就是   ^d   
wc   -l   统计输出信息的行数,因为已经过滤得只剩一般文件了,所以统计结果就是一般文件信息的行数,又由于一行信息对应一个文件,所以也就是文件的个数。
(2)查看文件夹下的所有文件个数(当前目录的文件和子文件夹的文件数)
find   ./   -type   f   |   wc   -l
或者
ls   -lR|grep   "^-"|wc   -l
4.  在一个目录中搜索某个字符串, 使用grep的-r命令, 即 grep -r string $dirpath
5. gcc 中需要在编译的时候加上一个预定义的宏的话需要使用命令-D, 即:gcc -DMYDEBUG -g -o a1 a.c
6. 我们平时使用Linux的时候经常遇到这样一个问题,举例有这样一种情况:执行命令
$ cp /etc/apt/sources.list /etc/apt/sources.list.bak
这 里面有个问题,明明 /etc/apt/sources 这几个字都是一样的,为什么要打两遍?这样的还算短了,要是更深层的目录,那花的力气可就大了。跟上面例子很相似的情况是:在备份一个文件,重命名一个文 件,或是创建一个链接,都要进行类似的操作,重复一个相同的路径。通常比较明智的做法是先 cd 到那个目录,然后在那个目录下进行操作,完后再 cd 回来。不过这样做还是比较麻烦,有没有足不出户的解决方法?答案是肯定的。
Bash 有个功能叫大括号扩展,大括号包围的,用逗号隔开的参数会扩展为独立的多个参数。具体一点,上面那个备份文件的例子可以写成:
$ cp /etc/apt/sources.{list,list.bak}
Shell 在解释时会自动将后面的参数扩展成两个,就变成了和上面一样的完整命令。这样就实现了足不出户操作,而前面那一串目录只要打一次就行,连 cd 也免敲了。
再继续简化就是:
$ cp /etc/apt/sources.list{,.bak}
这样逗号前面没东西,那么参数就保持原来的不变,逗号后面的照样扩展。
7.awk中的内置变量
FNR                当前输入文件的记录数
FS                  字段分隔字符 (默认为: " ")
NF                   当前记录的字段数
NR                  在工作(job)中的记录数
OFS                输出字段分隔字符(默认为: " ")
ORS                输出记录分隔字符(默认为: "\n")
RS                  输入记录分隔字符(仅用于 gawk 与 mawk)
ARGC             命令行参数的数目
ARGIND          命令行中当前文件在 ARGV 内的索引
CONVFMT       数字转换格式,默认为 %.6gd
ENVIRON          包含当前 shell 环境变量的数组
FILEDWIDTHS    在分隔固定宽度的列表时,使用空白而不是 FS 进行分割的字段宽度列表
FILENAME          当前输入文件的文件名
IGNORECASE     在正则表达式和字符串匹配中不区分大小写
OFMT                 数字的输出格式
RLENGTH            match 函数匹配到的字符串的长度
RSTART             match 函数匹配到的字符串的偏移量
RT              记录终结符,对于匹配字符或者用 RS 指定的正则,gawk 将 RT 设置到输入文本
SUBSEP                数组下标分隔符
8 shell中通配符与正则表达式的区别
通配符    表达的含义    正则表达式
*    匹配 0 或多个字符        .*
?    匹配任意单一字符      .
[a-z]    匹配a-z中的任意单一字符     [a-z]
[!a-z]    匹配不在a-z中的任意单一字符,! 注意区别 ^    [^a-z]
{string1,string2,...}    匹配 sring1或string2其一字串    string1|string2
通配符是系统级的,而正则表达式需要相关工具的支持: egrep, awk, vi, perl
9.读取文件中的每一行的方法:
(1)在for循环中
#! /bin/bash
 IFS=" "
 n=0  
 for line in `cat /etc/passwd`  
 do  
         n=`expr $n + 1`  
         echo -e "$n/t$line"  
 done  
 (2) while循环中
#! /bin/bash
n=0
while read line
do
        n=`expr $n + 1`
        echo -e "$n/t$line"
done < /etc/passwd    
#! /bin/bash
n=0
cat /etc/passwd | while read line
do      
        n=`expr $n + 1`
        echo -e "$n/t$line"
done

while循环的方式要比for循环好,因为for循环对于一行中存在空格的情况处理的不好。
对于while循环和for循环的不同的地方是在循环控制上,while后跟的是一个条件语句,而for后面一般是“变量 in 名字列表”的形式
10. 向sed或awk中传入参数的方法
sed -n "$rowS"','"$rowE"'p' mv.txt |awk -v colS1=$colS1 -v colS2=$colS2 -v colS3=$colS3 -v colS4=$colS4 '{print $colS1 $colS2 $colS3 $colS4}'
从上面可以看到sed与awk的不同,sed是类似将字符串进行组合的方法得到命令,而awk则使用-v选项来说明使用外部的变量来传递参数
 11.shell中同时对多个文件的读写
(1)一个文件分割成多个
有时需要提取文件中的一个或多个列元素生成新的文件,这一操作在Shell里很容易实现。比如有一个数据文件data,有三列信息:姓名、学号、班级。
    redraiment 0612800134 0601
    christine 0612800136 0601
    zb    0612800229 0602
现在需要这个文件的第一列和第二列信息分别存到文件f1和f2中,可以用awk提取,也可以用下面这个简单shell程序:

#!/bin/sh
while read f1 f2 f3
do
echo $f1 >> f1
echo $f2 >> f2
done

(2) 多个文件合并成一个文件
如果想把多个文件重新合并成一个多列文件,而不是追加到文件尾处。例如把上列中生成的f1和f2重新组成join.txt。这时需要同时操作多个文件,就 像C语言中用fopen同时打开多个文件,在shell里也是类似的。只是在shell里叫做“文件描述符”,用“0-9”十个数字表示。其中0、1、2 分别是系统的标准输入、输出、错误。“3-9”则由用户只有使用。我们就可以任选两个来重定向输入。脚本如下:

#!/bin/sh
exec 3<f1
exec 4<f2
while read f1 <&3 && read f2 <&4
do
echo $f1 $f2 >> join.txt
done

这儿其实也告诉我们如何同时读取多个文件的方法。

posted @ 2012-02-02 22:25  Mr.Rico  阅读(797)  评论(0编辑  收藏  举报