我学shell程序的记录

1. 将当前目录下的文件去除后缀名".sh"

for i in `ls .`
do
mv -v $i `echo ${i%%.sh}`
done

2.shell中在列文件目录时防止带空格的文件名被显示成2个文件带空格的文件名变量不被当成两个参数

ls -1 目录路径 | while read line
do
echo $line
done

解释：ls后面的-1是用来让文件每行只显示一个，然后我们依次读取这些行,这样就能把指定目录下的文件依次赋给变量$line,然后使用变量$line就行了。
其他情况下对于带有空格情况的处理方式就是对变量加上双引号：
如 rm -r "$a"
3. 统计目录下文件的数目
（1）查看文件夹下的文件个数(当前目录的文件数)
ls   -l   |grep   "^-"   |   wc   -l
说明:
ls   -l   长列表输出该目录下文件信息(注意这里的文件，不同于一般的文件，可能是目录、链接、设备文件等)
grep   ^-   这里将长列表输出信息过滤一部分，只保留一般文件，如果只保留目录就是   ^d
wc   -l   统计输出信息的行数，因为已经过滤得只剩一般文件了，所以统计结果就是一般文件信息的行数，又由于一行信息对应一个文件，所以也就是文件的个数。
（2）查看文件夹下的所有文件个数(当前目录的文件和子文件夹的文件数)

find ./ -type f | wc -l
或者
ls -lR|grep "^-"|wc -l

4. 在一个目录中搜索某个字符串, 使用grep的-r命令, 即 grep -r string $dirpath
5. gcc 中需要在编译的时候加上一个预定义的宏的话需要使用命令-D, 即:gcc -DMYDEBUG -g -o a1 a.c
6. 我们平时使用Linux的时候经常遇到这样一个问题，举例有这样一种情况：执行命令
$ cp /etc/apt/sources.list /etc/apt/sources.list.bak
这里面有个问题，明明 /etc/apt/sources 这几个字都是一样的，为什么要打两遍？这样的还算短了，要是更深层的目录，那花的力气可就大了。跟上面例子很相似的情况是：在备份一个文件，重命名一个文件，或是创建一个链接，都要进行类似的操作，重复一个相同的路径。通常比较明智的做法是先 cd 到那个目录，然后在那个目录下进行操作，完后再 cd 回来。不过这样做还是比较麻烦，有没有足不出户的解决方法？答案是肯定的。
Bash 有个功能叫大括号扩展，大括号包围的，用逗号隔开的参数会扩展为独立的多个参数。具体一点，上面那个备份文件的例子可以写成：
$ cp /etc/apt/sources.{list,list.bak}
Shell 在解释时会自动将后面的参数扩展成两个，就变成了和上面一样的完整命令。这样就实现了足不出户操作，而前面那一串目录只要打一次就行，连 cd 也免敲了。
再继续简化就是：
$ cp /etc/apt/sources.list{,.bak}
这样逗号前面没东西，那么参数就保持原来的不变，逗号后面的照样扩展。
7.awk中的内置变量

FNR                当前输入文件的记录数
FS                  字段分隔字符 (默认为： " ")
NF                   当前记录的字段数
NR                  在工作(job)中的记录数
OFS                输出字段分隔字符(默认为： " ")
ORS                输出记录分隔字符(默认为： "\n")
RS                  输入记录分隔字符(仅用于 gawk 与 mawk)
ARGC             命令行参数的数目
ARGIND          命令行中当前文件在 ARGV 内的索引
CONVFMT       数字转换格式，默认为 %.6gd
ENVIRON          包含当前 shell 环境变量的数组
FILEDWIDTHS    在分隔固定宽度的列表时，使用空白而不是 FS 进行分割的字段宽度列表
FILENAME          当前输入文件的文件名
IGNORECASE     在正则表达式和字符串匹配中不区分大小写
OFMT                 数字的输出格式
RLENGTH            match 函数匹配到的字符串的长度
RSTART             match 函数匹配到的字符串的偏移量
RT              记录终结符，对于匹配字符或者用 RS 指定的正则，gawk 将 RT 设置到输入文本
SUBSEP                数组下标分隔符

8 shell中通配符与正则表达式的区别

通配符   表达的含义   正则表达式
*   匹配 0 或多个字符       .*
?   匹配任意单一字符     .
[a-z]   匹配a-z中的任意单一字符    [a-z]
[!a-z]   匹配不在a-z中的任意单一字符，! 注意区别 ^   [^a-z]
{string1,string2,...}   匹配 sring1或string2其一字串   string1|string2

通配符是系统级的，而正则表达式需要相关工具的支持: egrep, awk, vi, perl
9.读取文件中的每一行的方法：
（1）在for循环中

#! /bin/bash
IFS=" "
n=0
for line in `cat /etc/passwd`
do
n=`expr $n + 1`
echo -e "$n/t$line"
done

(2) while循环中

#! /bin/bash
n=0
while read line
do
        n=`expr $n + 1`
        echo -e "$n/t$line"
done < /etc/passwd

#! /bin/bash
n=0
cat /etc/passwd | while read line
do
        n=`expr $n + 1`
        echo -e "$n/t$line"
done

while循环的方式要比for循环好，因为for循环对于一行中存在空格的情况处理的不好。
对于while循环和for循环的不同的地方是在循环控制上，while后跟的是一个条件语句，而for后面一般是“变量 in 名字列表”的形式
10. 向sed或awk中传入参数的方法
sed -n "$rowS"','"$rowE"'p' mv.txt |awk -v colS1=$colS1 -v colS2=$colS2 -v colS3=$colS3 -v colS4=$colS4 '{print $colS1 $colS2 $colS3 $colS4}'
从上面可以看到sed与awk的不同，sed是类似将字符串进行组合的方法得到命令，而awk则使用-v选项来说明使用外部的变量来传递参数
11.shell中同时对多个文件的读写
（1）一个文件分割成多个
有时需要提取文件中的一个或多个列元素生成新的文件，这一操作在Shell里很容易实现。比如有一个数据文件data，有三列信息：姓名、学号、班级。
    redraiment 0612800134 0601
    christine 0612800136 0601
    zb 　　　0612800229 0602
现在需要这个文件的第一列和第二列信息分别存到文件f1和f2中，可以用awk提取，也可以用下面这个简单shell程序：

#!/bin/sh
while read f1 f2 f3
do
echo $f1 >> f1
echo $f2 >> f2
done

（2）多个文件合并成一个文件
如果想把多个文件重新合并成一个多列文件，而不是追加到文件尾处。例如把上列中生成的f1和f2重新组成join.txt。这时需要同时操作多个文件，就像C语言中用fopen同时打开多个文件，在shell里也是类似的。只是在shell里叫做“文件描述符”，用“0-9”十个数字表示。其中0、1、2 分别是系统的标准输入、输出、错误。“3-9”则由用户只有使用。我们就可以任选两个来重定向输入。脚本如下：

#!/bin/sh
exec 3<f1
exec 4<f2
while read f1 <&3 && read f2 <&4
do
echo $f1 $f2 >> join.txt
done

这儿其实也告诉我们如何同时读取多个文件的方法。

posted @ 2012-02-02 22:25 Mr.Rico 阅读(797) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

追随技术WithPassion

学如逆水行舟，不进则退

我学shell程序的记录

公告