第二章:Improving On User Commands--16.使用已删除的文档

   既然有了一个被删除文件的目录,而且这个目录是在用户的家目录下的隐藏目录,那么一个让用户检索这些已删除文件的脚本的程序就会非常有用了。不管怎样,想要表明所有可能发生的情况是很难的,因为它包括了没有匹配、仅有一个匹配以及多个匹配三种情况。在多个匹配的情形中,比如,你是想要挑出最新的文件,然后将它还原?还是指明有多少种情况匹配成功,然后就退出?又或是展示下不同情况的数据然后供用户挑选?下面,让我们来看看我们到底都能做些什么...

代码:

  1 #!/bin/sh
  2 
  3 # unrm.sh -- 查找已删除文档中的给定文件或是目录
  4 # 如果有多个匹配,那么给出一个按时间戳排序的结果列表,
  5 # 然后,让用户指定还原哪个
  6 
  7 mydir="$HOME/.deleted-files"
  8 realrm="/bin/rm"
  9 move="/bin/mv"
 10 
 11 dest=$(pwd)
 12 
 13 if [ ! -d $mydir ]; then
 14     echo "`basename $0`: No deleted files directory: nothing to unrm" >&2
 15     exit 1
 16 fi
 17 
 18 cd $mydir
 19 
 20 if [ $# -eq 0 ]; then
 21     echo "Contents of your deleted files archive(sorted by data):"    
 22     # ls中的-F是给列出来的项增加指示器,比如,文件不加后缀,目录加斜杠/,可执行文件加星号*
 23     # ls中的-C是按照列显示
 24     ls -FC | sed -e 's/\([[:digit:]][[:digit:]]\.\)\{5\}//g' \
 25     -e 's/^/ /'    # 这条替换的目的是给行头加空格
 26     exit 0
 27 fi
 28 
 29 # 否则,我们必须使用一个用户指定的模式。
 30 # 让我们来看看该模式在文档中是否匹配多个文件或是目录
 31 
 32 matches="$(ls *"$1" 2> /dev/null | wc -l)"
 33 
 34 if [ $matches -eq 0 ]; then
 35     echo "No match for \"$1\" in the deleted file archive." >&2
 36     exit 1
 37 fi
 38 
 39 if [ $matches -gt 1 ]; then
 40     echo "More than one file or directory match in the archive:"
 41     index=1
 42     # ls中的-t是按照最近修改时间显示
 43     # ls中的-d是只显示目录的名字,而不是显示目录中的内容
 44     for name in $(ls -td *"$1")
 45     do
 46         datetime="$(echo $name | cut -c1-14 | \
 47             awk -F. '{print $5"/"$4" at "$3":"$2":"$1}')"  # 使用awk格式化输出
 48         if [ -d $name ]; then
 49             size="$(ls $name | wc -l | sed 's/[^[:digit:]]//g')"    # 算出$name这个目录中文件的数目
 50             echo "$index) $1 (contents = ${size} itmes, deleted = $datetime)"
 51         else
 52             size="$(ls -sdk1 $name | awk '{print $1}')"    # 计算文件的大小
 53             echo "$index) $1 (size = ${size}Kb, deleted = $datetime)"
 54         fi
 55         index=$(($index+1))
 56     done
 57     echo ""
 58     echo -n "Which version of $1 do you want to restore ('0' to quit)? [1]: "
 59     read desired
 60     if [ ${desired:=1} -ge $index ]; then
 61         echo "$(basename $0): Restore canceled by user: index value too big." >&2
 62         exit 1
 63     fi
 64 
 65     if [ $desired -lt 1 ]; then
 66         echo "$(basename $0): canceled by user." >& 2
 67         exit 1
 68     fi
 69 
 70     restore="$(ls -td1 *"$1" | sed -n "${desired}p")"
 71 
 72     if [ -e "$dest/$1" ]; then
 73         echo "\"$1\" already exists in this directory. Cannot overwrite." >&2
 74         exit 1
 75     fi
 76 
 77     echo -n "Restoring file \"$1\"..."
 78     $move "$restore" "$dest/$1"
 79     echo "done."
 80 
 81     echo -n "Delete the additional copies of this file? [y]: "
 82     read answer
 83 
 84     if [ ${answer:=y} = "y" ]; then
 85         $realrm -rf *"$1"
 86         echo "deleted"
 87     else
 88         echo "additional copies retained."
 89     fi
 90 else
 91     if [ -e "$dest/$1" ]; then
 92         echo "\"$1\" already exists in this directory. Cannot Overwrite." >&2
 93         exit 1
 94     fi
 95 
 96     restore="$(ls -d *"$1")"
 97 
 98     echo -n "Restoring file \"$1\"..."
 99     $move "$restore" "$dest/$1"
100     echo "done."
101 fi
102 
103 exit 0

 

脚本如何工作:
第一个大段的代码,if [ $# -eq 0 ]条件语块,会按此执行:如果没有参数给定,那么就列出删除文档中的所有内容。但这里有个地方隐瞒了。我们并不能展示真实的文件名,因为我们并不想用户看到时间戳,这些时间戳只是用来在内部保护文件名之间并不会相互冲突用的。为了用一种更美观方式展示文件名,sed表达式删除了开始的5个数字段。如果给定了一个参数,它就是要恢复的文件名或是目录了。下一步就是要查明有多少个能匹配给定的名称。下面的语句完成了这个功能:

matches="$(ls *"$1" 2> /dev/null | wc -l)"

在ls的参数中有对不常用的引号,它们是用来保证该模式会匹配到已嵌入空白的文件名,而通配符'*'则被shell适当的扩展了。而2> /dev/null保住了命令中产生的错误信息会被抛弃掉,不会让它们显示给用户看到。丢弃的信息绝大部分有可能是No such file or directory,一般都是由于没找到给定的文件名引起的。如果对给定的文件或是目录名有多个匹配,最复杂的脚本部分,就是if [ $matches -gt 1 ]语块。这个语块,展示了所有的结果。在for循环中的ls命令中使用-t选项,会将文档按照从新到旧排序显示。然后的awk语句将文件名中的时间戳给分割了开来。下面的ls中内含的-k选项是用来计算文件大小时使用千字节(kb)作为单位,而不是平时的字节。

size="$(ls -sdk1 $name | awk '{print $1}')"

脚本会在每个匹配的目录中显示文件的数目,而不是毫无意义的只是显示匹配文件项的大小。一个目录中项的数目事实上很容易计算,使用wc命令:

size="$(ls $name | wc -l | sed 's/[^[:digit:]]//g')"

一旦用户给定一种可能的匹配文件或是目录,对应的扩展名就会被下面的语句定义好:

restore="$(ls -td1 *"$1" | sed -n "${desired}p")"

这个句子包含了一点sed的另类用法。使用-n选项,然后是一个跟着打印命令p的数字(${desired}),这种方法可以很快的从输入流中提取给定行号的行。

运行脚本:
有两种方法调用脚本。第一种,无参数,它会显示删除文档中所有的文件和目录。第二种,有一个要求的文件或是目录名作为参数,脚本要么会恢复该文件或是目录(如果只有一个匹配),要么会显示可以恢复的所有的候选名单,这样用户就可以自行选定一个。

运行结果:
无参数时,脚本会显示所有的删除文档:

1 unrm.sh
2 Contents of your deleted files archive(sorted by data):
3  .a.txt  .a.o*  .adir/

有一个文件名做参数:

1 unrm.sh a.txt
2 More than one file or directory match in the archive:
3 1) a.txt (size = 4Kb, deleted = 11/18 at 17:15:45)
4 2) a.txt (size = 4Kb, deleted = 11/18 at 17:15:10)
5 
6 Which version of a.txt do you want to restore ('0' to quit)? [1] 2
7 Restoring file "a.txt"...done.
8 Delete the additional copies of this file? [y] y
9 deleted

分析脚本:
如果你执行这个脚本,那么就有一个潜在的危险需要注意。没有任何控制或是限制的话,在删除文档中的文件或是目录会无限制增加。为了避免这点,可以添加一个cronjob来减少文档。保留14天内的文档应当时比较合理的了。

 

posted @ 2012-12-18 14:53  十舍七匹狼  阅读(139)  评论(0编辑  收藏  举报