误删文件的经验之谈

一、引言

  曾经在运维hadoop集群的时候,出过这么一回事:当时集群因为需要维修机器所以进行停机维护,但是当启动集群的时候发现集群怎么也起不了,在没有问别的同事的情况下,自己百度了一下问题,发现format操作能解决问题,当时的我对于format是一知半解,后来执行format以后集群是起来了,但是数据没有了。追悔莫及已经没有用了,只能对自己说吃一见长一智;这明显就是误操作导致数据被删。今天就来聊一下怎么能防止误删文件!

二、防止误删数据技巧:

  1、修改或删除数据前请务必备份,最好有异机备份,修改配置等先提交版本管理系统在发布到线上环境。

  2、可以使用mv命令替代rm命令,无用的文件不要着急删除,而是移动到回收站/tmp里面观察一段时间;可以通过设置别名等手段屏蔽rm。

  例如:

alias rm='mv -f --target-directory=/tmp/.trash/'

  3、如果非要删除数据,还可用find结合rm替代单纯的rm,包括设定定时任务等动作执行清理。

  4、如果非要使用rm删除,请尽量先切换目录在删目录下的数据,能不用通配符就不用通配符。

  例如:

[root@Richard /]# cd /jdtest/
[root@Richard /]# rm -f test1 test2

  5、如果非要使用rm删除并且要采用通配符,请按下面方法:

[root@Richard /]# cd /jdtest/
[root@Richard jdtest]# rm -fr *  #目标中不要带有“/”。

  6、应禁止使用类似rm -rf /jdtest/*命令删除:

这个命令中,目标路径中的任意斜线前后如果多了空格可能会带来灾难。
[root@Richard /]# rm -fr /jdtest/*
例如:rm -fr /oldboy/ *,*的前不小心多了空格,会删除当前目录下的所有内容。
[root@Richard /]# rm -fr /jdtest/ *  #会把当前目录根下全删了。
[root@Richard /]# rm -fr /jdtest/ *

  7、如果必须要rm -rf /jdtest/*命令删除,最后的避免错误方法就是要用tab键去补全,不要手敲任何字符,防止误删。

  8、如果删除的不是目录,就不要用rm -rf,采用rm -f 即可,甚至重要的少量文件,可以不用-f,以获得确认删除提示信息。

  9、额外补充,慎用rsync --delete。

三、总结:

  1、删除数据后,多数情况是可以恢复的,但会影响业务的;

  2、例如:需要停机恢复,且数据丢了,较长时间用户访问不了对应数据了;

  3、恢复工具诸如ext3grep等;

  4、事情发生前未雨绸缪永远比发生了再解决好得多;

  5、养成规范、专业科学的运维习惯、运维流程是避免当黑锅侠的关键!

 

posted @ 2017-01-11 22:38  I’m Me!  阅读(625)  评论(0编辑  收藏  举报