开发服务器恢复手记与心得


8月20日,就在iSolution上线的第二天,本来想好好整整开发网服务器的我,却被服务器给整了。

记录
8月20日下午,拿着一块1T的硬盘,到数据中心给开发网服务器加上,自此,该服务器就再也起不来了。
此服务器上运行着开发网的AD、Exchange、DNS、SVN、VSS、SQLServer、artifactory、Memcached、文件共享等众多服务,服务的停止直接导致开发网的兄弟们无法开发、无法访问网站,纷纷罢工。

迫于压力,我只好马上在一台机器上装了SQLServer和DNS,使开发和网络能够暂时延续。

由于AD从来没有做备份过,我只能寄希望于服务器操作系统能够恢复,经过多次几天的尝试,机器启动时还是蓝屏,经过专家鉴定,应该是硬盘坏了,可喜的是,里面的数据还能够拷备出来。

考滤到减轻服务负担,防止类似情况发生,我决定将此服务器分为三台,服务分步如下:1、AD、DNS;2、svn、vss、文件共享、artifactory、memached;3、sqlserver、mysql、Exchange;

8月23日,数据库服务器独立成功,上面分别跑了sql2000、sql2005、mysql,不过sql2000运行在1444端口,连接时有点麻烦;
8月25日,源码服务器独立成功,svn、vss恢复正常;
8月26日,重新安装了域和dns,并手动建立了账号(还好只有十多个人),再安装一个辅助域控,以便自动备份;

至此,开发服务器基本恢复,后续再计划装一台Linux的Oralcle数据库服务器。

心得
1、AD域与Exchange服务存放在不同服务器,否则关机会无法完成,需要手动关闭exchange服务才能正常关机;
2、服务尽量分离,不要把鸡蛋放在一个篮子里,否则损失会很大;
3、核心服务及时做备份,特别是域备份(详细可参考:http://blog.zol.com.cn/1756/article_1755966.html);
4、利用一个网卡配置多个IP和Apache Proxy等方法,可以很好的实现服务器间的无缝迁移;
5、AD域重新安装并建立账号,确保域名称和旧域一致,账号上勾选“用户第一次登录时需更改密码”,可以避免域的机器重新加域和系统用户变动的现象(第一次登录时,使用新密码,修改完密码大概过一分钟后,即可以使用新账号登录);


posted @ 2010-08-28 16:20  canbeing  阅读(795)  评论(2编辑  收藏