linux运维工程师超简单排障思路
很多朋友遇到服务器故障的时候很可能一脸茫然,不知所措,所以接下来我来介绍几种思路帮着排查问题,非常简单,希望能帮到你们~
1、尽可能排查前因后果
-
故障有没有报错
-
故障出现时间
-
故障是不是可以重现
-
最近一次调整服务器是是什么操作
-
监控平台是否可用
-
是不是有日志
2、历史命令
$history
查看服务器之前执行过什么命令,加上前面说的谁登录系统的信息,有助于提供排查思路。
3、现在运行的进程是什么
$ps aux
$ps aux可以看到正在运行的进程和用户
4、cpu和内存
$top
命令可以查看剩余多少内存,剩余多少cpu是否某些cpu负载过多了,服务器最大的负载来自什么地方。
5、查看系统日志
$less /var/log/secure
查看错误和预警信息,tomcat和apache这些应用相应的日志文件也可进行对比排查。
6、查看磁盘空间
$df -h
查看服务器磁盘和挂载了多少文件系统,磁盘空间剩余多少,有助于分析问题。

浙公网安备 33010602011771号