linux运维工程师超简单排障思路

  很多朋友遇到服务器故障的时候很可能一脸茫然,不知所措,所以接下来我来介绍几种思路帮着排查问题,非常简单,希望能帮到你们~

 

1、尽可能排查前因后果

  • 故障有没有报错 

  • 故障出现时间 

  • 故障是不是可以重现 

  • 最近一次调整服务器是是什么操作 

  • 监控平台是否可用

  • 是不是有日志

 

2、历史命令

$history

查看服务器之前执行过什么命令,加上前面说的谁登录系统的信息,有助于提供排查思路。


3、现在运行的进程是什么

$ps aux 

$ps aux可以看到正在运行的进程和用户

 

4、cpu和内存

$top

命令可以查看剩余多少内存,剩余多少cpu是否某些cpu负载过多了,服务器最大的负载来自什么地方。

 

5、查看系统日志

$less /var/log/secure

查看错误和预警信息,tomcat和apache这些应用相应的日志文件也可进行对比排查。


6、查看磁盘空间

$df -h

查看服务器磁盘和挂载了多少文件系统,磁盘空间剩余多少,有助于分析问题。

 

posted @ 2020-04-12 23:32  Rainy0426  阅读(191)  评论(0)    收藏  举报