系统问题排查总结240414
https://www.cnblogs.com/AllenWoo/p/16341223.html
top命令进行全面查看
关注系统cpu、用户cpu、僵尸进程、硬中断、平均负载、等待I/O CPU、软中断

top命令 进程排序 P 根据 %CPU排序 M 根据%MEM排序 T 根据TIME+排序 首部信息的显示: l 是否展示uptime信息 t 调整显示tasks及cpu信息 1(数字)cpu信息是否分开展示 m 调整显示内存信息的样式
系统cpu使用率高
多核cpu,特别是cpu核数较多时,top页面无法全量展示,可以用mpstat命令进行查看
mpstat -P ALL 1 5 |awk '$13<10 {print $0}' |grep -v Average #mpstat命令查看所有cpu的工作状态,每1秒进行刷新,一共刷新5次;通过awk工具进行过滤,若idle<10,则打印该列
系统维度,查看上下文切换次数
vmstat -w 1 5 #-w宽幅显示,查看更清晰,没什么大用;关注cs列
进程维度,查看上下文切换次数
pidstat -w 1 5 |asw '$6>10000 {print $0}' |grep -v Average #pidstat命令查看所有进程,每1秒进行刷新,一共刷新5次;通过awk工具进行过滤,若nvcswch/s非自愿切换>10000,则打印该列
继续进程分析
待更新
用户cpu使用率高
用户cpu使用率高,则应该关注进程本身
和系统cpu使用率高不同,不用关心上下文切换;关注进程本身吧;如何查看,待更新
僵尸进程
进行进程分析,待更新
硬中断
平均负载
等待I/O CPU
软中断