CPU运维
1,硬件问题
1,登录bmc,查看日志
(如果bmc登录不了,且不能开机,可能是主板坏了需要更换主板)
2,检查cpu是否有降频 lscpu
3,检查cpu是否有offline lscpu
2,软件问题
排查思路: 1,查看系统cpu的使用情况 top
2,查看cpu的使用情况以及平均负载 vmstat 1
3, 查看所有cpu的核信息 mpstat -P ALL 1
4, 通过前面三步的查询,确认异常进程,然后查看进程信息
进程cpu的统计信息 pidstat -u 1 -p pid ( pidstat -p pid )
5, 跟踪进程内部函数级cpu使用情况 perf top -p pid -e cpu-clock
3, 性能测试
sysbench --test=cpu --cpu-max-prime=20000000 run --num-threads=4
4,cpu拓展
平均负载 uptime top
系统整体CPU使用率 vmstat mpstat top sar /proc/stat
进程CPU使用率 top pidstat ps htop atop
系统上下文切换 vmstat
进程上下文切换 pidstat
软中断 top /proc/softirqs mpstat
硬中断 vmstat /proc/interrupts
网络 dstat sar tcpdump
I/O dstat sar
cpu个数 /proc/cpuinfo lscpu
事件剖析 perf execsnoop
进程父子关系 pstree
浙公网安备 33010602011771号