CPU运维

1,硬件问题

    1,登录bmc,查看日志

      (如果bmc登录不了,且不能开机,可能是主板坏了需要更换主板)

    2,检查cpu是否有降频  lscpu

    3,检查cpu是否有offline  lscpu

2,软件问题

        排查思路: 1,查看系统cpu的使用情况 top

                        2,查看cpu的使用情况以及平均负载  vmstat 1

                        3,  查看所有cpu的核信息 mpstat -P ALL 1

                        4,  通过前面三步的查询,确认异常进程,然后查看进程信息

                             进程cpu的统计信息 pidstat -u 1 -p pid ( pidstat  -p  pid )

                        5,  跟踪进程内部函数级cpu使用情况  perf top -p pid -e cpu-clock

 

3, 性能测试

              sysbench --test=cpu --cpu-max-prime=20000000 run --num-threads=4

 

4,cpu拓展

   平均负载    uptime  top

  系统整体CPU使用率   vmstat   mpstat  top  sar  /proc/stat

  进程CPU使用率    top pidstat ps htop atop

  系统上下文切换    vmstat

  进程上下文切换    pidstat

  软中断    top /proc/softirqs mpstat

  硬中断    vmstat /proc/interrupts

  网络   dstat  sar  tcpdump

  I/O     dstat sar

  cpu个数    /proc/cpuinfo  lscpu

  事件剖析   perf execsnoop

  进程父子关系   pstree

posted @ 2021-11-18 14:47  天人互动  阅读(100)  评论(0)    收藏  举报