top命令输出解释以及load average 详解及排查思路

原地址： https://blog.csdn.net/zhangchenglikecc/article/details/52103737

1.top输出以及load average 详解

昨天nagios报警warning，没来得及留下报警截图，nagios值设定的值是

当1分钟多于15个进程等待,5分钟多于10个,15分钟多于5个则为warning状态

当1分钟多于30个进程等待,5分钟多于25个,15分钟多于20个则为critical状态

—————————————————————————————————————————————————————————-

MySQL主服务器load average 骤增

虽然没来得及排查出来最后又下去了，但是在增长的时候没有最后落实这个错误，着实很难过，在网上看许多资料，大部分都是一样的解释，转载的，抄袭的，心中也是错乱，最终就是一个问题在困扰，这三个数值，是本身内核计算完CPU单核的值，还是未除以CPU核数之前的值，这个问题在许多论坛和博文里，有不同的说法，但是大部分还是倾向于是除完的，实在无解，半夜求解同学胖伟，骚伟已FQ，跑到国外技术网站，给了我这么一段话。

我蹩脚的翻译过来（不对的地方请多指正）

在多处理器系统上

负载相对于可用的处理器内核的数量是相对的

“100%利用”标志负载为1，只是标志在一个单一的核心系统

2标志是在双核，4是标志在四核等
因此，有一个 14 load average值和 24个内核的负载平均，你的服务器是远离超载的

（一天的心结·······释然）

—————————————————————————————————————————————————————————-

以下是从不同地方摄取精华并重新整理已方便自己以后查阅

load average

以下命令均可获取load average系统平均负载

]# top

]# uptime

]# w

]# cat /proc/loadavg

/proc文件系统是一个虚拟的文件系统，不占用磁盘空间，它反映了当前操作系统在内存中的运行情况，查看/proc下的文件可以了解到系统的运行状态。查看系统平均负载使用“cat /proc/loadavg”命令，输出结果如下

前三个数字是1、5、15分钟内的平均进程数。后面的 1/331 一个的分子是正在运行的进程数，分母是进程总数；另一个是最近运行的进程ID号。

top获取：

系统平均负载被定义为：在特定时间间隔内运行队列中(在CPU上运行或者等待运行多少进程)的平均进
程数。

如果一个进程满足以下条件则其就会位于运行队列中：

上图椭圆部分3个数值分别表示系统在过去1分钟、5分钟、15分钟内运行进程队列中的平均进程数量。
运行队列嘛，没有等待IO，没有WAIT，没有KILL的进程通通都进这个队列。
　　- 它没有在等待I/O操作的结果
　　- 它没有主动进入等待状态(也就是没有调用’wait’)
　　- 没有被停止(例如：等待终止)

我们可以这样认为，就是正在运行的进程 + 准备好等待运行的进程在特定时间内（1分钟，5分钟，10分钟）的平均进程数

但是具体平均时候分母的值是按秒还是什么单位运算的？我也搞不清楚，大概就是这样算出来的值，不影响对系统初步性能瓶颈判断，此处先略过

在Linux中，进程分为三种状态，一种是阻塞的进程blocked process，

一种是可运行的进程runnable process，

另外就是正在运行的进程running process。当进程阻塞时，进程会等待I/O设备的数据或者系统调用。

进程可运行状态时，它处在一个运行队列run queue中，与其他可运行进程争夺CPU时间。系统的load是指正在运行running one和准备好运行runnable one的进程的总数。比如现在系统有2个正在运行的进程，3个可运行进程，那么系统的load就是5，load average就是一定时间内的load数量均值

—————————————————————————————————————————————————————————-

看到一篇文章小汽车的举例说的很不错，但是更深层次的我觉得有个打电话的写的更加详细，现以小汽车举例

为了更好地理解系统负载，我们用交通流量来做类比。

单核CPU可以想象成单车道

比如每个圆圈都是小汽车，第一种是满负荷但CPU时间片不用排队等待正好够用，第二种是%50空闲，第三个是超负荷50%，后面的就有队列等待了

1.单核CPU，数字在0.00-1.00之间正常
0.00-1.00 之间的数字表示此时路况非常良好，没有拥堵，车辆可以毫无阻碍地通过。
1.00 表示道路还算正常，但有可能会恶化并造成拥堵。此时系统已经没有多余的资源了，管理员需要进行优化。
1.00以上表示路况不太好了，如果到达2.00表示有桥上车辆一倍数目的车辆正在等待。这种情况你必须进行检查了。

2.多核CPU - 多车道数字/CPU核数在0.00-1.00之间正常

用双核举例，双核的负载已经比单核提高一倍了，那多核的也是同理。

多核CPU的话，满负荷状态的数字为 “1.00 * CPU核数”，即双核CPU为2.00，四核CPU为4.00。
3、安全的系统平均负载
这里没有完全的定论，一般来讲70%左右的负载也就是0.7左右应该是没问题的，要根据实际生产环境中实际需求来进行浮动设定
4、应该看哪一个数字，1分钟，5分钟还是15分钟？
和收过桥费的管理员一样，你当然希望你的汽车(操作)不会被焦急的等待。所以，理想状态下，都
希望负载平均值小于 1.00 。当然不排除部分峰值会超过 1.00，但长此以往保持这个状态，就说明会
有问题，这时候你应该会很焦急。
　　“所以你说的理想负荷为 1.00 ?”
　　嗯，这种情况其实并不完全正确。负荷 1.00 说明系统已经没有剩余的资源了。在实际情况中，有
经验的系统管理员都会将这条线划在 0.70：
　　“需要进行调查法则”：如果长期你的系统负载在 0.70 上下，那么你需要在事情变得更糟糕之
前，花些时间了解其原因。
　　“现在就要修复法则”：1.00 。如果你的服务器系统负载长期徘徊于 1.00，那么就应该马上解决
这个问题。否则，你将半夜接到你上司的电话，这可不是件令人愉快的事情。
　　“凌晨三点半锻炼身体法则”：5.00。如果你的服务器负载超过了 5.00 这个数字，那么你将失去
你的睡眠，还得在会议中说明这情况发生的原因，总之千万不要让它发生。

　　先脱离下主题，我们来讨论下多核心处理器与多处理器的区别。从性能的角度上理解，一台主机拥
有多核心的处理器与另台拥有同样数目的处理性能基本上可以认为是相差无几。当然实际情况会复杂得
多，不同数量的缓存、处理器的频率等因素都可能造成性能的差异。
　　但即便这些因素造成的实际性能稍有不同，其实系统还是以处理器的核心数量计算负载均值。这使
我们有了两个新的法则：
　　“有多少核心即为有多少负荷”法则：在多核处理中，你的系统均值不应该高于处理器核心的总数
量。
　　“核心的核心”法则：核心分布在分别几个单个物理处理中并不重要，其实两颗四核的处理器等
于四个双核处理器等于八个单处理器。所以，它应该有八个处理器内核。
5、怎样知道我的CPU是几核呢？
使用以下命令可以直接获得CPU核心数目

查看物理CPU的个数

#cat /proc/cpuinfo |grep “physical id”|sort |uniq|wc –l

查看逻辑CPU的个数

#cat /proc/cpuinfo |grep “processor”|wc –l

查看CPU是几核

#cat /proc/cpuinfo |grep “cores”|uniq

查看CPU的主频

#cat /proc/cpuinfo |grep MHz|uniq 直接获得CPU核心数（该命令即可全部算出多少核）
#grep ‘model name’ /proc/cpuinfo | wc -l

取得CPU核心数目N，观察后面2个数字，用数字/N，如果得到的值小于0.7即可无忧。

一般来讲我们观察五分钟或者十五分钟的平均数值。坦
白讲，如果前一分钟的负载情况是 1.00，那么仍可以说明认定服务器情况还是正常的。但是如果十五
分钟的数值仍然保持在 1.00，那么就值得注意了要考虑是否这应该增加的处理器数量
了

整理到这里，想起了一个好文章，大概也讲的是CPU利用率和load Average的区别

链接为http://wenku.baidu.com/view/6597f58884254b35eefd34f7.html

写的很好，为我们更深层次的理解该指标有一定意义，我摘一些精华部分出来供以后自己学习

CPU利用率和Load Average的区别

CPU利用率在过去常常被我们这些外行认为是判断机器是否已经到了满负荷的一个标准，看到50%-60%的使用率就认为机器就已经压到了临界了。CPU利用率，顾名思义就是对于CPU的使用状况，这是对一个时间段内CPU使用状况的统计，通过这个指标可以看出在某一个时间段内CPU被占用的情况，如果被占用时间很高，那么就需要考虑CPU是否已经处于超负荷运作，长期超负荷运作对于机器本身来说是一种损害，因此必须将CPU的利用率控制在一定的比例下，以保证机器的正常运作。

Load Average是CPU的Load，它所包含的信息不是CPU的使用率状况，而是在一段时间内CPU正在处理以及等待CPU处理的进程数之和的统计信息，也就是CPU使用队列的长度的统计信息。为什么要统计这个信息，这个信息的对于压力

测试的影响究竟是怎么样的，那就通过一个类比来解释CPU利用率和Load Average的区别以及对于压力测试的指导意义。

我们将CPU就类比为电话亭，每一个进程都是一个需要打电话的人。现在一共有4个电话亭（就好比我们的机器有4核），有10个人需要打电话。现在使用电话的规则是管理员会按照顺序给每一个人轮流分配1分钟的使用电话时间，如果使用者在1分钟内使用完毕，那么可以立刻将电话使用权返还给管理员，如果到了1分钟电话使用者还没有使用完毕，那么需要重新排队，等待再次分配使用。

—————————————————————————————————————————————————————————-

在理解了load Average各值得含义之后，我们用top命令来了解系统的整体状态

#top

1. 12:28为当前系统运行时间

2. up 系统运行时间为287天9小时28分钟

3. user 当前登录用户数

4. load average 0.00 0.00 0.00 系统负载，任务队列不同时间段平均长度，分别为1分钟，5分钟，15分钟前到现在

5. Tasks 156 total, 当前进程总数

6. 2 running 正在运行的进程数

7 . 154 sleeping 睡眠的进程数

8. 0 stop 停止的进程数

9. 0zombie 僵尸进程数

10 Cpu(s): 0.0%us, 用户空间占用CPU百分比

11 0.2%sy, 内核空间占用CPU百分比

0.0%ni, 用户进程空间内改变过优先级的进程占用CPU百分比

99.8%id 空闲CPU

0.0%wa 等待输入输出的CPU时间百分比

0.0%hi 硬中断

0.0%si 软中断

0.0%st 实时

备注：(英文解释)

us: is meaning of "user CPU time"
sy: is meaning of "system CPU time"
ni: is meaning of" nice CPU time"
id: is meaning of "idle"
wa: is meaning of "iowait" 
hi：is meaning of "hardware irq"

si : is meaning of "software irq"
st : is meaning of "steal time

12. Mem 32694788k total， (32G) 内存总容量

29566452k used，（28G）使用的物理内存总量

3128336k free， (3G) 空闲内存总量

347952k buffers， (340M) 用做内核缓存的内存量

13.Swap 16416760k total (16G) 交换分区总量

199504k used （195M）使用的交换分区总量

1621725k free （1.5G）空闲的交换分区总量

19508208 cached （19G）缓冲的交换区总量

备注：Linux内存计算方法

多数的linux系统在free命令后会发现free（剩余）的内存很少，而自己又没有开过多的程序或服务。linux的内存管理机制与windows的有所不同。具体的机制我们无需知道，我们需要知道的是，linux的内存管理机制的思想包括（不敢说就是）内存利用率最大化。内核会把剩余的内存申请为cached，而cached不属于free范畴。当系统运行时间较久，会发现cached很大，对于有频繁文件读写操作的系统，这种现象会更加明显。

直观的看，此时free的内存会非常小，但并不代表可用的内存小，当一个程序需要申请较大的内存时，如果free的内存不够，内核会把部分cached的内存回收，回收的内存再分配给应用程序。所以对于linux系统，可用于分配的内存不只是free的内存，还包括cached的内存（其实还包括buffers）。即：

可用内存;=free的内存+cached的内存+buffers的内存

所以，真正的内存利用率 = 可用内存 / 总内存（注意此处 可用内存 由上述公式计算而来，其实这个计算结果在free命令回显中已有，即回显结果第三行”-/+ buffers/cached”，此行第二个数值即为加上了buffers和cached之后的内存，即为上述公式所算的可用内存 

我们free一下

方框里的是真正可用内存，也是上面3个椭圆free+buffers+cached的和

Cache：高速缓存，是位于CPU与主内存间的一种容量较小但速度很高的存储器。由于CPU的速度远高于主内存，CPU直接从内存中存取数据要等待一定时间周期，Cache中保存着CPU刚用过或循环使用的一部分数据，当CPU再次使用该部分数据时可从Cache中直接调用,这样就减少了CPU的等待时间,提高了系统的效率。Cache又分为一级Cache(L1 Cache)和二级Cache(L2 Cache)，L1 Cache集成在CPU内部，L2 Cache早期一般是焊在主板上,现在也都集成在CPU内部，常见的容量有256KB或512KB L2 Cache。

Buffer：缓冲区，一个用于存储速度不同步的设备或优先级不同的设备之间传输数据的区域。通过缓冲区，可以使进程之间的相互等待变少，从而使从速度慢的设备读入数据时，速度快的设备的操作进程不发生间断。

　　Free中的buffer和cache：（它们都是占用内存）：

　　buffer : 作为buffer cache的内存，是块设备的读写缓冲区

　　cache: 作为page cache的内存, 文件系统的cache

　　如果 cache 的值很大，说明cache住的文件数很多。如果频繁访问到的文件都能被cache住，那么磁盘的读IO bi会非常小。

cache是高速缓存，用于CPU和内存之间的缓冲；

buffer是I/O缓存，用于内存和硬盘的缓冲

—————————————————————————————————————————————————————————-

PID：进程ID

USER: 真实用户名称

PR: 优先级

NI: Nice值，负值表示高优先级，正值表示低优先级

VIRT:进程使用的虚拟内存总量，单位kb VIRT=SWAP+RES

RES:进程使用的、未被换出的物理内存大小，单位kb RES=CODE+DATA

SHR:共享内存大小，单位kb

S:进程状态 D=不可中断的睡眠状态 R=运行 S=睡眠 T=跟踪/停止 Z=僵尸进程

%CPU 上次更新到现在的CPU时间占用百分比

%MEM 进程使用的物理内存百分比

TIME+ 进程使用的CPU时间总计，单位1/100秒

COMMAND 命令名/命令行进程名称

——————————————————————————————————————以上是查看top显示的状态，需要依据来做优化，但是top显示的是表象，我们可以通过iostat vmstat命令进一步观察

左图是服务器显示出来的有点乱，我开一台VMware虚拟机进行截图说明

查看系统负载 vmstat

1.procs
r 列表示运行和等待cpu时间片的进程数，如果长期大于1，说明cpu不足，需要增加cpu（难道load也是来这里采集的数据？）
b 列表示在等待资源的进程数，比如正在等待I/O、或者内存交换等

2.memory
swpd 切换到内存交换区的内存数量(k表示)。如果swpd的值不为0，或者比较大，比如超过了100m，只要si、so的
值长期为0，系统性能还是正常
free 当前的空闲页面列表中内存数量(k表示)
buff 作为buffer cache的内存数量，一般对块设备的读写才需要缓冲。
cache: 作为page cache的内存数量，一般作为文件系统的cache，如果cache较大，说明用到cache的文件较多，
如果此时IO中bi比较小，说明文件系统效率比较好。

3.swap

si 由内存进入内存交换区数量。
so由内存交换区进入内存数量。

4.io

IO
bi 从块设备读入数据的总量（读磁盘）（每秒kb）。
bo 块设备写入数据的总量（写磁盘）（每秒kb）
这里我们设置的bi+bo参考值为1000，如果超过1000，而且wa值较大应该考虑均衡磁盘负载，可以结合iostat输出
来分析。

5.system

system 显示采集间隔内发生的中断数
in 列表示在某一时间间隔中观测到的每秒设备中断数。
cs列表示每秒产生的上下文切换次数，如当 cs 比磁盘 I/O 和网络信息包速率高得多，都应进行进一步调查。

6.cpu

cpu 表示cpu的使用状态
us 列显示了用户方式下所花费 CPU 时间的百分比。us的值比较高时，说明用户进程消耗的cpu时间多，但是如果
长期大于50%，需要考虑优化用户的程序。
sy 列显示了内核进程所花费的cpu时间的百分比。这里us + sy的参考值为80%，如果us+sy 大于 80%说明可能存在
CPU不足。
wa 列显示了IO等待所占用的CPU时间的百分比。这里wa的参考值为30%，如果wa超过30%，说明IO等待严重，这
可能是磁盘大量随机访问造成的，也可能磁盘或者磁盘访问控制器的带宽瓶颈造成的(主要是块操作)。
id 列显示了cpu处在空闲状态的时间百分比

—————————————————————————————————————————————————————————-

iostat 查看磁盘负载iostat
每隔2秒统计一次磁盘IO信息，直到按Ctrl+C终止程序，d选项表示统计磁盘信息， k表示以每秒KB的形式显
示，t要求打印出时间信息，2 表示每隔 2 秒输出一次。第一次输出的磁盘IO负载状况提供了关于自从系统启动以
来的统计信息。随后的每一次输出则是每个间隔之间的平均IO负载状况。

iostat -x 1 2 意思是刷屏信息显示2次，时间间隔为1秒

1.rrqm/s:每秒进行merge(合并)的读操作数目

2.wrqm/s: 每秒进行 merge 的写操作数目。即 delta(wmerge)/s
3.r/s: 每秒完成的读 I/O 设备次数。即 delta(rio)/s
4.w/s: 每秒完成的写 I/O 设备次数。即 delta(wio)/s
5.rsec/s: 每秒读扇区数。即 delta(rsect)/s
6.wsec/s: 每秒写扇区数。即 delta(wsect)/s
9.avgrq-sz:平均每次设备I/O操作的数据大小 (扇区)。delta(rsect+wsect)/delta(rio+wio)
11avgqu-sz:平均I/O队列长度。即 delta(aveq)/s/1000 (因为aveq的单位为毫秒)。
12.await: 平均每次设备I/O操作的等待时间 (毫秒)。即 delta(ruse+wuse)/delta(rio+wio)
13.svctm: 平均每次设备I/O操作的服务时间 (毫秒)。即 delta(use)/delta(rio+wio)
14.%util: 一秒中有百分之多少的时间用于 I/O 操作，或者说一秒中有多少时间 I/O 队列是非空的。即
delta(use)/s/1000 (因为use的单位为毫秒)

如果 %util 接近 100%，说明产生的I/O请求太多，I/O系统已经满负荷，该磁盘
可能存在瓶颈。
%idle（空闲）小于70% IO压力就较大了,一般读取速度有较多的wait.

同时可以结合vmstat 查看查看b参数(等待资源的进程数)和wa参数(IO等待所占用的CPU时间的百分比,高过30%时
IO压力高)

去看

前言
做为一个性能测试工程师，每当我们发现计算机变慢的时候，我们通常的标准姿势就是执行 uptime 或 top 命令，来了解系统的负载情况。

比如像下面这样，我在命令行里输入了 uptime 命令，系统会返回一行信息。

appletekimbp:~ apple$ uptime

20:44 up 21 days, 6:41, 2 users, load averages: 2.85 2.33 2.91

但我想问的是，各位同学知道以上每列输出的含义吗？

20:44 # 当前时间

up 21 days, 6:41 # 系统运行时间

2 users # 正在登录用户数

# 系统的平均负载，分别是1分钟、5分钟、15分钟内系统的平均负载

load averages: 2.85 2.33 2.91

这行信息的后半部分，显示 "load average"，它的意思是"系统的平均负载"，里面有三个数字，我们可以从中判断系统负载是大还是小。

什么是系统平均负载？
我猜一定会有同学会说，平均负载不就是单位时间的 CPU 使用率吗？上面 2.85，就代表 CPU 使用率是 285%。其实不是这样的。

CPU 负载值在 Linux 系统中表示正在运行，处于可运行状态的平均作业数（读取一组与流程执行线程对应的机器语言的程序指令），或者非常重要，休眠但不可中断（不可交错的休眠状态））。也就是说，要计算 CPU 负载的值，只考虑正在运行或等待分配 CPU 时间的进程。不考虑正常的休眠过程（休眠状态），僵尸或停止的过程。

简单来说，平均负载是指单位时间内，系统处于可运行状态和不可中断状态的平均进程数，也就是平均活跃进程数，它和 CPU 使用率并没有直接关系。

进程状态代码 R 正在运行或可运行（在运行队列中） D 不间断休眠（通常为IO） S 可中断休眠（等待事件完成） Z 失效/僵尸，终止但未被其父 T 停止，由作业控制停止信号或因为它被追踪 [...]

这里先解释下，可运行状态和不可中断状态。

可运行状态的进程，指的是正在使用CPU或者正在等待CPU的进程，也就是我们常用 ps 命令看到处于 R 状态（Running 或 Runnable）的进程。

不可中断状态的进程，指的是正处于内核态关键流程中的进程，并且这些流程是不可打断的，比如常见是等待硬件设备的 I/O 响应。也就是我们在Ps 命令看到的D状态(Uninterruptible Sleep，也称为 Disk Sleep）的进程。比如，当一个进程向磁盘读写数据时，为了保证数据的一致性，在得到磁盘回复前，它是不能被其他进程或者中断打断的，这个时间的进程就处于不可中断状态。如果此时的进程被打断，就容易出现磁盘数据与进程数据不一致的问题。

所以，不可中断状态实际上是系统对进程和硬件设备的一种保护机制。

因此，我们可以简单理解为，平均负载其实就是平均活跃进程数。平均活跃进程数，直观上的理解就是单位时间内的活跃进程数。既然平均的是是活跃进程数，那么理想的是，每个CPU上都刚好运行着一个进程，这样每个CPU都得到了充分利用。

以下是单核处理器计算机中不同负载值的含义：

0.00：没有任何作业正在运行或等待 CPU 执行，即 CPU 完全空闲。因此，如果正在运行的程序（进程）需要执行任务，它会向 CPU 请求操作系统，并立即为该进程分配 CPU 时间，因为没有其他进程在竞争它。

0.50：没有任何作业在等待，但 CPU 正在处理以前的作业，并且它正在以 50％的容量进行处理。在这种情况下，操作系统还可以立即将 CPU 时间分配给其他进程，而无需将其置于保持状态。

1.00：队列中没有作业，但 CPU 正在以 100％的容量处理先前的作业，因此如果新进程请求 CPU 时间，则必须将其保留到另一个作业完成或当前 CPU 插槽时间（例如，CPU tick）到期，操作系统决定哪一个是下一个给定的进程优先级。

1.50：CPU 工作在其容量的 100％，15个工作中有5个请求CPU时间，即 33.33％，必须排队等待其他人耗尽他们分配的时间。因此，一旦超过1.0 的阈值，就可以说系统过载，因为它不能立即处理所请求的 100％的工作。

那么很显然，"load average"的值越低，比如等于0.2或0.3，就说明服务器的工作量越小，系统负载比较低。

一个类比
上面还看太懂怎么办？没事，我们来看一个简单的类比例子。

先假设最简单的情况，你的计算机只有一个 CPU，所有的运算都必须由这个 CPU 来完成。

那么，我们不妨把这个 CPU 想象成一座大桥，桥上只有一根车道，所有车辆都必须从这根车道上通过。（很显然，这座桥只能单向通行。）

系统负载为 0，意味着大桥上一辆车也没有。

系统负载为 0.5，意味着大桥一半的路段有车。

系统负载为 1.0，意味着大桥的所有路段都有车，也就是说大桥已经"满"了。但是必须注意的是，直到此时大桥还是能顺畅通行的。

系统负载为 1.7，意味着车辆太多了，大桥已经被占满了（100%），后面等着上桥的车辆为桥面车辆的 70%。以此类推，系统负载 2.0，意味着等待上桥的车辆与桥面的车辆一样多；系统负载 3.0，意味着等待上桥的车辆是桥面车辆的 2 倍。总之，当系统负载大于 1，后面的车辆就必须等待了；系统负载越大，过桥就必须等得越久。

CPU 的系统负载，基本上等同于上面的类比。大桥的通行能力，就是CPU 的最大工作量；桥梁上的车辆，就是一个个等待 CPU 处理的进程（process）。

如果CPU 每分钟最多处理100个进程，那么系统负载0.2，意味着CPU在这 1 分钟里只处理 20 个进程；系统负载 1.0，意味着 CPU 在这 1 分钟里正好处理 100 个进程；系统负载 1.7，意味着除了 CPU 正在处理的100 个进程以外，还有 70 个进程正排队等着CPU处理。

为了计算机顺畅运行，系统负载最好不要超过 1.0，这样就没有进程需要等待了，所有进程都能第一时间得到处理。很显然，1.0 是一个关键值，超过这个值，系统就不在最佳状态了，你要动手干预了。

多处理器和多核系统
在具有多个处理器或核心（多个逻辑 CPU）的系统中，CPU 负载值的含义取决于系统中存在的处理器数量。因此，具有4 个处理器的计算机在达到4.00的负载之前将不会以100％使用，因此在解释由 top，htop 或正常运行时间等命令提供的3个负载值时，你必须要做的第一件事就是将它们分开。系统中存在的逻辑CPU数量，并从中得出结论。

举个例子，如果你的计算机装了 2 个 CPU，会发生什么情况呢？ 2 个 CPU，意味着计算机的处理能力翻了一倍，能够同时处理的进程数量也翻了一倍。还是用大桥来类比，两个 CPU 就意味着大桥有两根车道了，通车能力翻倍了

所以，2 个CPU表明系统负载可以达到 2.0，此时每个 CPU 都达到 100%的工作量。推广开来，n 个 CPU 的计算机，可接受的系统负载最大为n.0。

芯片厂商往往在一个 CPU 内部，包含多个CPU核心，这被称为多核CPU。

在系统负载方面，多核 CPU 与多 CPU 效果类似，所以考虑系统负载的时候，必须考虑这台计算机有几个 CPU、每个 CPU 有几个核心。然后，把系统负荷除以总的核心数，只要每个核心的负荷不超过 1.0，就表明计算机正常运行。怎么知道PC有多少个 CPU 核心呢？

CPU使用率
如果我们观察在给定时间间隔内通过 CPU 的不同进程，则利用率百分比将表示相对于 CPU 执行与每个进程相对应的指令的那个时间间隔的时间部分。但这种计算只运行的进程，而不是那些正在等待，无论它们是在队列（可运行状态）还是休眠但不可中断（例如在等待输入/输出操作的结束）被认为。因此，这个指标可以让我们了解哪些进程最大程度地挤压 CPU，但是如果系统状态过载或者未充分利用，则不能给出真实的系统状态图。

现实工作中，我们经常容易把平均负载和 CPU 使用率混淆，从上面我们知道平均负载是指单位时间内，处于可运行状态和不可中断状态的进程数。所以，它不仅包括正在使用 CPU 的进程，还包括等待 CPU 和等待I/O 的进程。而 CPU使用率，从上面的解释我们知道是单位时间内繁忙程度，跟平均负载并不一定完全对应。比如：

CPU 密集型进程，使用大量 CPU 会导致平均负载升高，这时候两者是一致的。

I/O 密集型进程，等待 I/O 也会导致平均负载升高，但 CPU 使用率不一定很高。

大量等待 CPU 的进程调度也会导致平均负载很高，此时的 CPU 使用率也会比较高。

注意输入/输出（I / O）操作
在本文反复强调了不间断休眠状态非常重要（第一张图中的D），因为有时你可以在计算机中找到非常高的负载值，然而不同的运行过程使用率相对较低。如果你不考虑这种状态，你会发现情况莫名其妙，你将不知道如何处理它。当进程等待某个资源的释放并且其执行不能被中断时，例如当它等待不可中断的 I/O 操作时，进程处于此状态完成（并非所有都是不可中断的）。通常，这种情况是由于磁盘故障，网络文件系统（如NFS故障）或大量使用非常慢的设备（例如USB 1.0 Pendrive）而发生的。

在这种情况下，我们将不得不使用替代工具，如 iostat 或 iotop，它们将指示哪些进程正在执行更多的 I/O 操作，以便我们可以杀死这些进程或为它们分配较少的优先级（nice命令）能够为其他更关键的进程分配更多的CPU 时间。

一些技巧
系统过载并超过1.0的负载值有时不是问题，因为即使有一些延迟，CPU也会处理队列中的作业，负载将再次降低到1.0以下的值。但是如果系统的持续负载值大于1，则意味着它无法吸收执行中的所有负载，因此其响应时间将增加，系统将变得缓慢且无响应。高于1的高值，尤其是最后5分钟和15分钟的负载平均值是一个明显的症状，要么我们需要改进计算机的硬件，通过限制用户可以对系统的使用来节省更少的资源，或者除以多个相似节点之间的负载。

因此，我们提出以下建议：

>=0.70：没有任何反应，但有必要监控 CPU 负载。如果在一段时间内保持这种状态，就必须在事情变得更糟之前进行调查。

>=1.00：存在问题，您必须找到并修复它，否则系统负载的主要高峰将导致您的应用程序变慢或无响应。

>=3.00：你的系统变得非常慢。甚至很难从命令行操作它来试图找出问题的原因，因此修复问题需要的时间比我们之前采取的行动要长。你冒的风险是系统会更饱和并且肯定会崩溃。

>=5.00：你可能无法恢复系统。你可以等待奇迹自发降低负载，或者如果你知道发生了什么并且可以负担得起，你可以在控制台中启动 kill-9<process_name> 之类的命令，并祈求它运行在某些时候，以减轻系统负荷并重新获得其控制权。否则，你肯定别无选择，只能重新启动计算机。
-----------------------------------
©著作权归作者所有：来自51CTO博客作者高楼（Zee）的原创作品，如需转载，请注明出处，否则将追究法律责任
性能基础之理解Linux系统平均负载和CPU使用率
https://blog.51cto.com/u_15181572/2949873

posted @ 2019-07-17 14:29 Bigben 阅读(6542) 评论(0) 收藏举报

刷新页面返回顶部