性能测试之磁盘读引起IO高案例(四)

案例：当Postgres磁盘读引起IO高

在性能分析的人眼里，性能瓶颈就是性能瓶颈。无论这个性能瓶颈出现在代码层、操作系统层、数据库层还是其他层，最终的目的只有一个结果：解决掉！

有人可能会觉得这种说法过于霸道。

事实上，我要强调的性能分析能力，是一套分析逻辑。在这一套分析逻辑中，不管是操作系统、代码还是数据库等，所涉及到的都只是基础知识。如果是对一个性能团队的要求，我觉得一点也不高。

在性能测试和性能分析的项目中，没有压力发起，就不会有性能瓶颈，也谈不上性能分析了，所以每个问题的前提，都是要有压力。

但不是所有的压力场景都合理，再加上即使压力场景不合理，也能压出性能瓶颈，这就会产生一种错觉：似乎一个错误的压力场景也是有效的。

我是在介入一个项目时，首先会看到场景是否有效。如果无效，我就不会下手去调了，因为即使优化好了，可能也给不出生产环境应该如何配置的结论，那工作就白做了。

所以要先调场景。我经常会把一个性能测试项目里面的工作分成两个阶段：

整理阶段

在这个阶段中，要把之前项目中做错的内容纠正过来，不止有技术里的纠正，还有从上到下沟通上的纠正。

调优阶段

这才真是干活阶段。在这个案例中，同样，我还是要表达一个分析的思路。

案例问题描述

这是一个性能从业人员问的问题：为什么这个应用的update用了这么长时间呢？他还给了我一个截图：

从张图中可以看到时间在100ms左右。根据我的经验，一个SQL执行100ms，对实时业务来说，确实有点长了。

但是这个时间是长是短，还不能下结论。要是也无需要必须写成这种耗时的SQL呢？

接着他又发给我了TPS图。如下所示：

这个TPS图确实……有点乱！还记得前面我对TPS的描述吧，在一个场景中，TPS是要有阶梯的。

如果你在递增的TPS场景中发现了问题，然后为了找这个问题，用同样的TPS级别快速加起来压力，这种方式也是可以的。只是这个结果不作为测试报告，而是应该记录到调优报告当中。

而现在我们看到的TPS趋势，那真是哪哪都挨不上呀。如此混乱的TPS，那必然是性能有问题。

她还告诉了我两个信息。

有100万条参数化数据；
GC正常，dump文件也没有死锁的问题。

这两个信息应该说只是信息，并不能起到什么作用。另外，我也不知道他说的“GC正常”是怎么个正常法，只能相信他说的。

分析过程

照旧，先画个架构图出来看看。有了这个，才能明确知道要面对的系统范围有多大；才能在一个地方出问题的时候，去考虑是不是由其他地方引起的；才能跟着问题找到一条条的分析路径……

下面是一张简单的架构图，从下面这张图可以看到，这不是个复杂的应用，是个非常典型的微服务结构，只是数据库用了PostgreSQL而已。

由于这个反馈的是从服务集群日志中看到的update慢，所以后面的分析肯定是直接对着数据库去了。

这里需要提醒一句，我们看到什么现象，就跟着现象去分析。这是非常正规的思路吧。但就有一些人，明明看着数据库有问题，非要瞪着眼睛跟应用服务较劲。

前不久就有一个人问了起一个问题，说是压力过程中，发现数据库CPU用完了，应用服务器的CPU还有余量，于是加了两个数据库CPU。但是加完之后，发现数据库CPU使用率没有上去，反而应用服务器的CPU用完了。我一听，觉得挺合理的呀，为什么他在纠结应用服务器CPU用完了呢？于是我就告诉他，别纠结这个，先看时间耗在哪了。结果发现应用的时间都耗在读取数据库上了，只是数据库硬件好了一些而已。

因为这是个数据库上的问题，所以我直接查了数据库的资源。

查看vmstat，从这个结果来看，系统资源确实没有用上。不过请注意，这个bi挺高的都30万以上了。那这个值说明了什么呢？我们来算一算。

bi是指每秒读磁盘的块数。所以要先看一下，一个块有多大。

那计算下来大约就是：303624/1024≈300M，显然这个值是不低的。

接下来查看I/O。再执行下iostat看看。

从这个结果来看，%util已经达到了95%左右，同时看rkB/s那一列，确实在300M左右。

接着在master上面执行iotop。

我发现Walsender Postgres进程达到了56.07%的使用率，也就是说它的读在300M左右。但是写的并不多，从图上看只有5.77M/s。

结合上面的几张图，我们后面优化方向就是：降低读取，提高写入。

到这里，我们就得说道说道。这个Walsender Postgres是干什么的，根据自己的理解，画了一个Walsender 的逻辑图：

从这个图中可以看得出来，Walsender和Walreceiver实现了PostgreSQL的master和Slaves之间的流式复制。Walsender取归档目录中的内容（敲黑板了呀！），通过网络网络发送给Walreceiver，Walreceiver接收之后在slave上还原和master数据库一样的数据。

而现在读取这么高，那我们就把读取将下来。

先查看一下几个关键参数。

这两个数对PostgreSQL非常重要。Checkpoint_completion_target这个值标识这次checkpoint完成时间占到下一次checkpoint之间的时间百分比。

这样说似乎不太好理解。画图说明一下：

在这个图中300s就是checkpoint_timeout，即两次checkpoint之间的时间长度。这时若将Checkpoint_completion_target设置为0.1，那就是说checkpoint1完成时间的目标就是在30s以内。在这样的配置下，你就会知道Checkpoint_completion_target设置的越短，集中写的内容就越多，I/O峰值就会高；Checkpoint_completion_target设置的越长，写入就不会那么集中。也就是说Checkpoint_completion_target设置的长，会让写I/O有缓解。