性能测试步骤 - higirle

公告

性能测试步骤

性能测试步骤（一）-熟悉应用

这是整个性能过程最关键的步骤之一，毋庸质疑。

我们必须了解：应用的架构

以我熟悉的应用类型为例。了解了应用架构，我们才能知道，我们需要模拟的是：一般的html静态文件请求、一般的servlet和jsp请求、AJAX请求、还是远程调用请求等。

我们必须了解：应用的功能逻辑

性能测试步骤（二）-测试需求

我们得到的测试需求往往是这么描述的：

这个系统能否支撑100万的uv（每天登录系统的人次）。

言下之意是：按照目前的硬件性能和数量，系统能否支撑100万的uv。

然而，我们了解的是吞吐量、响应时间等指标

吞吐量：系统每秒能处理的请求数，这个指标从服务器的视角，表征系统容量

响应时间：从请求发出到第一个字节返回所需要的时间，这个指标从用户的视角，表征系统响应速度。

那么，请问开发同事：能把测试需求转化成我们熟悉的吞吐量和响应时间吗？

。。。。

答案常常是否定的

怎么办：只能由我们根据经验，把100万uv转化成一系列的指标。

响应时间：根据国外的一些资料，一般操作的响应时间不能高于3~5秒；重要操作，如结账操作的响应时间不能高于15秒。

吞吐量：可以根据已经上线的类似产品进行估计。或者，采用80/20原则进行估计。我们经常使用的是80/20原则。

虽然已经有了响应时间和吞吐量指标，但是测试需求还是不明确的。

我们的测试目的是什么？

是验证当前硬件和软件配置能否支撑100万uv？

是测试当前的硬件和软件配置最多能支撑多少uv?

是帮助开发寻找性能瓶颈？

虽然已经有了响应时间和吞吐量指标，但是测试需求还是不明确的。

我们的测试目的是什么？

是验证当前硬件和软件配置能否支撑100万uv？

是测试当前的硬件和软件配置最多能支撑多少uv?

是帮助开发寻找性能瓶颈？

答案往往是：都要！

根据我们的经验，开发的需求往往是这样的（当然开发一般不会说得那么详细，^_^）：

首先，请你们验证能否支撑100万uv。

如果不能支撑，请找一下性能瓶颈。

主要性能瓶颈解决后，请估计能支撑多少uv，如果不到100w，请估计要加多少机器。

如果能支撑100万，请再加压，看看达到300万uv的时候，系统的性能。

这么一细化，需求基本明确了。

性能测试步骤（三）-测试准备

测试准备包括测试客户端机器准备、测试数据准备、测试脚本准备。

客户端机器：

要足够，否则，如果瓶颈在客户端，就无法评估服务端。

要和服务器保持网络通畅，否则，如果瓶颈在网络，也无法评估服务端。包括：

网络带宽要高于服务器吞吐量

网络带宽要稳定。

测试数据

如果被测功能涉及数据库和高速缓存，通常需要预设很大的数据量才能凸显性能瓶颈，这通常是挺困难的一个环节。

如果是已经上线的应用，数据可以从线上拷贝得到；如果还没有上线，那需要构造类似于线上的数据量。

比如，要测试群聊性能，我们首先需要注册大量用户；然后把测试用户都加入到聊天群中。

测试数据准备的脚本，有时候比测试脚本本身还要多。

对于实在没有办法构造大数据量的情况，如果要测试高速缓存，我们有时候会按数据量的比例减少高速缓存，以使测试结果尽量准确。

测试脚本

Grinder脚本用jython实现

测试脚本的实现往往会花费比较长的时间

因为涉及到应用实现的细节，需要和开发不断交流才能完成。这也是需要了解应用架构的原因之一。

关于sleep time

基于真实模拟的考虑，sleep time还是尽量按照真实时间，并给一定的偏差。

不过对于测试客户端来说，sleep time往往会引起很多客户端测试线程的调度，浪费客户端系统资源。

Sleep time越小，客户端能模拟的吞吐量就越大，所以，实际测试中，我们往往会把sleep time设置为0 。

性能测试步骤（四）-测试执行

测试的执行中，需要监控测试客户端和服务器性能，监控服务器端应用情况：

客户端的系统资源（cpu、io、memory）情况

服务端的系统资源（cpu、io、memory）情况

服务器的jvm运行情况

服务端的应用情况，看是否有异常

响应时间、吞吐量等指标

系统资源监控，linux下可以采用的工具有：vmstat、top、meminfo等。

JVM的监控，可以用jprofiler工具，linux下面的jmap、jhat等。

响应时间、吞吐量等，由grinder提供。

上述这些信息，一般在测试结束后，均需要归档整理，已备后续详细分析

我们自己开发一套脚本，用于以固定的频率获取测试客户端和服务器的vmstat和top输出、grinder的log，并从中截取有用信息保存，用于事后分

析。

每次测试运行完以后，肯定会增加很多数据，需要考虑本次执行对数据量的影响，如果数据量的变化对后续测试会有影响，则需要清理数据。

性能测试步骤（五）-测试分析

测试分析一般跟测试监控息息相关，在测试执行的过程中，用各种监控工具能看到系统运行的状态，并及时发现问题。

常见的问题有：

内存问题

有限资源竞争问题

内存问题

从top中看tomcat的内存占用，这个是不准的，需要用专门的内存分析工具来查看。

工具：jmap，jhat，jstat，可以得到内存快照，得到堆内存的详细信息。

垃圾收集配置会影响系统性能，如果内存块生成和销毁量很大，则能看到系统吞吐量随垃圾收集呈现周期性的变化。

从理论上来说，JAVA会出现内存泄漏的情况，不过我们在被测试的应用中还没有发现过这种情况。

但是，在某些系统架构下，内存会成为瓶颈问题。比如我们曾经测试过聊天系统，每个长连接需要占用5M内存，那么，一台10G内存的服务器只能保持2000个长连接。

共享资源竞争问题

有限资源的竞争有很多，比如Service层的一个共享对象，比如数据库连接，比如数据库中的某一个使用频率很高的数据表。

一个共享资源在一个时间点上，只能被一个线程获得，其他线程必须等待，这就容易造成很多线程的timed wait状态。通过jprofiler工具，能够得到线程快照，并分析改进方法。

性能测试经验交流-偶然性问题

跟一般的功能测试一样，性能测试也会出现偶然性问题。

碰到这种问题，我们需要发挥测试人员的革命精神，追查到底。我们常发现的因素如下：

外部因素变化，比如，某几次测试，有时候好，有时候不好，并没有规律可循。最后发现原来是因为网络不稳定造成。请求返回变化。有时候第二次请求的内容取决于第一次的返回信息（也就是所谓的“关联”），这种关联一般通过string的parse实现，而这一般都不是很可靠，返回一旦变化，可能就会出错。

应用服务器如果是集群，一个用户请求某一台服务器能得到正确返回，但是如果换做另一个用户，可能该服务器并没有该用户的信息，所以返回错误。

性能测试经验交流-客户端并发

测试客户端要模拟高并发，必然要启动多线程，所以肯定也会存在线程并发问题。比如：

在做参数化的时候，存储参数的数组就是一个共享对象。如果要使每个线程的每次循环都读取不一样的参数，那数组下标的更新需要注意并发问题。

比如，如果在脚本中要调用System.out，那么也需要注意这也是一个共享对象，如果调用System.out过多，会导致线程的等待，使客户端性能降低。

性能测试经验交流-测试人员

性能测试由于涉及面广，对测试人员的要求就很高。我想，性能测试人员应该培养如下几方面的能力：

如前所述，对应用架构的透彻理解。

沟通能力，测试进行过程中，一定要培养勤于跟开发沟通的意识，以提高工作效率。

解决问题的能力，在编脚本或者测试执行过程中，会碰到很多问题。首先是不要害怕，先考虑问题的可能原因，然后一步步定位、验证。当然，这个过程，需要调试等经验的不断积累

posted on 2014-04-06 18:42 higirle 阅读(1639) 评论(1) 收藏举报

刷新页面返回顶部