代码改变世界

芯片即王道,微软新DC虚机性能大揭秘

2018-05-04 17:14  WangSong技术点滴  阅读(1262)  评论(0编辑  收藏  举报

芯片即王道,微软新DC虚机性能大揭秘

本文介绍分为以下几个部分:

l  未开启FPGA,东区同一VNET下,两台VM网络性能和延迟测试

l  开启FPGA,东区同一VNET下,两台VM网络性能和延迟测试

VM都是使用(CentOS-7.4标准 E64_v3 (64 vcpu432 GB 内存)

一.              Background

根据之前博客介绍,已经测试目前Azure Region上开启FPGA的性能测试,包括相同情况下,是否开启FPGACPU利用率的影响,具体可以参考之前的blog链接:http://www.cnblogs.com/wangsongshare/p/8746356.html,因为Azure在北京和上海还有增加两个Region,在新Region下虚拟机的类型也变的更多,新增加了Dv3Ev3两种使用超线程技术的机器,一些客户想做嵌套虚拟化的可以选用,同时Ev3的最大可以提供64 core432GB内存, 对于CPU密集型或内存密集型需求的客户业务,提供更多选择,可以支撑SAPWorkload搬上Azure

Azure Region在为客户提供了极大的选择做高可用双活架构,可选择的VM也更加广泛,这篇blog为大家测试新Region网络的性能和FPGA对性能的影响。

在此,我们选取E64_v3最大size机器,因为网络带宽性能都跟机器的size有关系,具体可以参考:https://docs.microsoft.com/zh-cn/azure/virtual-machines/linux/sizes-memory,可以看到E64_v3最大网络带宽可以到30Gbps

本篇采用NTTTCP工具测试吞吐量,qperf测试延迟,因为qperf可以测试精度到微秒级别,所以可以看到开启FPGA对延迟的优化,一般的ping命令,需要通过tcpdump看时间戳进行区分。

NTTTCP安装:https://docs.azure.cn/zh-cn/virtual-network/virtual-network-bandwidth-testing

qperf安装:yum

 

 

 

二.              未开启FPGA,东区同一VNET下,两台VM网络性能测试

1.      qperf延迟测试,取了大概的平均值

 

2.      NTTTCP测试带宽吞吐量

三.              开启FPGA,东区两台VM网络性能测试

1.       qperf测试延迟

2.       NTTTCP测试带宽吞吐量:

 

四.  总结:同一VNET E64v3 Centos7.4测试

Tool

FPGA Disabled

FPGA Enabled

NTTTCP Network

20.87Gbps

30.42Gbps

qperf Latency

0.142ms

0.027ms

1.      吞吐量提升:开启FPGA可以达到官网的标称值30Gbps,比未开启状态吞吐量提高50%,所以针对于大机器可以通过开启FPGA看到吞吐量的差异;

2.      延迟优化:开启FPGA,延迟优化将近5倍,这是一个非常高的提升,这仅仅是测试工具上看到的优化,针对于客户特定的应用场景,还会有更大的提升。