自动驾驶网络大学课程W13L2 网络加速ML II

Week 13 Lesson 2

感恩节假期,不上课。

本周Lesson 1的材料的作者来自于美国的公司和学校,P4玩的很溜。

本周不上课也看看文章,作者来自欧洲,伦敦国王学院。文章的出发点是说GPU加速ML的时候报文需要在NIC和GPU之间的多次传递,这样影响了ML的效率,如果NIC能为ML加速就可以节省下这部分的开销了。显然现在GPU也想直接和DPU通信来Bypass CPU也是基于这个出发点。

文章的作者实现了3种不同的设计,基于可编程NIC上的microC编程,利用P4编程P4 NetFPGA可编程网卡,利用Verilog直接编程NetFPGA。

能把这3种设计都玩的溜溜转的真不容易。作者的设计主要用来做以下几种典型的NN应用: 异常检测,流分类,网络断层扫描。

结论:本文提出了一种在商用可编程网卡的数据平面上运行神经网络的N3IC技术。我们在Netronome nrf4000和NetFPGA上对N3IC进行了实验评估。我们讨论了三个用例:流量分类、异常检测和网络断层扫描,展示了N3IC对网络应用的巨大好处。我们的结果表明,N3IC可以很容易地在现有的商业可编程网卡中实现。通过这样做,在流量分析用例中,我们证明了N3IC提供了比最先进的软件实现高1.5倍的吞吐量和低100倍的延迟,同时节省了宝贵的CPU资源。同时,网卡支持N3IC而成为一种专用硬件只需要很小的额外硬件资源:N3IC的NetFPGA实现增加的内存资源和逻辑资源与标准网卡设计相比增加不到2%,这使实时网络断层扫描成为可能。

 
posted @ 2022-04-28 21:44  求知求至  阅读(96)  评论(0)    收藏  举报