香橙派rk3588的rknn零拷贝接口性能测试

rknn输入输出零拷贝接口测试

输入视频 1080P@30  4路逐帧检测

 

非零拷贝

cpu 19.2+24.8+21.9+10.7+24.5+19.5+31+33.3=184.9%

mem 3.99GB

应用程序

cpu 161%

mem 472MB

 

 

仅输入零拷贝

cpu 16.5+5.3+8.2+4+22.3+21.2+36.1+18.5=132.1%

mem 4.3GB

应用程序

cpu 94.6%

mem 684MB

 

 

仅输出零拷贝

cpu 35.2+26+23.7+22.1+35.3+27.5+32.9+37.1=239.8%

mem 4GB

应用程序

cpu 204

mem 209MB

 

 

输入输出都零拷贝

cpu 16.5+5.3+8.2+4+22.3+21.2+36.1+18.5=132.1%

mem 4.3GB

应用程序

cpu 94.6

mem 684MB

 

 

下面是用AI对数据总结

以下是对 RKNN 输入输出零拷贝接口测试数据的总结分析,基于 4 路 1080P@30fps 视频逐帧检测场景的 CPU 占用率和内存占用数据:

 

一、核心指标对比

 

配置类型

CPU 占用率(%)

系统内存(GB)

应用程序 CPU 占用率(%)

应用程序内存(MB)

非零拷贝

184.9(8 核累加)

3.99

161

472

仅输入零拷贝

132.1(↓28.5%)

4.3(↑7.8%)

94.6(↓41.2%)

684(↑44.9%)

仅输出零拷贝

239.8(↑29.7%)

4.0(↓0.9%)

204(↑26.7%)

209(↓55.7%)

输入输出都零拷贝

132.1(↓28.5%)

4.3(↑7.8%)

94.6(↓41.2%)

684(↑44.9%)

 

二、关键结论

    1.CPU 优化效果

  • 输入零拷贝是核心优化点:仅启用输入零拷贝时,CPU 总占用184.9%降132.1%,应用程序 CPU 占用161%腰斩94.6%
  • 仅启用输出零拷贝时,CPU 占用不降反升(达 239.8%),可能因输出处理逻辑未充分优化。​

    2.内存占用特性

  • 零拷贝模式内存占用略高于非零拷贝(约 0.3 GB 增幅),但应用程序内存分配更集中(如输入零拷贝模式下应用程序占用 684 MB,高于非零拷贝的 472 MB)。​

    3.最优配置

  • 输入输出均启用零拷贝时,CPU 和内存表现与仅输入零拷贝一致,说明输出零拷贝在当前测试中未带来额外收益,可优先聚焦输入侧优化。
posted @ 2025-06-08 14:39  逸俊晨晖  阅读(383)  评论(1)    收藏  举报