香橙派rk3588的rknn零拷贝接口性能测试
rknn输入输出零拷贝接口测试
输入视频 1080P@30 4路逐帧检测
非零拷贝
总
cpu 19.2+24.8+21.9+10.7+24.5+19.5+31+33.3=184.9%
mem 3.99GB
应用程序
cpu 161%
mem 472MB

仅输入零拷贝
总
cpu 16.5+5.3+8.2+4+22.3+21.2+36.1+18.5=132.1%
mem 4.3GB
应用程序
cpu 94.6%
mem 684MB

仅输出零拷贝
总
cpu 35.2+26+23.7+22.1+35.3+27.5+32.9+37.1=239.8%
mem 4GB
应用程序
cpu 204
mem 209MB

输入输出都零拷贝
总
cpu 16.5+5.3+8.2+4+22.3+21.2+36.1+18.5=132.1%
mem 4.3GB
应用程序
cpu 94.6
mem 684MB

下面是用AI对数据总结
以下是对 RKNN 输入输出零拷贝接口测试数据的总结分析,基于 4 路 1080P@30fps 视频逐帧检测场景的 CPU 占用率和内存占用数据:
一、核心指标对比
|
配置类型 |
总 CPU 占用率(%) |
系统内存(GB) |
应用程序 CPU 占用率(%) |
应用程序内存(MB) |
|
非零拷贝 |
184.9(8 核累加) |
3.99 |
161 |
472 |
|
仅输入零拷贝 |
132.1(↓28.5%) |
4.3(↑7.8%) |
94.6(↓41.2%) |
684(↑44.9%) |
|
仅输出零拷贝 |
239.8(↑29.7%) |
4.0(↓0.9%) |
204(↑26.7%) |
209(↓55.7%) |
|
输入输出都零拷贝 |
132.1(↓28.5%) |
4.3(↑7.8%) |
94.6(↓41.2%) |
684(↑44.9%) |
二、关键结论
1.CPU 优化效果:
- 输入零拷贝是核心优化点:仅启用输入零拷贝时,CPU 总占用从184.9%降至132.1%,应用程序 CPU 占用从161%腰斩至94.6%。
- 仅启用输出零拷贝时,CPU 占用不降反升(达 239.8%),可能因输出处理逻辑未充分优化。
2.内存占用特性:
- 零拷贝模式内存占用略高于非零拷贝(约 0.3 GB 增幅),但应用程序内存分配更集中(如输入零拷贝模式下应用程序占用 684 MB,高于非零拷贝的 472 MB)。
3.最优配置:
- 输入输出均启用零拷贝时,CPU 和内存表现与仅输入零拷贝一致,说明输出零拷贝在当前测试中未带来额外收益,可优先聚焦输入侧优化。

浙公网安备 33010602011771号