CUDA npp运动检测模块性能测试

测试环境:

Cpu:       Intel(R)Core(TM)i7-4790 CPU @3.6GHZ

GPU:        NVIDIA GeForce GTX960 *2  

操作系统:   Windows 7 专业版 64位操作系统

内存:        安装内存(RAM)      16.0GB

显存:        4g*2

 

       测试指标

   测试项目

单帧耗mean500P

 GPU占用率

显存占用

UnitM

Cpu占用率

内存占用

UnitM

1080p

1 路

9.23ms

 98% / 0%

 237 / 0

0%

263

1080p

2 路

 9.05ms

98% / 98%

 237 / 237

0-1%

528

1080p

4 路

 18ms

99% / 99%

 389 / 389

0-1%

528

1080p

8 路

 35.5ms

 99% / 99%

 702 / 702

0-1%

529

1080p

16路

 72.5ms

99% / 99%

 1325 / 1325

0-1%

520

1080p

24路

109.5ms

99% / 99%

 2339 /2339

0-1%

522

720p

1 路

4.27ms

96% / 0%

 153/0

0%

263

720p

2 路

 4.2ms

 96% / 96%

153/153

0%

528

720p

4 路

 8ms

 99%/99%

 225/225

0-1%

515

720p

8 路

 16ms

99%/99%

 370/370

0-1%

519

720p

16路

 32ms

99%/99%

 661/661

0-1%

520

720p

32路

 65ms

99%/99%

 1243/1243

0-1%

523

4cif

1 路

2.1ms

 90%-90%

121 / 0

0-1%

341

4cif

2 路

2ms

 91% / 91%

 121 / 121

0-1%

518

4cif

4 路

3.5ms

 99% / 99%

 162 / 162

0-1%

519

4cif

8 路

7ms

 99% / 99%

 244 / 244

0-1%

519

4cif

16路

14ms

 99% / 99%

 408 / 408

0-1%

521

4cif

32路

28.5ms

 96% / 96%

 737 / 737

0-1%

524

4cif

64路

102ms

55% / 55%

 1394 / 1394

0-1%

529

   注: 1. 上述测试的每一路对应主机程序的一个线程。

         2. 上述的所有测试不考虑主机和内存之间的数据拷贝,单纯的测试GPU的计算能力

            所以cpu基本处于空闲状态。

 

    分析:1. 随着主机线程数目的增多,线程之间的调度时间延时会导致GPU占用率下降

             2. 比较此前测试的GTX760显卡, GTX960的计算能力略弱,但多线程能力稍强。

posted @ 2015-08-07 16:30  书侍  阅读(1644)  评论(0编辑  收藏  举报