摘要:
在西雅图超级计算大会(SC11)上发布了新的基于指令的加速器并行编程标准,既OpenACC。这个开发标准的目的是让更多的编程人员可以用到GPU计算,同时计算结果可以跨加速器使用,甚至能用在多核CPU上。出于显而易见的原因,NVIDIA在大力推广和支持OpenACC。但事实上PGI和Cray才是最早推... 阅读全文
posted @ 2015-03-22 15:28
青竹居士
阅读(4299)
评论(0)
推荐(0)
摘要:
引言:什么是基于指令的移植方式呢?首先我这里说的移植可以理解为把原先在CPU上跑的程序放到像GPU一样的协处理器上跑的这个过程。在英文里可以叫Porting。移植有两种方式:一种是使用CUDA或者OpenCL来重新设计代码,然后使用硬件厂商提供的编译器来编译;一种是使用OpenACC或者OpenHM... 阅读全文
posted @ 2015-03-22 15:20
青竹居士
阅读(876)
评论(0)
推荐(0)
摘要:
一步步做程序优化【1】讲一个用于OpenACC优化的程序分析下A,B,C为三个矩阵,A为m*n维,B为n*k维,C为m*k维,用A和B来计算C,计算方法是:C = alpha*A*B + beta*C。它的程序如下: 1 // C = alpha*A*B + beta*C 2 void mySgem... 阅读全文
posted @ 2015-03-22 15:12
青竹居士
阅读(933)
评论(0)
推荐(0)

浙公网安备 33010602011771号