摘要: 在西雅图超级计算大会(SC11)上发布了新的基于指令的加速器并行编程标准,既OpenACC。这个开发标准的目的是让更多的编程人员可以用到GPU计算,同时计算结果可以跨加速器使用,甚至能用在多核CPU上。出于显而易见的原因,NVIDIA在大力推广和支持OpenACC。但事实上PGI和Cray才是最早推... 阅读全文
posted @ 2015-03-22 15:28 青竹居士 阅读(4299) 评论(0) 推荐(0)
摘要: 引言:什么是基于指令的移植方式呢?首先我这里说的移植可以理解为把原先在CPU上跑的程序放到像GPU一样的协处理器上跑的这个过程。在英文里可以叫Porting。移植有两种方式:一种是使用CUDA或者OpenCL来重新设计代码,然后使用硬件厂商提供的编译器来编译;一种是使用OpenACC或者OpenHM... 阅读全文
posted @ 2015-03-22 15:20 青竹居士 阅读(876) 评论(0) 推荐(0)
摘要: 一步步做程序优化【1】讲一个用于OpenACC优化的程序分析下A,B,C为三个矩阵,A为m*n维,B为n*k维,C为m*k维,用A和B来计算C,计算方法是:C = alpha*A*B + beta*C。它的程序如下: 1 // C = alpha*A*B + beta*C 2 void mySgem... 阅读全文
posted @ 2015-03-22 15:12 青竹居士 阅读(933) 评论(0) 推荐(0)