摘要: 思路:有两个矩阵A,B。从0号进程读入A,B,并且对B做转置(转置算法不太好,这里做转置主要是为了一会计算方便可以提高CACHE的命中率,但不清楚是否以转置浪费的时间为代价是否合理),之后对A矩阵按照按块分割,发送到各个进程。这里调用了MPI_Scatter,因此矩阵大小要可以被进程数整除。然后对每... 阅读全文
posted @ 2015-08-10 14:05 SALTYX 阅读(1801) 评论(0) 推荐(0)