摘要: 一、概述 最近在试图进行cuda并行编程,目标是编写一段矩阵计算代码,将计算结果存储进入GPU的缓冲区当中,并在达到某些要求后强制刷新缓冲区,取得计算结果。 但是考虑时间紧任务重的状况和实际的性能要求,决定使用cublas进行矩阵计算。 本篇文章试图记录我在进行cublas实验时得出的一些结论和一些 阅读全文
posted @ 2019-02-22 16:56 六花的邪王真眼 阅读(725) 评论(0) 推荐(0) 编辑