随笔分类 -  CUDA

CUDA学习之二:shared_memory使用,矩阵相乘
摘要:CUDA中使用shared_memory可以加速运算,在矩阵乘法中是一个体现。矩阵C = A * B,正常运算时我们运用 C[i,j] = A[i,:] * B[:,j] 可以计算出结果。但是在CPU上完成这个运算我们需要大量的时间,设A[m,n],B[n,k],那么C矩阵为m*k,总体,我们需要做... 阅读全文

posted @ 2015-03-20 21:48 冷豆东 阅读(6070) 评论(0) 推荐(0)

CUDA学习之一:二维矩阵加法
摘要:今天忙活了3个小时,竟然被一个苦恼的CUDA小例程给困住了,本来是参照Rachal zhang大神的CUDA学习笔记来一个模仿,结果却自己给自己糊里糊涂,最后还是弄明白了一些。 RZ大神对CUDA关于kernel,memory的介绍还是蛮清楚,看完决定写一个二维数组的加法。如果是C++里的加法... 阅读全文

posted @ 2015-03-19 01:38 冷豆东 阅读(6661) 评论(1) 推荐(0)

导航