2015 年 1月 2 日随笔档案 - 青竹居士

2015年1月2日

摘要：原文链接CUDA存储器类型：每个线程拥有自己的register and loacal memory;每个线程块拥有一块shared memory;所有线程都可以访问global memory;还有，可以被所有线程访问的只读存储器：constant memory and texture memory1... 阅读全文

posted @ 2015-01-02 21:27 青竹居士阅读(252) 评论(0) 推荐(0)

CUDA线性内存分配

摘要：原文链接概述：线性存储器可以通过cudaMalloc()、cudaMallocPitch()和cudaMalloc3D()分配1、1D线性内存分配1 cudaMalloc(void**,int) //在设备端分配内存2 cudaMemcpy(void* dest,void* source,in... 阅读全文

posted @ 2015-01-02 21:26 青竹居士阅读(431) 评论(0) 推荐(0)

CUDA数组分配

摘要：原问链接概述：数组分配可以通过cudaMallocArray()和cudaMalloc3DArray()1、cudaMallocArray()cudaError_t cudaMallocArray ( struct cudaArray ** array, const str... 阅读全文

posted @ 2015-01-02 21:24 青竹居士阅读(1058) 评论(0) 推荐(0)

CUDA内存拷贝

摘要：原文链接1、cudaMemcpy() cudaMalloc() //线性内存拷贝1 //线性内存拷贝2 cudaMalloc((void**)&dev_A, data_size);3 cudaMemcpy(dev_A, host_A, data_size, cudaMemcpyHostToDevic... 阅读全文

posted @ 2015-01-02 21:23 青竹居士阅读(1834) 评论(0) 推荐(0)

CUDA 纹理内存

摘要：原文链接1、概述纹理存储器中的数据以一维、二维或者三维数组的形式存储在显存中，可以通过缓存加速访问，并且可以声明大小比常数存储器要大的多。在kernel中访问纹理存储器的操作称为纹理拾取(texture fetching)。将显存中的数据与纹理参照系关联的操作，称为将数据与纹理绑定(text... 阅读全文

posted @ 2015-01-02 21:20 青竹居士阅读(1447) 评论(0) 推荐(0)

CUDA三维数组

摘要： http://hpcbbs.it168.com/forum.php?mod=viewthread&tid=1643根据上面链接的帖子研究了下三维数组，就像他自己说的一样是有问题的，我自己修改了下，结果终于正确了。大家有兴趣的可以对照着看看。整个过程关键参考了这篇文章http://www.xuebuy... 阅读全文

posted @ 2015-01-02 21:11 青竹居士阅读(2106) 评论(0) 推荐(0)

cutil.h问题

摘要： CUDA5.0没有cutil.h头文件，貌似用helper_cuda.h文件代替，暂时没出问题。阅读全文

posted @ 2015-01-02 20:50 青竹居士阅读(537) 评论(0) 推荐(0)

GPU和CPU耗时统计方法

摘要： GPU端耗时统计 1 cudaEvent_t start, stop; 2 checkCudaErrors(cudaEventCreate(&start)); 3 checkCudaErrors(cudaEventCreate(&stop)); 4 checkCuda... 阅读全文

posted @ 2015-01-02 17:06 青竹居士阅读(2095) 评论(0) 推荐(0)

青竹居士

记录学习生活点滴

公告